여기서는 중위수median로 결측치를 대체하는 방법 3을 적용하며, 이를 위해 사이킷런의 SimpleImputer 변환기를 이용한다.
강의 자료에서 결측치를 SimpleImputer 변환기를 이용해 중위수로 대체한 것을 확인했습니다.
SimpleImputer는 전처리 과정에서 결측값을 평균, 중위수, 최빈값 등의 방식으로 처리할 수 있다는 점을 알았습니다.
이때 결측치를 어떤 방식으로 처리하느냐에 따라 모델 성능이 달라질 수 있다고 생각했습니다. SimpleImputer 변환기를 사용할때 평균, 중위수, 최빈값 중 어떤 값을 선택해 결측치를 대체할지 판단하는 기준은 무엇인지 궁금합니다.