GarageArea와 SalePrice의 산점도를 확인해보니 0~200 사이에 공백이 존재했습니다.
GPT에게 이유를 물어보니, 차고가 존재하는 경우에는 최소 면적이 약 200 정도이기 때문이라고 답을 들었습니다.
이를 확인해보기위해 코드를 통해 구해보니 200근처에는 차를 1대를 보유하고 있었습니다.
이 공백을 모델이 학습할 수 있도록, 차고가 있을 때와 없을 때를 구분할 수 있는 HasGarage라는 0과1 값을 갖는 특성을 추가했습니다.
그런데 이렇게 추가적인 정보를 주는 특성을 추가하는 것이 모델 성능에 부정적인 영향을 끼치지는 않는지 궁금합니다.