Skip to content

(박*원) Kaggle 경진대회 공백을 반영한 특성 추가 #52

@sawon-0418

Description

@sawon-0418
Image

GarageArea와 SalePrice의 산점도를 확인해보니 0~200 사이에 공백이 존재했습니다.
GPT에게 이유를 물어보니, 차고가 존재하는 경우에는 최소 면적이 약 200 정도이기 때문이라고 답을 들었습니다.
이를 확인해보기위해 코드를 통해 구해보니 200근처에는 차를 1대를 보유하고 있었습니다.

Image

이 공백을 모델이 학습할 수 있도록, 차고가 있을 때와 없을 때를 구분할 수 있는 HasGarage라는 0과1 값을 갖는 특성을 추가했습니다.

그런데 이렇게 추가적인 정보를 주는 특성을 추가하는 것이 모델 성능에 부정적인 영향을 끼치지는 않는지 궁금합니다.

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions