Skip to content

(권*희)(Kaggle 경진대회)상관관계가 높은 특성 #60

@d03020

Description

@d03020

이번 과제를 수행하며 데이터의 히트맵을 그려보았습니다. 확인 결과 OverallQual이나 GrLivArea 같이 집값과 상관관계가 뚜렷한 특성들을 파악할 수 있었습니다. 그래서 모델을 만들 때 이렇게 상관관계가 높은 특성들 위주로 선택하여 학습을 진행했는데, 실제 분석에서도 상관관계가 낮은 특성들은 제외하는 것이 일반적인지, 아니면 낮더라도 최대한 많은 데이터를 포함하는 것이 유리한지 궁금하여 질문드립니다.

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions