Skip to content

(김*영) (강의노트 2장) RMSE 수치와 과대 적합 #59

@chae24hk

Description

@chae24hk

회귀 모델의 성능 평가에서 계산되는 RMSE는 수치가 0에 가까울 수록 예측 성능이 좋은 것이라고 강의 노트에서 학습했습니다.

이후 강의 노트 내용에서 선형 회귀 모델, 결정트리 회귀 모델, 랜덤 포레스트 회귀 모델의 각각 훈련 결과를 살펴본 결과, 훈련셋 RMSE가 정확하게 0이 나온 결정트리 회귀 모델이 평가 내용을 읽기 전에는 가장 효과적이라고 판단했습니다. 그러나 0인 경우는 심각한 과대 적합의 경우임을 알게 되고, 이후 랜덤 포레스트 회귀 모델의 훈련셋 RMSE도 살펴보면서 이 값 역시 결정트리 회귀 모델보다는 덜하더라도 역시 과대 적합이 발생한다는 내용을 학습했습니다.

세 가지 모델의 RMSE와 과대 적합의 정도에 대해 살펴보면서
과대 적합이 어느 정도 발생해도 이를 감수하고 예측 성능을 조금 더 높일 수 있는 모델의 사용이 더 효과적일지, 과대 적합 최소화가 우선이 되는 것이 좋을지 고민하게 되었습니다. 테스트셋에 따라서 다르게 모델을 선택하는 것일지, 더 많이 사용되고 있는 방법이 있을지 궁금합니다.

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions