-
Notifications
You must be signed in to change notification settings - Fork 6
Open
Description
회귀 모델의 성능 평가에서 계산되는 RMSE는 수치가 0에 가까울 수록 예측 성능이 좋은 것이라고 강의 노트에서 학습했습니다.
이후 강의 노트 내용에서 선형 회귀 모델, 결정트리 회귀 모델, 랜덤 포레스트 회귀 모델의 각각 훈련 결과를 살펴본 결과, 훈련셋 RMSE가 정확하게 0이 나온 결정트리 회귀 모델이 평가 내용을 읽기 전에는 가장 효과적이라고 판단했습니다. 그러나 0인 경우는 심각한 과대 적합의 경우임을 알게 되고, 이후 랜덤 포레스트 회귀 모델의 훈련셋 RMSE도 살펴보면서 이 값 역시 결정트리 회귀 모델보다는 덜하더라도 역시 과대 적합이 발생한다는 내용을 학습했습니다.
세 가지 모델의 RMSE와 과대 적합의 정도에 대해 살펴보면서
과대 적합이 어느 정도 발생해도 이를 감수하고 예측 성능을 조금 더 높일 수 있는 모델의 사용이 더 효과적일지, 과대 적합 최소화가 우선이 되는 것이 좋을지 고민하게 되었습니다. 테스트셋에 따라서 다르게 모델을 선택하는 것일지, 더 많이 사용되고 있는 방법이 있을지 궁금합니다.
Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
No labels