(김*영) (강의노트 2장) RMSE 수치와 과대 적합

회귀 모델의 성능 평가에서 계산되는 RMSE는 수치가 0에 가까울 수록 예측 성능이 좋은 것이라고 강의 노트에서 학습했습니다.

이후 강의 노트 내용에서 선형 회귀 모델, 결정트리 회귀 모델, 랜덤 포레스트 회귀 모델의 각각 훈련 결과를 살펴본 결과, 훈련셋 RMSE가 정확하게 0이 나온 결정트리 회귀 모델이 평가 내용을 읽기 전에는 가장 효과적이라고 판단했습니다. 그러나 *0인 경우는 심각한 과대 적합의 경우*임을 알게 되고, 이후 랜덤 포레스트 회귀 모델의 훈련셋 RMSE도 살펴보면서 이 값 역시 결정트리 회귀 모델보다는 덜하더라도 역시 과대 적합이 발생한다는 내용을 학습했습니다.

세 가지 모델의 RMSE와 과대 적합의 정도에 대해 살펴보면서
과대 적합이 어느 정도 발생해도 이를 감수하고 **예측 성능을 조금 더 높일 수 있는 모델의 사용**이 더 효과적일지, **과대 적합 최소화**가 우선이 되는 것이 좋을지 고민하게 되었습니다. 테스트셋에 따라서 다르게 모델을 선택하는 것일지, 더 많이 사용되고 있는 방법이 있을지 궁금합니다.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

(김*영) (강의노트 2장) RMSE 수치와 과대 적합 #59

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

(김*영) (강의노트 2장) RMSE 수치와 과대 적합 #59

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions