모델 평가와 검증에 대해서 알아보자
교차검증
교차검증 Cross-Validation 이란 모델의 일반화 성능을 평가하기 위해서 데이터를 여러번
나누어 학습과 검증을 반복하는 방법이다.
아래의 이미지와 같이 데이터셋을 나눠서 교차로 검증을 해보는 것이다.
이를 통하여 모델이 과적합 되지 않고, 새로운 데이터에 대해 잘 일반화되는지 평가하는데 유용하다.
특정 데이터셋에 과적합되지 않도록 도와주며, 데이터를 최대한 활용해서 새롭게 학습하기 때문에 데이터의
효율을 높일 수 있다.
이는 새롭게 기존 모델의 성능을 올리는 것이 아닌,
여러번의 테스트로 가장 일반화가 잘 되어있고, 성능이 좋은 결과를 선택하는 것이다.
그렇게 결과적으로는 성능이 올랐다 라고 볼 수도 있다.
K-Fold 교차 검증의 원리
데이터를 일정한 크기의 K개의 폴드로 나눈다.
이후 위와 같은 그림 처럼 1개의 테스트용 폴드를 제외하고는 학습을 시키는데,
이때 반복할때 테스트용 폴드는 겹치지 않게 학습을 시킨다.
그렇게 되면 K번의 학습과 검증을 반복하면서 각각의 결과를 비교 평균을 내어서 모델의 성능을 평가하게 된다.
'용어정리 > Deep-Learning' 카테고리의 다른 글
Deep-Learning 용어정리 (Pytorch 문법) (0) | 2024.11.01 |
---|---|
Deep-Learning 용어정리 (하이퍼파라미터 튜닝) (0) | 2024.11.01 |
Deep-Learning 용어정리 (과적합 방지 기법) (0) | 2024.10.31 |
Deep-Learning 용어정리 (전이학습) (2) | 2024.10.31 |
Deep-Learning 용어정리 (생성형 모델) (0) | 2024.10.31 |