Deep-Learning 용어정리 (모델 평가와 검증)

2024. 11. 1. 15:31·용어정리/Deep-Learning

모델 평가와 검증에 대해서 알아보자


교차검증

교차검증 Cross-Validation 이란 모델의 일반화 성능을 평가하기 위해서 데이터를 여러번

나누어 학습과 검증을 반복하는 방법이다.

 

아래의 이미지와 같이 데이터셋을 나눠서 교차로 검증을 해보는 것이다.

 

 

 

이를 통하여 모델이 과적합 되지 않고, 새로운 데이터에 대해 잘 일반화되는지 평가하는데 유용하다.

 

특정 데이터셋에 과적합되지 않도록 도와주며, 데이터를 최대한 활용해서 새롭게 학습하기 때문에 데이터의

효율을 높일 수 있다.

 

 

이는 새롭게 기존 모델의 성능을 올리는 것이 아닌,

여러번의 테스트로 가장 일반화가 잘 되어있고, 성능이 좋은 결과를 선택하는 것이다. 

그렇게 결과적으로는 성능이 올랐다 라고 볼 수도 있다.

 


K-Fold 교차 검증의 원리

데이터를 일정한 크기의 K개의 폴드로 나눈다.

이후 위와 같은 그림 처럼 1개의 테스트용 폴드를 제외하고는 학습을 시키는데,

이때 반복할때 테스트용 폴드는 겹치지 않게 학습을 시킨다.

 

그렇게 되면 K번의 학습과 검증을 반복하면서 각각의 결과를 비교 평균을 내어서 모델의 성능을 평가하게 된다.

 

 

 

 


 

 

 

저작자표시 비영리 변경금지 (새창열림)

'용어정리 > Deep-Learning' 카테고리의 다른 글

Deep-Learning 용어정리 (Pytorch 문법)  (0) 2024.11.01
Deep-Learning 용어정리 (하이퍼파라미터 튜닝)  (0) 2024.11.01
Deep-Learning 용어정리 (과적합 방지 기법)  (0) 2024.10.31
Deep-Learning 용어정리 (전이학습)  (2) 2024.10.31
Deep-Learning 용어정리 (생성형 모델)  (0) 2024.10.31
'용어정리/Deep-Learning' 카테고리의 다른 글
  • Deep-Learning 용어정리 (Pytorch 문법)
  • Deep-Learning 용어정리 (하이퍼파라미터 튜닝)
  • Deep-Learning 용어정리 (과적합 방지 기법)
  • Deep-Learning 용어정리 (전이학습)
코드 유랑자 승열
코드 유랑자 승열
코드 유랑자 승열의 프로그래밍 일지를 남기는 공간입니다.
  • 코드 유랑자 승열
    승열의 프로그래밍 시네마
    코드 유랑자 승열
  • 전체
    오늘
    어제
  • 링크

    • 깃허브 보러가기
    • 링크드인 보러가기
    • 인스타그램 보러가기
    • 카테고리
      • 코딩테스트
        • BaekJoon
      • TIL and WIL
        • TIL
        • WIL
      • 주말스터디
      • 내일배움캠프
        • 사전캠프 강의 (SQL)
      • 용어정리
        • Python
        • Python-Library
        • Machine-Learning
        • Deep-Learning
        • AI 활용
        • LLM & RAG
        • Docker
        • Django
        • SQL
        • Java Script
        • etc
      • Daily 코드카타
        • SQL
        • Python 알고리즘
      • 임시저장
      • 보류
  • 태그

    llm
    오블완
    티스토리챌린지
    RAG
    django
    View
    vector db
    template
    word2vec
    langchain
  • 인기 글

  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.1
코드 유랑자 승열
Deep-Learning 용어정리 (모델 평가와 검증)
상단으로

티스토리툴바