Machine-Learning 용어정리 (계층적 군집화)

2024. 10. 23. 20:46·용어정리/Machine-Learning

군집화모델

계층적 군집화에 대해서 알아보자


 

 

계층적 군집화

계층적 군집화란 데이터포인트를 계층구조를 따라서 그룹화 하는 방법이다.

 

이를 통해서 순차적으로 그룹화를 할 수 있다.

 

계층적 군집화에는 2가지의 방식이 있다.

 

  1. 병합 군집화
  2. 분할 군집화

 

사실 계층을 따라 가다보니 2개밖에 나올 수 가 없다.

 


 

 

병합 군집화

병합 군집화는 데이터 포인트 만큼의 군집이 있다는 뜻이다.

계층 별로 점점 가장 가까운 데이터 포인트 들이 묶이면서 최종적으로 1개의 군집이 되어가는 것 이다.

 

 


분할 군집화

분할 군집화는 병합 군집화와는 반대로, 1개의 군집에서 가장 가장자리에 있는 데이터 포인트들을 

분할시켜서 계층을 따라 분할을 시키며 결과적으로는 데이터 포인트 만큼의 군집이 생기는 과정이다.

 

이는 시간도 오래 걸릴 뿐더러, 요즘은 잘 사용되지 않는 방식이다.

 

 

 


 

실습

실습으로 덴드로그램 만들기, 계층적 군집화 모델 구현하기 및 모델의 평가하기를 만들어보았다.

 

Hierarchical_clusterting.ipynb - Colab

 

Hierarchical_clusterting.ipynb

Run, share, and edit Python notebooks

colab.research.google.com

 

 

 

여기서 다른 모델과의 차이점 몇가지가 있다.

 

 

  1. 평가 메서드가 silhouette_score이다
  2. metric 과 linkage가 필요하다
  3. 모델을 학습 시킬떄, fit_predict가 필요하다

 

끝

 

 

 

 

 

저작자표시 비영리 변경금지

'용어정리 > Machine-Learning' 카테고리의 다른 글

Machine-Learning 용어정리 (PCA)  (1) 2024.10.24
Machine-Learning 용어정리 (DBSCAN)  (0) 2024.10.23
Machine-Learning 용어정리 (K-means clustering)  (0) 2024.10.23
Machine-Learning 용어정리 (SVM, KNN, 나이브베이즈, 의사결정나무) ver 2  (1) 2024.10.23
Machine-Learning 용어정리 (데이터셋)  (3) 2024.10.22
'용어정리/Machine-Learning' 카테고리의 다른 글
  • Machine-Learning 용어정리 (PCA)
  • Machine-Learning 용어정리 (DBSCAN)
  • Machine-Learning 용어정리 (K-means clustering)
  • Machine-Learning 용어정리 (SVM, KNN, 나이브베이즈, 의사결정나무) ver 2
코드 유랑자 승열
코드 유랑자 승열
코드 유랑자 승열의 프로그래밍 일지를 남기는 공간입니다.
  • 코드 유랑자 승열
    승열의 프로그래밍 시네마
    코드 유랑자 승열
  • 전체
    오늘
    어제
  • 링크

    • 깃허브 보러가기
    • 링크드인 보러가기
    • 인스타그램 보러가기
    • 카테고리
      • 코딩테스트
        • BaekJoon
      • TIL and WIL
        • TIL
        • WIL
      • 주말스터디
      • 내일배움캠프
        • 사전캠프 강의 (SQL)
      • 용어정리
        • Python
        • Python-Library
        • Machine-Learning
        • Deep-Learning
        • AI 활용
        • LLM & RAG
        • Docker
        • Django
        • SQL
        • Java Script
        • etc
      • Daily 코드카타
        • SQL
        • Python 알고리즘
      • 임시저장
      • 보류
  • 태그

    티스토리챌린지
    vector db
    word2vec
    langchain
    오블완
    llm
    View
    template
    RAG
    django
  • 인기 글

  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.1
코드 유랑자 승열
Machine-Learning 용어정리 (계층적 군집화)
상단으로

티스토리툴바