군집화모델
계층적 군집화에 대해서 알아보자
계층적 군집화
계층적 군집화란 데이터포인트를 계층구조를 따라서 그룹화 하는 방법이다.
이를 통해서 순차적으로 그룹화를 할 수 있다.
계층적 군집화에는 2가지의 방식이 있다.
- 병합 군집화
- 분할 군집화
사실 계층을 따라 가다보니 2개밖에 나올 수 가 없다.
병합 군집화
병합 군집화는 데이터 포인트 만큼의 군집이 있다는 뜻이다.
계층 별로 점점 가장 가까운 데이터 포인트 들이 묶이면서 최종적으로 1개의 군집이 되어가는 것 이다.
분할 군집화
분할 군집화는 병합 군집화와는 반대로, 1개의 군집에서 가장 가장자리에 있는 데이터 포인트들을
분할시켜서 계층을 따라 분할을 시키며 결과적으로는 데이터 포인트 만큼의 군집이 생기는 과정이다.
이는 시간도 오래 걸릴 뿐더러, 요즘은 잘 사용되지 않는 방식이다.
실습
실습으로 덴드로그램 만들기, 계층적 군집화 모델 구현하기 및 모델의 평가하기를 만들어보았다.
Hierarchical_clusterting.ipynb - Colab
Hierarchical_clusterting.ipynb
Run, share, and edit Python notebooks
colab.research.google.com
여기서 다른 모델과의 차이점 몇가지가 있다.
- 평가 메서드가 silhouette_score이다
- metric 과 linkage가 필요하다
- 모델을 학습 시킬떄, fit_predict가 필요하다
끝
'용어정리 > Machine-Learning' 카테고리의 다른 글
Machine-Learning 용어정리 (PCA) (1) | 2024.10.24 |
---|---|
Machine-Learning 용어정리 (DBSCAN) (0) | 2024.10.23 |
Machine-Learning 용어정리 (K-means clustering) (0) | 2024.10.23 |
Machine-Learning 용어정리 (SVM, KNN, 나이브베이즈, 의사결정나무) ver 2 (1) | 2024.10.23 |
Machine-Learning 용어정리 (데이터셋) (3) | 2024.10.22 |