이 번역 페이지는 최신 내용을 담고 있지 않습니다. 최신 내용을 영문으로 보려면 여기를 클릭하십시오.
군집 분석
데이터에서 자연적 그룹화와 패턴을 찾는 비지도 학습 기법
군집 분석(세분화 분석 또는 분류 분석이라고도 함)은 표본 데이터를 그룹 또는 군집으로 분할합니다. 동일한 군집에 포함된 객체는 유사하고 다른 군집에 포함된 객체는 다르도록 군집이 형성됩니다. Statistics and Machine Learning Toolbox™는 군집을 생성하기 위한 여러 가지 군집화 기법과 유사성 측정법(거리 측정법이라고도 함)을 제공합니다. 또한, 군집 평가는 다양한 평가 기준을 사용하여 데이터의 최적의 군집 수를 결정합니다. 군집 시각화 옵션에는 덴드로그램 플롯과 실루엣 플롯이 있습니다. 이 툴박스는 또한 이상값과 특이값을 식별할 수 있는 여러 이상 감지 기능을 제공합니다.
군집 분석 기본 사항
카테고리
- 계층적 군집화
중첩된 군집 세트 생성
- k-평균 군집화와 k-중앙개체 군집화
평균 또는 중앙개체 거리를 최소화하여 군집화, 마할라노비스 거리 계산
- 잡음이 있는 응용 사례의 밀도 기반 공간 군집화
DBSCAN 알고리즘을 사용하여 군집 및 이상값 찾기
- 스펙트럼 군집화
그래프 기반 알고리즘을 사용하여 군집 찾기
- 가우스 혼합 모델
기대값 최대화 알고리즘을 사용하여 가우스 혼합 모델을 기준으로 군집화
- 최근접이웃
완전 탐색 또는 Kd-트리 탐색을 사용하여 최근접이웃 찾기
- 은닉 마르코프 모델(Hidden Markov Model)
데이터 생성을 위한 마르코프 모델
- 이상 감지
이상값(outlier) 및 특이값(novelty) 감지
- 군집 시각화와 군집 평가
데이터에 대한 군집을 플로팅하고 최적의 군집 개수 평가