이 번역 페이지는 최신 내용을 담고 있지 않습니다. 최신 내용을 영문으로 보려면 여기를 클릭하십시오.

군집 분석과 이상 감지

데이터에서 자연적 그룹화, 패턴, 이상을 찾는 비지도 학습 기법

군집 분석(세분화 분석 또는 분류 분석이라고도 함)은 표본 데이터를 그룹 또는 군집으로 분할합니다. 동일한 군집에 포함된 객체는 유사하고 다른 군집에 포함된 객체는 다르도록 군집이 형성됩니다. Statistics and Machine Learning Toolbox™는 군집을 생성하기 위한 여러 가지 군집화 기법과 유사성 측정법(거리 측정법이라고도 함)을 제공합니다. 또한, 군집 평가는 다양한 평가 기준을 사용하여 데이터의 최적의 군집 수를 결정합니다. 군집 시각화 옵션에는 덴드로그램 플롯과 실루엣 플롯이 있습니다.

이상 감지는 표본 데이터에서 예상 패턴 또는 분포를 벗어난 관측값을 식별하는 머신러닝의 한 부문입니다. Statistics and Machine Learning Toolbox는 이상값 감지 및 특이값 감지를 위한 여러 가지 기법(Unsupervised Anomaly Detection 항목 참조)과 스트리밍 데이터에서 이상을 감지하기 위한 추가 방법(Incremental Anomaly Detection Overview 항목 참조)을 제공합니다.

군집 분석 기본 사항

Choose Cluster Analysis Method

Click to go to the example, Cluster Gaussian Mixture Data Using Hard Clustering

카테고리

계층적 군집화
중첩된 군집 세트 생성
k-평균 군집화와 k-중앙개체 군집화
평균 또는 중앙개체 거리를 최소화하여 군집화, 마할라노비스 거리 계산
잡음이 있는 응용 사례의 밀도 기반 공간 군집화
DBSCAN 알고리즘을 사용하여 군집 및 이상값 찾기
스펙트럼 군집화
그래프 기반 알고리즘을 사용하여 군집 찾기
가우스 혼합 모델
기대값 최대화 알고리즘을 사용하여 가우스 혼합 모델을 기준으로 군집화
최근접이웃
완전 탐색 또는 Kd-트리 탐색을 사용하여 최근접이웃 찾기
은닉 마르코프 모델(Hidden Markov Model)
데이터 생성을 위한 마르코프 모델
이상 감지
이상값(outlier) 및 특이값(novelty) 감지
군집 시각화와 군집 평가
데이터에 대한 군집을 플로팅하고 최적의 군집 개수 평가
Python 모델 연동실행
Simulink에서 예측을 위해 Python 머신러닝 모델 불러오기 및 연동실행

관련 정보

Machine Learning Methods: Clustering (MathWorks Teaching Resources)

추천 예제

군집 분석

군집 분석

이 예제에서는 Statistics and Machine Learning Toolbox™에서 군집 분석을 사용하여 관측값 또는 객체의 유사성과 비유사성을 검토하는 방법을 보여줍니다. 데이터는 대개 기본적으로 관측값의 그룹(또는 군집)에 속하며, 동일한 군집에 속하는 객체의 특성은 유사하고 서로 다른 군집에 속하는 객체의 특성은 서로 다릅니다.

스크립트 열기

Code Generation for Anomaly Detection

Code Generation for Anomaly Detection

Generate single-precision code that detects anomalies in data using a trained isolation forest model or one-class SVM.

라이브 스크립트 열기