군집 분석과 이상 감지
데이터에서 자연적 그룹화, 패턴, 이상을 찾는 비지도 학습 기법
군집 분석(세분화 분석 또는 분류 분석이라고도 함)은 표본 데이터를 그룹 또는 군집으로 분할합니다. 동일한 군집에 포함된 객체는 유사하고 다른 군집에 포함된 객체는 다르도록 군집이 형성됩니다. Statistics and Machine Learning Toolbox™는 군집을 생성하기 위한 여러 가지 군집화 기법과 유사성 측정법(거리 측정법이라고도 함)을 제공합니다. 또한, 군집 평가는 다양한 평가 기준을 사용하여 데이터의 최적의 군집 수를 결정합니다. 군집 시각화 옵션에는 덴드로그램 플롯과 실루엣 플롯이 있습니다.
이상 감지는 표본 데이터에서 예상 패턴 또는 분포를 벗어난 관측값을 식별하는 머신러닝의 한 부문입니다. Statistics and Machine Learning Toolbox는 이상값 감지 및 특이값 감지를 위한 여러 가지 기법(Unsupervised Anomaly Detection 항목 참조)과 스트리밍 데이터에서 이상을 감지하기 위한 추가 방법(Incremental Anomaly Detection Overview 항목 참조)을 제공합니다.
군집 분석 기본 사항
카테고리
- 계층적 군집화
중첩된 군집 세트 생성
- k-평균 군집화와 k-중앙개체 군집화
평균 또는 중앙개체 거리를 최소화하여 군집화, 마할라노비스 거리 계산
- 잡음이 있는 응용 사례의 밀도 기반 공간 군집화
DBSCAN 알고리즘을 사용하여 군집 및 이상값 찾기
- 스펙트럼 군집화
그래프 기반 알고리즘을 사용하여 군집 찾기
- 가우스 혼합 모델
기대값 최대화 알고리즘을 사용하여 가우스 혼합 모델을 기준으로 군집화
- 최근접이웃
완전 탐색 또는 Kd-트리 탐색을 사용하여 최근접이웃 찾기
- 은닉 마르코프 모델(Hidden Markov Model)
데이터 생성을 위한 마르코프 모델
- 이상 감지
이상값(outlier) 및 특이값(novelty) 감지
- 군집 시각화와 군집 평가
데이터에 대한 군집을 플로팅하고 최적의 군집 개수 평가
- Python 모델 동시 실행
Simulink에서 예측을 위해 Python 머신러닝 모델 불러오기 및 동시 실행