이 페이지의 최신 내용은 아직 번역되지 않았습니다. 최신 내용은 영문으로 볼 수 있습니다.

Statistics and Machine Learning Toolbox

Analyze and model data using statistics and machine learning

Statistics and Machine Learning Toolbox™는 데이터를 기술, 분석, 모델링하는 함수와 앱을 제공합니다. 탐색적 데이터 분석을 위해 기술 통계량과 플롯을 사용하고, 데이터에 확률 분포를 피팅하고, 몬테카를로(Monte Carlo) 시뮬레이션에 사용할 난수를 생성하고, 가설검정을 수행할 수 있습니다. 회귀 알고리즘과 분류 알고리즘을 사용하여 데이터를 바탕으로 추론하고 예측 모델을 생성할 수 있습니다.

다차원 데이터 분석을 위해 Statistics and Machine Learning Toolbox는 특징 선택, 단계적 회귀, 주성분 분석(PCA, Principal Component Analysis), 정규화, 그리고 모델에 영향을 미치는 변수나 특징을 식별하는 데 사용할 수 있는 그 밖의 차원 축소 방법을 제공합니다.

이 툴박스는 서포트 벡터 머신(SVM), 부스팅 결정 트리 및 배깅 결정 트리, k-최근접이웃, k-평균, k-중앙개체, 계층적 군집화, 가우스 혼합 모델, 은닉 마르코프 모델(Hidden Markov Model)을 포함하여 지도 기계 학습 알고리즘과 비지도 기계 학습 알고리즘을 제공합니다. 메모리에 저장하기에 너무 큰 데이터 세트를 대상으로 많은 통계 알고리즘과 기계 학습 알고리즘을 사용할 수 있습니다.

Statistics and Machine Learning Toolbox 시작하기

Statistics and Machine Learning Toolbox의 기본 사항 배우기

기술 통계량 및 시각화

데이터 가져오기와 내보내기, 기술 통계량, 시각화

확률 분포

데이터 빈도 모델, 임의 표본 생성, 모수 추정

가설검정

t-검정, F-검정, 카이제곱 적합도 검정 등

군집 분석

데이터에서 자연적 그룹화와 패턴을 찾는 비지도 학습 기법

분산분석(ANOVA)

분산분석과 공분산 분석, 다변량분산분석, 반복 측정 분산분석

회귀

지도 학습용 선형, 일반화 선형, 비선형, 비모수적 기법

분류

이진 문제와 다중클래스 문제를 위한 지도 학습 알고리즘

차원 축소 및 특징 추출

PCA, 요인 분석, 특징 선택, 특징 추출 등

산업 통계

실험계획법(DOE), 생존 및 신뢰도 분석, 통계적 공정관리

tall형 배열을 사용한 빅 데이터 분석

메모리에 담을 수 없는 큰 데이터 분석

통계 계산 속도 개선

통계 함수의 병렬 계산 또는 분산 계산

코드 생성

Statistics and Machine Learning Toolbox 함수에 대한 C/C++ 코드 및 MEX 함수 생성