Main Content

Statistics and Machine Learning Toolbox

통계와 머신러닝을 사용하여 데이터 분석 및 모델링

Statistics and Machine Learning Toolbox™는 데이터를 기술, 분석, 모델링하는 함수와 앱을 제공합니다. 탐색적 데이터 분석을 위해 기술 통계량, 시각화 및 군집을 사용하고, 데이터에 확률 분포를 피팅하고, 몬테카를로(Monte Carlo) 시뮬레이션에 사용할 난수를 생성하고, 가설검정을 수행할 수 있습니다. 회귀 알고리즘과 분류 알고리즘을 사용하여 데이터를 바탕으로 추론하고, 분류 학습기 앱과 회귀 학습기 앱을 사용하여 대화형 방식으로 또는 AutoML을 사용하여 프로그래밍 방식으로 예측 모델을 생성할 수 있습니다.

다차원 데이터 분석과 특징 추출을 위해 주성분 분석(PCA), 정규화, 차원 축소 및 특징 선택 방법을 제공하여 최적의 예측 검정력을 가진 변수를 식별할 수 있습니다.

서포트 벡터 머신(SVM), 부스팅 결정 트리, k-평균 및 기타 군집화 방법을 포함하여 머신러닝 지도 학습, 준지도 학습 및 비지도 학습 알고리즘을 제공합니다. 부분 종속성 플롯 및 LIME과 같은 해석 가능성 기법을 적용하고, 임베디드 배포를 위한 C/C++ 코드를 자동으로 생성할 수 있습니다. 메모리에 저장하기에 너무 큰 데이터 세트를 대상으로 이 툴박스의 많은 알고리즘을 사용할 수 있습니다.

Statistics and Machine Learning Toolbox 시작하기

Statistics and Machine Learning Toolbox의 기본 사항 배우기

기술 통계량 및 시각화

데이터 가져오기와 내보내기, 기술 통계량, 시각화

확률 분포

데이터 도수 모델, 임의 표본 생성, 모수 추정

가설검정

t-검정, F-검정, 카이제곱 적합도 검정 등

군집 분석과 이상 감지

데이터에서 자연적 그룹화, 패턴, 이상을 찾는 비지도 학습 기법

분산분석(ANOVA)

분산분석과 공분산 분석, 다변량분산분석, 반복 측정 분산분석

회귀

지도 학습용 선형, 일반화 선형, 비선형, 비모수적 기법

분류

이진 문제와 다중클래스 문제를 위한 지도 학습 및 준지도 학습 알고리즘

차원 축소 및 특징 추출

PCA, 인자 분석, 특징 선택, 특징 추출 등

산업 통계

실험계획법(DOE), 생존 및 신뢰도 분석, 통계적 공정관리

tall형 배열을 사용한 빅데이터 분석

메모리에 담을 수 없는 큰 데이터 분석

통계 계산 속도 개선

통계 함수의 병렬 계산 또는 분산 계산

코드 생성

Statistics and Machine Learning Toolbox 함수에 대한 C/C++ 코드 및 MEX 함수 생성

통계 및 머신러닝 응용 사례

산업별 워크플로에 통계 및 머신러닝 방법 적용