Main Content

분류 학습기

머신러닝 지도 학습을 사용하여 데이터를 분류하도록 모델 훈련시키기

설명

분류 학습기 앱은 데이터를 분류하도록 모델을 훈련시킵니다. 이 앱을 사용하면 다양한 분류기를 사용하여 머신러닝 지도 학습을 수행해 볼 수 있습니다. 데이터를 탐색하고, 특징을 선택하고, 검증 방식을 지정하고, 모델을 훈련시키고, 결과를 평가할 수 있습니다. 자동화된 훈련을 수행하여 결정 트리, 판별분석, 서포트 벡터 머신, 로지스틱 회귀, 최근접이웃, 나이브 베이즈, 커널 근삿값, 앙상블 및 신경망 분류 등 최적의 분류 모델 유형을 검색할 수 있습니다.

알려진 입력 데이터 세트(관측값 또는 예제)와 이 데이터에 대해 알려진 응답 변수(레이블 또는 클래스)를 제공하여 머신러닝 지도 학습을 수행할 수 있습니다. 데이터를 사용하여 새 데이터에 대한 응답 변수의 예측값을 생성하는 모델을 훈련시킵니다. 새 데이터에 이 모델을 사용하거나 프로그래밍 방식으로 분류하는 방법에 대해 자세히 알아보려면, 모델을 작업 공간으로 내보내거나 MATLAB® 코드를 생성하여 훈련된 모델을 재생성하십시오.

시작하려면 분류기 목록에서 모든 빠른 훈련을 사용하여 엄선된 모델로 훈련시켜 보십시오. 자동화된 분류기 훈련 항목을 참조하십시오.

필요한 제품

  • MATLAB

  • Statistics and Machine Learning Toolbox™

Classification Learner app

분류 학습기 앱 열기

  • MATLAB 툴스트립: 탭의 머신러닝에서 앱 아이콘을 클릭합니다.

  • MATLAB 명령 프롬프트: classificationLearner를 입력합니다.

프로그래밍 방식으로 사용

모두 확장

classificationLearner는 분류 학습기 앱을 열거나, 이미 열려 있는 경우 이 앱으로 포커스를 이동합니다.

classificationLearner(Tbl,ResponseVarName)은 분류 학습기 앱을 열고 "인수에서 새 세션" 대화 상자에 Tbl 테이블에 포함된 데이터를 채웁니다. 문자형 벡터 또는 string형 스칼라로 지정된 ResponseVarName 인수는 클래스 레이블을 포함하는 Tbl의 응답 변수 이름입니다. 응답 변수는 500개가 넘는 고유한 클래스 레이블을 포함할 수 없습니다. Tbl의 나머지 변수는 예측 변수입니다.

classificationLearner(Tbl,Y)는 분류 학습기 앱을 열고 "인수에서 새 세션" 대화 상자에 Tbl 테이블의 예측 변수와 벡터 Y의 클래스 레이블을 채웁니다. 응답 변수 Y를 categorical형 배열, 문자형 배열, string형 배열, 논리형 벡터, 숫자형 벡터 또는 문자형 벡터로 구성된 셀형 배열로 지정할 수 있습니다. Y는 500개가 넘는 고유한 클래스 레이블을 포함할 수 없습니다.

classificationLearner(X,Y)는 분류 학습기 앱을 열고 "인수에서 새 세션" 대화 상자에 n×p 예측 변수 행렬 X 및 벡터 Y의 n 클래스 레이블을 채웁니다. X의 각 행은 하나의 관측값에 대응되고, 각 열은 하나의 변수에 대응됩니다. Y의 길이와 X의 행 개수는 동일해야 합니다. Y는 500개가 넘는 고유한 클래스 레이블을 포함할 수 없습니다.

classificationLearner(___,Name,Value)는 위에 열거된 구문에 나와 있는 입력 인수 조합과 함께 다음 이름-값 인수 중 하나 이상을 사용하여 교차 검증 옵션을 지정합니다. 예를 들어, "KFold",10을 지정하여 10겹 교차 검증 체계를 사용할 수 있습니다.

  • "CrossVal"은 교차 검증 플래그로, "on"(디폴트 값) 또는 "off"로 지정됩니다. "on"을 지정하면 앱이 5겹 교차 검증을 사용합니다. "off"를 지정하면 앱이 재대입 검증을 사용합니다.

    "Holdout" 또는 "KFold" 이름-값 인수를 사용하여 "CrossVal" 교차 검증 설정을 재정의할 수 있습니다. 이러한 인수는 한 번에 하나만 지정할 수 있습니다.

  • "Holdout"은 [0.05,0.5] 범위의 숫자형 스칼라로 지정되며 홀드아웃 검증에 사용되는 데이터의 비율입니다. 나머지 데이터는 훈련(및 지정된 경우 검정)에 사용됩니다.

  • "KFold"는 [2,50] 범위의 양의 정수로 지정되며 교차 검증에 사용할 겹의 개수입니다.

  • "TestDataFraction"은 [0,0.5] 범위의 숫자형 스칼라로 지정되며 검정에 사용하도록 예약된 데이터의 비율입니다.

classificationLearner(filename)filename에 저장되어 있는 세션을 분류 학습기 앱으로 엽니다. filename 인수는 문자형 벡터 또는 string형 스칼라로 지정되며 분류 학습기 세션 파일의 이름과 파일의 경로(이 파일이 현재 폴더에 있지 않은 경우)를 포함해야 합니다. 이 파일의 확장자는 .mat여야 합니다.

제한 사항

  • 분류 학습기는 MATLAB Online™에서 MATLAB Production Server™로 모델을 배포하는 것을 지원하지 않습니다.

버전 내역

R2015a에 개발됨