이 페이지의 최신 내용은 아직 번역되지 않았습니다. 최신 내용은 영문으로 볼 수 있습니다.

분류 학습기 앱에서 분류 모델을 훈련시키기

분류 학습기를 사용하여 결정 트리, 판별분석, 서포트 벡터 머신, 로지스틱 회귀, 최근접이웃, 나이브 베이즈, 앙상블 분류와 같은 분류기 모델을 훈련시킬 수 있습니다. 모델을 훈련시키는 것 외에도 데이터를 탐색하고, 특징을 선택하고, 검증 방식을 지정하고, 결과를 평가할 수 있습니다. 모델을 작업 공간으로 내보내어 새 데이터에 이 모델을 사용하거나 MATLAB® 코드를 생성하여 프로그래밍 방식으로 분류하는 방법에 대해 자세히 알아볼 수 있습니다.

분류 학습기에서 모델을 훈련시키는 작업은 아래 두 부분으로 나뉩니다.

  • 검증된 모델: 검증 방식을 사용하여 모델을 훈련시킵니다. 기본적으로, 이 앱은 교차 검증을 적용하여 과적합을 방지합니다. 또는 홀드아웃 검증을 선택할 수도 있습니다. 검증된 모델은 앱에서 볼 수 있습니다.

  • 전체 모델: 검증 없이 전체 데이터에 대해 모델을 훈련시킵니다. 분류 학습기 앱은 검증된 모델과 이 모델을 동시에 훈련시킵니다. 그러나 전체 데이터에 대해 훈련된 모델은 앱에서 볼 수 없습니다. 작업 공간으로 내보낼 분류기를 선택하면 분류 학습기는 전체 모델을 내보냅니다.

앱에는 검증된 모델의 결과가 표시됩니다. 모델 정확도와 같은 진단 측정값과 산점도 플롯이나 정오분류표 차트와 같은 플롯은 검증된 모델의 결과를 반영합니다. 몇몇 선별된 분류기나 모든 분류기를 자동으로 훈련시키고 검증 결과를 비교하여 분류 문제에 가장 적합한 모델을 선택할 수 있습니다. 작업 공간으로 내보낼 모델을 선택하면 분류 학습기는 전체 모델을 내보냅니다. 분류 학습기가 훈련 중에 전체 모델에 대한 모델 객체를 생성하므로 모델을 내보낼 때 지연 시간이 발생하지 않습니다. 내보낸 모델을 사용하여 새 데이터에 대해 예측을 수행할 수 있습니다.

우선 특정 모델 유형을 훈련시켜 보려면 자동화된 분류기 훈련 항목을 참조하십시오. 사용하려는 분류기 유형을 이미 알고 있다면, 위의 방법 대신 개별 분류기를 훈련시킬 수 있습니다. 수동 분류기 훈련 항목을 참조하십시오.

자동화된 분류기 훈련

분류 학습기를 사용하여 데이터에 대해 선별한 여러 분류 모델을 자동으로 훈련시킬 수 있습니다.

  • 우선, 한 번에 여러 모델을 자동으로 훈련시켜 봅니다. 몇몇 선별된 모델을 신속하게 시험 사용해 본 후 좋은 결과를 낸 모델을 대화형 방식으로 자세히 살펴볼 수 있습니다.

  • 원하는 분류기 유형을 이미 알고 있다면, 위의 방법 대신 개별 분류기를 훈련시키십시오. 수동 분류기 훈련 항목을 참조하십시오.

  1. 앱(Apps) 탭의 기계 학습(Machine Learning) 그룹에서 분류 학습기(Classification Learner)를 클릭합니다.

  2. 새 세션(New Session)을 클릭하고 작업 공간이나 파일에서 데이터를 선택합니다. 응답 변수 및 예측 변수로 사용할 변수를 지정합니다. Select Data and Validation for Classification Problem 항목을 참조하십시오.

  3. 분류 학습기(Classification Learner) 탭의 모델 유형(Model Type) 섹션에서 모든 빠른 훈련( All Quick-To-Train)을 클릭합니다. 이 옵션은 준비된 데이터 세트에 사용할 수 있는 모델 사전 설정 중 빠르게 피팅할 수 있는 모든 사전 설정을 훈련시킵니다.

  4. 훈련(Training) 을 클릭합니다.

    참고

    Parallel Computing Toolbox™가 있는 경우 이 앱은 모델을 병렬로 훈련시킵니다. 병렬 분류기 훈련 항목을 참조하십시오.

    몇몇의 모델 유형이 내역 목록에 표시됩니다. 훈련이 완료되면 가장 높은 정확도 점수(%)가 상자에 강조 표시됩니다.

  5. 플롯에서 결과를 살펴보려면, 내역 목록에서 모델을 클릭하십시오.

    후속 단계는 수동 분류기 훈련 항목 또는 분류 모델을 비교하고 향상시키기 항목을 참조하십시오.

  6. 데이터 세트에 사용할 수 있는 모든 분류기 모델 사전 설정을 시험 사용해 보려면 모두(All)를 클릭한 후 훈련(Training)을 클릭하십시오.

수동 분류기 훈련

개별적으로 모델 유형을 살펴보려는 경우나 원하는 분류기 유형을 이미 알고 있는 경우, 한 번에 하나씩 분류기를 훈련시키거나 동일 유형의 분류기 그룹을 훈련시킬 수 있습니다.

  1. 분류기를 선택합니다. 분류 학습기(Classification Learner) 탭의 모델 유형(Model Type) 섹션에서 분류기 유형을 클릭합니다. 사용 가능한 분류기 옵션을 모두 보려면 모델 유형(Model Type) 섹션의 맨 오른쪽에 있는 화살표를 클릭하여 분류기 목록을 확장하십시오. 모델 유형(Model Type) 갤러리의 옵션은 다양한 분류 문제에 적합한 각기 다른 설정의 시작점이 미리 설정되어 있습니다.

    각 분류기에 대한 설명을 보려면 세부 정보 보기로 전환하십시오.

    각 옵션에 대한 자세한 내용은 Choose Classifier Options 항목을 참조하십시오.

  2. 분류기를 선택했으면 훈련(Training) 을 클릭합니다.

    이러한 단계를 반복하여 여러 다른 분류기를 사용해 보십시오.

    먼저, 결정 트리와 판별분석을 사용해 보십시오. 모델이 응답 변수를 예측하기에 충분히 정확하지 않을 경우 유연성이 더 높은 다른 분류기를 사용해 보십시오. 과적합을 방지하려면 충분한 수준의 정확도를 제공하는 유연성이 더 낮은 모델을 고려하십시오.

  3. 모든 모델 유형을 사용해 보거나 동일한 유형의 모델 그룹을 훈련시키기로 결정한 경우 모델 유형(Model Type) 갤러리의 모두(All) 옵션 중 하나를 사용해 보십시오.

다음 단계는 분류 모델을 비교하고 향상시키기 항목을 참조하십시오.

병렬 분류기 훈련

Parallel Computing Toolbox가 있는 경우 분류 학습기를 사용하여 병렬로 여러 모델을 훈련시킬 수 있습니다. 디폴트 병렬 기본 설정인 Automatically create a parallel pool을 비활성화하지 않는 한, 분류기를 훈련시킬 때 분류 학습기는 워커의 병렬 풀을 자동으로 시작합니다. 풀이 이미 열려 있는 경우 앱은 이 풀을 훈련에 사용합니다. 병렬 훈련을 통해 한 번에 여러 분류기를 훈련시키고 작업을 계속할 수 있습니다.

  1. 훈련(Training)을 처음 클릭하면 앱이 워커의 병렬 풀을 열 때 대화 상자가 표시됩니다. 풀이 열리고 나면 여러 분류기를 한 번에 훈련시킬 수 있습니다.

  2. 분류기가 병렬로 훈련을 수행하는 동안 사용자는 내역 목록에서 각 훈련에 대한 진행률 표시기와 대기 중인 모델을 볼 수 있으며 원하는 경우 개별 모델을 취소할 수도 있습니다. 훈련하는 도중에 모델의 결과와 플롯을 검토할 수 있으며 더 많은 분류기에 대한 훈련을 시작할 수 있습니다.

병렬 훈련 여부를 제어하려면 앱의 툴스트립에서 병렬 연산(Use Parallel) 버튼을 전환하십시오. 병렬 연산(Use Parallel) 버튼은 Parallel Computing Toolbox가 있는 경우에만 사용할 수 있습니다.

Parallel Computing Toolbox가 있는 경우 분류 학습기에서 병렬 훈련을 사용할 수 있으며, 이 경우 statset 함수의 UseParallel 옵션을 설정할 필요가 없습니다. 병렬 기본 설정인 자동으로 병렬 풀 만들기(Automatically create a parallel pool)를 비활성화하면 앱에서 풀을 만들 것인지 묻는 메시지가 표시됩니다.

분류 모델을 비교하고 향상시키기

  1. 플롯에서 결과를 살펴보려면, 내역 목록에서 모델을 클릭하십시오. 산점도 플롯과 정오분류표에서 결과를 검사하여 모델 성능을 비교합니다. 내역 목록에서 각 모델에 대해 보고된 정확도(%)를 검토합니다. Assess Classifier Performance in Classification Learner 항목을 참조하십시오.

  2. 내역 목록에서 가장 적합한 모델을 선택한 후 모델에 여러 특징을 포함시키거나 제외시켜 봅니다. 특징 선택을 클릭합니다.

    제거할 특징을 파악하는 데 도움을 받으려면 평행좌표 플롯을 사용해 보십시오. 예측 검정력이 낮은 특징을 제거하여 모델을 향상시킬 수 있는지 보십시오. 모델에 포함시킬 예측 변수를 지정하고 새 옵션을 사용하여 새 모델을 훈련시킵니다. 내역 목록에서 모델 간 결과를 비교합니다.

    차원 수를 줄이기 위해 PCA를 사용하여 특징을 변환해 볼 수도 있습니다.

    Feature Selection and Feature Transformation Using Classification Learner App 항목을 참조하십시오.

  3. 모델을 추가로 향상시키기 위해 고급 대화 상자에서 분류기의 파라미터 설정을 변경해 본 후 새 옵션을 사용하여 훈련을 수행할 수 있습니다. 모델 유연성을 제어하는 방법을 알아보려면 Choose Classifier Options 항목을 참조하십시오.

  4. 특징 선택, PCA 또는 새 파라미터 설정을 통해 모델이 향상된다면 모두(All)를 선택하여 모든 모델 유형을 새 설정으로 훈련시켜 보십시오. 이 새 설정으로 성능이 나아진 또 다른 모델 유형이 있는지 확인합니다.

과적합을 방지하려면 충분한 수준의 정확도를 제공하는 유연성이 더 낮은 모델을 고려하십시오. 예를 들어, 결정 트리 및 판별분석 같이 빠르고 쉽게 해석할 수 있는 단순한 모델을 찾아보십시오. 모델이 응답 변수를 예측하기에 충분히 정확하지 않을 경우, 앙상블과 같은 유연성이 더 높은 다른 분류기를 선택하십시오. 모델 유연성에 대해 자세히 알아보려면 Choose Classifier Options 항목을 참조하십시오.

다음 그림에서는 다양한 분류기 유형을 포함하는 내역 목록이 표시된 앱을 보여줍니다.

여러 분류기를 비교하는 단계별 예제는 Train Decision Trees Using Classification Learner App 항목을 참조하십시오.

이후 단계를 위해, 다른 데이터로 모델을 훈련시키도록 코드를 생성하거나, 새 데이터를 사용하여 예측을 수행할 수 있도록 훈련된 모델을 작업 공간으로 내보내십시오. Export Classification Model to Predict New Data 항목을 참조하십시오.

관련 항목