회귀 학습기 앱에서 회귀 모델 훈련시키기

회귀 학습기를 사용하여 선형 회귀 모델, 회귀 트리, 가우스 과정 회귀 모델, 서포트 벡터 머신, 커널 근사, 회귀 트리 앙상블, 신경망 회귀 모델을 포함하는 회귀 모델을 훈련시킬 수 있습니다. 모델을 훈련시키는 것 외에도 데이터를 탐색하고, 특징을 선택하고, 검증 방식을 지정하고, 결과를 평가할 수 있습니다. 모델을 작업 공간으로 내보내어 새 데이터에 이 모델을 사용하거나 MATLAB^® 코드를 생성하여 프로그래밍 방식으로 회귀하는 방법에 대해 자세히 알아볼 수 있습니다.

회귀 학습기에서 모델을 훈련시키는 작업은 아래 두 부분으로 나뉩니다.

검증 모델: 검증 방식을 사용하여 모델을 훈련시킵니다. 기본적으로, 이 앱은 교차 검증을 적용하여 과적합을 방지합니다. 또는 홀드아웃 검증을 선택할 수도 있습니다.
전체 모델: 검정 데이터를 제외한 전체 데이터에 대해 모델을 훈련시킵니다. 이 앱은 검증된 모델과 이 모델을 동시에 훈련시킵니다. 작업 공간으로 내보낼 회귀 모델을 선택하면 회귀 학습기는 전체 모델을 내보냅니다.

참고

이 앱은 모델 훈련을 위해 테스트 데이터를 사용하지 않습니다. 앱에서 내보낸 모델은 검정을 위해 예약된 데이터를 제외하고 전체 데이터에 대해 훈련됩니다.

모델을 훈련시킨 후에는 앱에 검증 모델의 결과가 표시됩니다. 모델 정확도와 같은 진단 측정값과 응답 플롯 또는 잔차 플롯과 같은 플롯은 검증 모델의 결과를 반영합니다. 하나 이상의 회귀 모델을 자동으로 훈련시키고 검증 결과를 비교하여 회귀 문제에 가장 적합한 모델을 선택할 수 있습니다. 테스트 세트를 사용하기로 선택하면 앱은 전체 모델을 사용하여 테스트 세트 메트릭을 계산합니다.

작업 공간으로 내보낼 모델을 선택하면 회귀 학습기는 전체 모델을 내보냅니다. 회귀 학습기가 훈련 중에 전체 모델에 대한 모델 객체를 생성하므로 모델을 내보낼 때 지연 시간이 발생하지 않습니다. 내보낸 모델을 사용하여 새 데이터에 대해 예측을 수행할 수 있습니다.

우선 특정 모델 유형을 훈련시켜 보려면 자동화된 회귀 모델 훈련 항목을 참조하십시오. 훈련시키려는 회귀 모델을 이미 알고 있다면, 수동 회귀 모델 훈련 항목을 참조하십시오.

자동화된 회귀 모델 훈련

회귀 학습기를 사용하여 데이터에 대해 선별한 여러 회귀 모델을 자동으로 훈련시킬 수 있습니다.

우선, 동시에 여러 모델을 자동으로 훈련시켜 봅니다. 몇몇 선별된 모델을 신속하게 시험 사용해 본 후 좋은 결과를 낸 모델을 대화형 방식으로 자세히 살펴볼 수 있습니다.
원하는 모델 유형을 이미 알고 있다면, 위의 방법 대신 개별 모델을 훈련시킬 수 있습니다. 수동 회귀 모델 훈련 항목을 참조하십시오.

앱 탭에 있는 머신러닝 및 딥러닝 그룹에서 회귀 학습기를 클릭하여 회귀 학습기 앱을 엽니다.
학습 탭에 있는 파일 섹션에서 새 세션을 클릭하고 작업 공간 또는 파일에서 데이터를 선택합니다. 응답 변수 및 예측 변수로 사용할 변수를 지정합니다. 또는, 열기를 클릭하여 이전에 저장된 앱 세션을 엽니다. 회귀를 위한 데이터를 선택하거나 저장한 앱 세션 열기 항목을 참조하십시오.
모델 섹션에서 모든 빠른 훈련을 선택합니다. 이 옵션은 빠르게 피팅할 수 있는 모든 사전 설정을 훈련시킵니다.
훈련 섹션에서 모두 훈련을 클릭한 다음 모두 훈련을 선택합니다.
참고
Parallel Computing Toolbox™가 있는 경우, 앱은 기본적으로 모델을 병렬로 훈련시킵니다. 병렬 회귀 모델 훈련 항목을 참조하십시오.
몇몇 모델 유형이 모델 창에 표시됩니다. 모델이 훈련을 마치면 가장 높은 RMSE(검증) 점수가 상자에 요약됩니다.
모델 창에서 모델을 클릭하고 대응되는 플롯을 열어 결과를 살펴봅니다.
후속 단계는 수동 회귀 모델 훈련 항목 또는 회귀 모델을 비교하고 향상시키기 항목을 참조하십시오.
사용할 수 있는 모든 최적화 불가능 모델의 사전 설정을 시도해 보려면 학습 탭의 모델 섹션에서 모두를 클릭합니다.
훈련 섹션에서 모두 훈련을 클릭하고 선택 항목 훈련을 선택합니다.

수동 회귀 모델 훈련

개별적으로 모델 유형을 살펴보려는 경우 한 번에 하나씩 모델을 훈련시키거나 그룹으로 훈련시킬 수 있습니다

모델 유형을 선택합니다. 학습 탭의 모델 섹션에서 모델 유형을 클릭합니다. 사용할 수 있는 모든 모델 옵션을 보려면 모델 섹션에서 화살표를 클릭하여 회귀 모델 목록을 확장합니다. 갤러리에 있는 최적화 불가능 모델 옵션들에는 각기 다른 설정을 가진 시작점이 미리 설정되어 있어서 다양한 회귀 문제에 사용하기 적합합니다.
모델에 대한 설명을 보려면 세부 정보 보기로 전환하십시오.

각 옵션에 대한 자세한 내용은 Choose Regression Model Options 항목을 참조하십시오.
모델을 선택했으면 모델을 훈련시킬 수 있습니다. 훈련 섹션에서 모두 훈련을 클릭하고 선택 항목 훈련을 선택합니다. 과정을 반복하여 여러 다른 모델을 살펴보십시오.
또는, 훈련 전 상태의 모델을 여러 개 만든 다음 이 모델들을 그룹으로 훈련시킬 수 있습니다. 훈련 섹션에서 모두 훈련을 클릭한 다음 모두 훈련을 선택합니다.
팁
먼저 회귀 트리를 선택하십시오. 훈련된 모델이 응답 변수를 예측하기에 충분히 정확하지 않을 경우 유연성이 더 높은 다른 모델을 사용해 보십시오. 과적합을 방지하려면 충분한 수준의 정확도를 제공하는 덜 유연한 모델을 고려하십시오.
동일한 모델 유형으로 혹은 또다른 모델 유형으로 최적화 불가능 모델을 모두 훈련시켜 보려면 모델 갤러리에서 모두 옵션 중 하나를 선택하십시오.
또는 특정 모델 유형의 하이퍼파라미터를 자동으로 조율하려면, 해당하는 최적화 가능 모델을 선택하고 하이퍼파라미터 최적화를 수행하십시오. 자세한 내용은 Hyperparameter Optimization in Regression Learner App 항목을 참조하십시오.

다음 단계는 회귀 모델을 비교하고 향상시키기 항목을 참조하십시오.

병렬 회귀 모델 훈련

Parallel Computing Toolbox가 있는 경우 회귀 학습기를 사용하여 병렬로 여러 모델을 훈련시킬 수 있습니다. 병렬 훈련을 통해 동시에 여러 모델을 훈련시키고 작업을 계속할 수 있습니다.

병렬 훈련을 제어하려면 학습 탭의 훈련 섹션에서 병렬 연산 버튼을 토글하십시오. 훈련 전 상태의 모델을 병렬로 훈련시키려면 모두 훈련을 클릭하기 전에 모두 훈련 버튼이 선택되어 있는지 확인하십시오. 병렬 연산 버튼은 Parallel Computing Toolbox가 있는 경우에만 사용할 수 있습니다.

Use Parallel button in the Train section

병렬 연산 버튼은 기본적으로 켜져 있습니다. 모두 훈련을 처음 클릭한 후 모두 훈련 또는 선택 항목 훈련을 선택하면 앱이 워커의 병렬 풀을 열 때 대화 상자가 표시됩니다. 풀이 열리고 나면 여러 모델을 한 번에 훈련시킬 수 있습니다.

모델이 병렬로 훈련을 수행하는 동안 모델 창에 각 훈련에 대한 진행률 표시기와 대기 중인 모델이 나타납니다. 원하는 경우 개별 모델을 취소할 수 있습니다. 훈련하는 도중에 모델의 결과와 플롯을 검토할 수 있으며 더 많은 모델에 대한 훈련을 시작할 수 있습니다.

Parallel Computing Toolbox가 있는 경우 회귀 학습기에서 최적화 불가능 모델에 대해 병렬 훈련을 사용할 수 있으며, 이 경우 statset 함수의 UseParallel 옵션을 설정할 필요가 없습니다.

참고

Parallel Computing Toolbox가 없더라도, 모델 훈련 중에 앱의 반응성을 유지할 수 있습니다. 훈련 전 상태의 모델을 훈련시키기 전에 학습 탭의 훈련 섹션에서 모두 훈련을 클릭하고 백그라운드 훈련 사용 체크박스가 선택되었는지 확인하십시오. 그런 다음 모두 훈련 옵션을 선택합니다. 앱이 백그라운드 풀을 열 때 대화 상자가 표시됩니다. 풀이 열리고 나면 모델이 백그라운드에서 훈련하는 동안 계속해서 앱을 대화형으로 조작할 수 있습니다.

회귀 모델을 비교하고 향상시키기

앱에서 여러 다른 특징을 사용하여, 훈련된 회귀 모델을 비교하고 향상시킬 수 있습니다.

각 모델에 대해 모델 창에 보고된 RMSE(검증) 점수를 검토합니다. 학습 탭의 플롯 및 결과 섹션에서 결과 비교를 클릭합니다. 데이터 플로팅 아래에 있는 X 목록에 표시할 메트릭을 선택합니다.
모델 창에서 모델을 클릭하고 대응되는 플롯을 열어 결과를 살펴봅니다. 플롯에서 결과를 검사하여 모델 성능을 비교합니다. 플롯의 레이아웃을 재배열하여 여러 모델 간에 결과를 비교할 수 있습니다. 레이아웃 버튼을 클릭하면 나타나는 옵션을 사용하거나 플롯을 끌어서 놓거나 모델 플롯 탭의 오른쪽에 있는 문서 동작 버튼을 클릭하면 제공되는 옵션을 선택하십시오.
또한, 모델 창에서 정렬 기준 옵션을 사용하여 모델을 비교할 수 있습니다. 모델을 선택하고 창의 오른쪽 위에 있는 선택한 모델을 삭제합니다 버튼을 클릭하거나 모델을 마우스 오른쪽 버튼으로 클릭하고 삭제를 선택하여 원하지 않는 모델을 삭제합니다.
회귀 학습기의 모델 성능 시각화 및 평가하기 항목을 참조하십시오.
모델 창에서 가장 적합한 모델을 선택한 후 모델에 여러 특징을 포함시키거나 제외시켜 봅니다.
먼저, 모델의 복사본을 만듭니다. 모델을 마우스 오른쪽 버튼으로 클릭하고 복제를 선택합니다.
그런 다음 학습 탭의 옵션 섹션에서 특징 선택을 클릭합니다. 사용 가능한 특징 순위 알고리즘을 사용하여 특징을 선택합니다.
제거할 특징을 파악하는 데 도움을 받으려면 응답 플롯을 사용해 보십시오. 예측 검정력이 낮은 특징을 제거하여 모델을 향상시킬 수 있는지 보십시오. 모델에 포함시킬 예측 변수를 지정하고 새 옵션을 사용하여 새 모델을 훈련시킵니다. 모델 창에서 모델 간 결과를 비교합니다.
차원 수를 줄이기 위해 PCA를 사용하여 특징을 변환해 볼 수도 있습니다. 학습 탭의 옵션 섹션에서 PCA를 클릭합니다.
회귀 학습기 앱을 사용한 특징 선택과 특징 변환 항목을 참조하십시오.
모델을 추가로 향상시키기 위해 모델을 복제하고 모델 요약 탭의 모델 하이퍼파라미터 섹션에서 하이퍼파라미터 옵션을 변경한 다음, 새 옵션을 사용하여 모델을 훈련시킬 수 있습니다. 모델 유연성을 제어하는 방법을 알아보려면 Choose Regression Model Options 항목을 참조하십시오. 모델 하이퍼파라미터를 자동으로 조율하는 방법에 대한 내용은 Hyperparameter Optimization in Regression Learner App 항목을 참조하십시오.
특징 선택, PCA 또는 새 하이퍼파라미터 값을 통해 모델이 향상된다면 모두를 선택하여 모든 모델 유형을 새 설정으로 훈련시켜 보십시오. 이 새 설정으로 성능이 나아진 또 다른 모델 유형이 있는지 확인합니다.

팁

과적합을 방지하려면 충분한 수준의 정확도를 제공하는 덜 유연한 모델을 고려하십시오. 예를 들어, 회귀 트리 같이 빠르고 쉽게 해석할 수 있는 단순한 모델을 찾아보십시오. 모델이 충분히 정확하지 않을 경우 앙상블과 같이 유연성이 더 높은 다른 모델을 사용해 보십시오. 모델 유연성에 대해 자세히 알아보려면 Choose Regression Model Options 항목을 참조하십시오.

다음 그림에서는 다양한 회귀 모델 유형을 포함하는 모델 창이 표시된 앱을 보여줍니다.

Regression Learner app with trained models in the Models pane

여러 회귀 모델을 비교하는 단계별 예제는 Train Regression Trees Using Regression Learner App 항목을 참조하십시오.

다음으로, 다른 데이터로 모델을 훈련시키도록 코드를 생성하거나, 새 데이터를 사용하여 예측을 수행할 수 있도록 훈련된 모델을 작업 공간으로 내보낼 수 있습니다. Export Regression Model to Predict New Data 항목을 참조하십시오.