이 번역 페이지는 최신 내용을 담고 있지 않습니다. 최신 내용을 영문으로 보려면 여기를 클릭하십시오.
결정 트리
결정 트리(분류 트리 및 회귀 트리)는 데이터에 대한 응답 변수를 예측합니다. 응답 변수를 예측하려면 루트(시작) 노드에서 리프 노드까지 트리의 결정을 따르십시오. 리프 노드에는 응답 변수가 포함되어 있습니다. 분류 트리는 'true'
또는 'false'
와 같은 명목형 응답 변수를 제공합니다. 회귀 트리는 숫자형 응답 변수를 제공합니다.
Statistics and Machine Learning Toolbox™ 트리는 이진입니다. 예측의 각 단계에는 예측 변수 한 개의 값을 확인하는 작업이 포함됩니다. 예를 들어, 다음은 단순한 분류 트리입니다.
이 트리는 두 개의 예측 변수 x1
및 x2
를 기반으로 하여 분류를 예측합니다. 삼각형(Δ)으로 나타낸 최상위 노드에서 시작하여 예측을 수행하십시오. 첫 번째 결정 사항은 x1
이 0.5
보다 작은지 여부입니다. 작을 경우, 왼쪽 가지를 따라가 트리가 데이터를 유형 0
으로 분류함을 확인합니다.
그러나 x1
이 0.5
를 초과할 경우 오른쪽 가지를 따라가 오른쪽 아래 삼각형 노드로 진행합니다. 여기서 트리는 x2
가 0.5
보다 작은지 여부를 묻습니다. 작을 경우, 왼쪽 가지를 따라가 트리가 데이터를 유형 0
으로 분류함을 확인합니다. 그렇지 않을 경우, 오른쪽 가지를 따라가 트리가 데이터를 유형 1
로 분류함을 확인합니다.
결정 트리를 사용하여 분류 또는 회귀에 사용할 데이터를 준비하는 방법을 알아보려면 지도 학습의 단계 항목을 참조하십시오.
분류 트리 훈련시키기
이 예제에서는 분류 트리를 훈련시키는 방법을 보여줍니다.
전체 ionosphere
데이터 세트를 사용하여 분류 트리를 생성합니다.
load ionosphere % Contains X and Y variables Mdl = fitctree(X,Y)
Mdl = ClassificationTree ResponseName: 'Y' CategoricalPredictors: [] ClassNames: {'b' 'g'} ScoreTransform: 'none' NumObservations: 351 Properties, Methods
회귀 트리 훈련시키기
이 예제에서는 회귀 트리를 훈련시키는 방법을 보여줍니다.
carsmall
데이터 세트에 포함된 모든 관측값을 사용하여 회귀 트리를 생성합니다. Horsepower
벡터와 Weight
벡터를 예측 변수로, MPG
벡터를 응답 변수로 간주합니다.
load carsmall % Contains Horsepower, Weight, MPG X = [Horsepower Weight]; Mdl = fitrtree(X,MPG)
Mdl = RegressionTree ResponseName: 'Y' CategoricalPredictors: [] ResponseTransform: 'none' NumObservations: 94 Properties, Methods
참고 문헌
[1] Breiman, L., J. H. Friedman, R. A. Olshen, and C. J. Stone. Classification and Regression Trees. Boca Raton, FL: Chapman & Hall, 1984.
참고 항목
fitctree
| fitrtree
| ClassificationTree
| RegressionTree