Main Content

결정 트리

결정 트리(분류 트리 및 회귀 트리)는 데이터에 대한 응답 변수를 예측합니다. 응답 변수를 예측하려면 루트(시작) 노드에서 리프 노드까지 트리의 결정을 따르십시오. 리프 노드에는 응답 변수가 포함되어 있습니다. 분류 트리는 'true' 또는 'false'와 같은 명목형 응답 변수를 제공합니다. 회귀 트리는 숫자형 응답 변수를 제공합니다.

Statistics and Machine Learning Toolbox™ 트리는 이진입니다. 예측의 각 단계에는 예측 변수 한 개의 값을 확인하는 작업이 포함됩니다. 예를 들어, 다음은 단순한 분류 트리입니다.

Simple classification tree

이 트리는 두 개의 예측 변수 x1x2를 기반으로 하여 분류를 예측합니다. 삼각형(Δ)으로 나타낸 최상위 노드에서 시작하여 예측을 수행하십시오. 첫 번째 결정 사항은 x10.5보다 작은지 여부입니다. 작을 경우, 왼쪽 가지를 따라가 트리가 데이터를 유형 0으로 분류함을 확인합니다.

그러나 x10.5를 초과할 경우 오른쪽 가지를 따라가 오른쪽 아래 삼각형 노드로 진행합니다. 여기서 트리는 x20.5보다 작은지 여부를 묻습니다. 작을 경우, 왼쪽 가지를 따라가 트리가 데이터를 유형 0으로 분류함을 확인합니다. 그렇지 않을 경우, 오른쪽 가지를 따라가 트리가 데이터를 유형 1로 분류함을 확인합니다.

결정 트리를 사용하여 분류 또는 회귀에 사용할 데이터를 준비하는 방법을 알아보려면 지도 학습의 단계 항목을 참조하십시오.

분류 트리 훈련시키기

이 예제에서는 분류 트리를 훈련시키는 방법을 보여줍니다.

전체 ionosphere 데이터 세트를 사용하여 분류 트리를 생성합니다.

load ionosphere % Contains X and Y variables
Mdl = fitctree(X,Y)
Mdl = 
  ClassificationTree
             ResponseName: 'Y'
    CategoricalPredictors: []
               ClassNames: {'b'  'g'}
           ScoreTransform: 'none'
          NumObservations: 351


회귀 트리 훈련시키기

이 예제에서는 회귀 트리를 훈련시키는 방법을 보여줍니다.

carsmall 데이터 세트에 포함된 모든 관측값을 사용하여 회귀 트리를 생성합니다. Horsepower 벡터와 Weight 벡터를 예측 변수로, MPG 벡터를 응답 변수로 간주합니다.

load carsmall % Contains Horsepower, Weight, MPG
X = [Horsepower Weight];

Mdl = fitrtree(X,MPG)
Mdl = 
  RegressionTree
             ResponseName: 'Y'
    CategoricalPredictors: []
        ResponseTransform: 'none'
          NumObservations: 94


참고 문헌

[1] Breiman, L., J. H. Friedman, R. A. Olshen, and C. J. Stone. Classification and Regression Trees. Boca Raton, FL: Chapman & Hall, 1984.

참고 항목

| | |

관련 항목