Main Content

margin

분류 마진

구문

mar = margin(B,TBLnew,Ynew)
mar = margin(B,Xnew,Ynew)
mar = margin(B,TBLnew,Ynew,'param1',val1,'param2',val2,...)
mar = margin(B,Xnew,Ynew,'param1',val1,'param2',val2,...)

설명

mar = margin(B,TBLnew,Ynew)는 주어진 실제 응답 변수 Ynew에 대해 테이블 TBLnew에 포함된 예측 변수의 분류 마진을 계산합니다. TBLnew에 응답 변수가 포함된 경우 Ynew를 생략할 수 있습니다. 테이블에 포함된 표본 데이터를 사용하여 B를 훈련시켰다면 이 메서드의 입력 데이터도 테이블에 있어야 합니다.

mar = margin(B,Xnew,Ynew)는 주어진 실제 응답 변수 Ynew에 대해 행렬 Xnew에 포함된 예측 변수의 분류 마진을 계산합니다.

Ynew는 숫자형 벡터, 문자형 행렬, string형 배열, 문자형 벡터로 구성된 셀형 배열, categorical형 벡터 또는 논리형 벡터일 수 있습니다. mar은 크기가 Nobs×NTrees인 숫자형 배열로, 여기서 NobsTBLnewYnew의 행 개수이며 NTrees는 앙상블 B의 트리 개수입니다. 관측값 I와 트리 J에 대해 mar(I,J)는 실제 클래스의 점수와 다른 클래스들의 최대 점수의 차이입니다. 이 메서드는 분류 앙상블에만 사용할 수 있습니다.

mar = margin(B,TBLnew,Ynew,'param1',val1,'param2',val2,...) 또는 mar = margin(B,Xnew,Ynew,'param1',val1,'param2',val2,...)는 선택적 파라미터 이름-값 쌍을 지정합니다.

'Mode'메서드의 오차 계산 방식을 나타냅니다. 'cumulative'(디폴트 값)로 설정하면 margin은 누적된 오차를 계산하고 marNobs×NTrees 행렬이 됩니다. 여기서 첫 번째 열은 trees(1)의 오차를, 두 번째 열은 trees(1:2)의 오차를 제공하며 이런 방식으로 trees(1:NTrees)까지 오차를 제공합니다. 'individual'로 설정하면 marNobs×NTrees 행렬이 됩니다. 여기서 각 요소는 앙상블에 속한 각 트리의 오차입니다. 'ensemble'로 설정하면 mar은 길이 Nobs의 단일 열로, 전체 앙상블의 누적된 마진을 보여줍니다.
'Trees'이 계산에 포함할 트리를 나타내는 인덱스 벡터입니다. 기본적으로 이 인수는 'all'로 설정되고 이 메서드는 모든 트리를 사용합니다. 'Trees'가 숫자형 벡터인 경우 메서드는 'cumulative''individual' 모드일 때 길이 NTrees의 벡터를 반환하고(NTrees는 입력 벡터의 요소 개수), 'ensemble' 모드에서는 스칼라를 반환합니다. 예를 들어, 'cumulative' 모드에서 첫 번째 요소는 trees(1)의 오차를, 두 번째 요소는 trees(1:2)의 오차를 제공합니다.
'TreeWeights' 트리 가중치 벡터입니다. 이 벡터는 벡터 'Trees' 벡터와 길이가 같아야 합니다. 이 메서드는 가중치를 적용하지 않은 단순한 다수결 대신에 이 가중치를 사용하여 가중 평균을 취해서 지정된 트리로부터 출력값을 결합합니다. 'individual' 모드에서는 이 인수를 사용할 수 없습니다.
'UseInstanceForTree'각 관측값을 예측하는 데 사용해야 하는 트리를 표시하는 Nobs×NTrees 크기의 논리형 행렬입니다. 기본적으로 이 메서드는 모든 관측값에 대해 모든 트리를 사용합니다.

참고 항목