Main Content

margin

분류 마진

구문

mar = margin(B,TBLnew,Ynew)
mar = margin(B,Xnew,Ynew)
mar = margin(B,TBLnew,Ynew,'param1',val1,'param2',val2,...)
mar = margin(B,Xnew,Ynew,'param1',val1,'param2',val2,...)

설명

mar = margin(B,TBLnew,Ynew)는 주어진 실제 응답 변수 Ynew에 대해 테이블 TBLnew에 포함된 예측 변수의 분류 마진을 계산합니다. TBLnew에 응답 변수가 포함된 경우 Ynew를 생략할 수 있습니다. 테이블에 포함된 표본 데이터를 사용하여 B를 훈련시켰다면 이 메서드의 입력 데이터도 테이블에 있어야 합니다.

mar = margin(B,Xnew,Ynew)는 주어진 실제 응답 변수 Ynew에 대해 행렬 Xnew에 포함된 예측 변수의 분류 마진을 계산합니다. 행렬에 포함된 표본 데이터를 사용하여 B를 훈련시켰다면 이 메서드의 입력 데이터도 행렬에 있어야 합니다.

Ynew는 숫자형 벡터, 문자형 행렬, string형 배열, 문자형 벡터로 구성된 셀형 배열, categorical형 벡터 또는 논리형 벡터일 수 있습니다. mar은 크기가 Nobs×NTrees인 숫자형 배열로, 여기서 NobsTBLnewYnew의 행 개수이며 NTrees는 앙상블 B의 트리 개수입니다. 관측값 I와 트리 J에 대해 mar(I,J)는 실제 클래스의 점수와 다른 클래스들의 최대 점수의 차이입니다. 이 메서드는 분류 앙상블에만 사용할 수 있습니다.

mar = margin(B,TBLnew,Ynew,'param1',val1,'param2',val2,...) 또는 mar = margin(B,Xnew,Ynew,'param1',val1,'param2',val2,...)는 선택적 파라미터 이름-값 쌍을 지정합니다.

'Mode'메서드의 오차 계산 방식을 나타내는 문자형 벡터 또는 string형 스칼라입니다. 'cumulative'(디폴트 값)로 설정하면 margin은 누적된 오차를 계산하고 marNobs×NTrees 행렬이 됩니다. 여기서 첫 번째 열은 trees(1)의 오차를, 두 번째 열은 trees(1:2)의 오차를 제공하며 이런 방식으로 trees(1:NTrees)까지 오차를 제공합니다. 'individual'로 설정하면 marNobs×NTrees 행렬이 됩니다. 여기서 각 요소는 앙상블에 속한 각 트리의 오차입니다. 'ensemble'로 설정하면 mar은 길이 Nobs의 단일 열로, 전체 앙상블의 누적된 마진을 보여줍니다.
'Trees'이 계산에 포함할 트리를 나타내는 인덱스 벡터입니다. 기본적으로 이 인수는 'all'로 설정되고 이 메서드는 모든 트리를 사용합니다. 'Trees'가 숫자형 벡터인 경우 메서드는 'cumulative''individual' 모드일 때 길이 NTrees의 벡터를 반환하고(NTrees는 입력 벡터의 요소 개수), 'ensemble' 모드에서는 스칼라를 반환합니다. 예를 들어, 'cumulative' 모드에서 첫 번째 요소는 trees(1)의 오차를, 두 번째 요소는 trees(1:2)의 오차를 제공합니다.
'TreeWeights'트리 가중치 벡터입니다. 이 벡터는 벡터 'Trees' 벡터와 길이가 같아야 합니다. 이 메서드는 가중치를 적용하지 않은 단순한 다수결 대신에 이 가중치를 사용하여 가중 평균을 취해서 지정된 트리로부터 출력값을 결합합니다. 'individual' 모드에서는 이 인수를 사용할 수 없습니다.
'UseInstanceForTree'각 관측값을 예측하는 데 사용해야 하는 트리를 표시하는 Nobs×NTrees 크기의 논리형 행렬입니다. 기본적으로 이 메서드는 모든 관측값에 대해 모든 트리를 사용합니다.

참고 항목