ClassificationSVM

단일 클래스 및 이진 분류용 서포트 벡터 머신(SVM)

설명

ClassificationSVM은 단일 클래스 학습 및 2-클래스 학습에 사용할 수 있는 서포트 벡터 머신(SVM) 분류기입니다. 훈련된 ClassificationSVM 분류기는 훈련 데이터, 모수 값, 사전 확률, 서포트 벡터, 알고리즘 구현 정보를 저장합니다. 이러한 분류기를 사용하여 점수-사후 확률 변환 함수 피팅(fitPosterior 참조) 및 새 데이터에 대한 레이블 예측(predict 참조)과 같은 작업을 수행할 수 있습니다.

생성

ClassificationSVM 객체는 fitcsvm을 사용하여 생성할 수 있습니다.

속성

모두 확장

SVM 속성

`Alpha` — 훈련된 분류기 계수
읽기 전용: 숫자형 벡터

읽기 전용 속성입니다.

훈련된 분류기 계수로, s×1 숫자형 벡터로 지정됩니다. s는 훈련된 분류기에 포함된 서포트 벡터의 개수, 즉 sum(Mdl.IsSupportVector)입니다.

Alpha는 쌍대 문제에서의 훈련된 분류기 계수, 즉 추정된 라그랑주 승수를 포함합니다. fitcsvm의 RemoveDuplicates 이름-값 쌍의 인수를 사용하여 중복 항목을 제거할 경우, 관측값 중 서포트 벡터에 해당하는 중복 관측값의 집합에 대해 Alpha는 이 집합 전체에 대응하는 하나의 계수를 포함합니다. 즉, MATLAB^®은 중복된 값의 집합에서 하나의 관측값에 0이 아닌 계수를 지정하고 이 집합에 있는 다른 모든 중복된 관측값에 계수 값을 0으로 지정합니다.

데이터형: single | double

`Beta` — 선형 예측 변수 계수
읽기 전용: 숫자형 벡터

읽기 전용 속성입니다.

선형 예측 변수 계수로, 숫자형 벡터로 지정됩니다. Beta의 길이는 모델을 훈련시킬 때 사용되는 예측 변수의 개수와 같습니다.

MATLAB은 전체 가변수 인코딩을 사용하여 예측 변수 데이터에서 범주형 변수를 확장합니다. 즉, MATLAB은 각 범주형 변수의 각 수준마다 하나의 가변수를 생성합니다. Beta는 가변수를 포함하여 각 예측 변수마다 하나의 값을 저장합니다. 예를 들어, 예측 변수가 3개 있고 그중 하나가 3개 수준을 갖는 범주형 변수인 경우 Beta는 5개 값을 포함하는 숫자형 벡터입니다.

KernelParameters.Function이 'linear'이면 관측값 x에 대한 분류 점수는 다음과 같습니다.

$f (x) = (x / s)' β + b .$

Mdl은 β, b, s를 각각 속성 Beta, Bias, KernelParameters.Scale에 저장합니다.

분류 점수를 수동으로 추정하려면 먼저 훈련 중에 적용된 예측 변수 데이터에 변환을 적용해야 합니다. 구체적으로 말해, fitcsvm을 사용할 때 'Standardize',true를 지정할 경우 평균 Mdl.Mu 및 표준편차 Mdl.Sigma를 사용하여 예측 변수 데이터를 수동으로 표준화한 후 그 결과를 Mdl.KernelParameters.Scale에 지정된 커널 스케일로 나눠야 합니다.

모든 SVM 함수(예: resubPredict 및 predict)는 필요한 모든 변환을 적용한 후 추정을 수행합니다.

KernelParameters.Function이 'linear'가 아니면 Beta는 비어 있습니다([]).

데이터형: single | double

`Bias` — 편향 항
읽기 전용: 스칼라

읽기 전용 속성입니다.

편향 항으로, 스칼라로 지정됩니다.

데이터형: single | double

`BoxConstraints` — 상자 제약 조건
읽기 전용: 숫자형 벡터

읽기 전용 속성입니다.

상자 제약 조건으로, 상자 제약 조건으로 구성된 n×1 숫자형 벡터로 지정됩니다. n은 훈련 데이터의 관측값 개수입니다(NumObservations 속성 참조).

fitcsvm의 RemoveDuplicates 이름-값 쌍의 인수를 사용하여 중복 항목을 제거할 경우 주어진 중복된 관측값의 집합에 대해 MATLAB은 상자 제약 조건의 합을 구한 후 이 합을 하나의 관측값에 지정합니다. 그런 다음 MATLAB은 이 집합의 다른 모든 관측값에 상자 제약 조건을 0으로 지정합니다.

데이터형: single | double

`CacheInfo` — 캐시 정보
읽기 전용: 구조체형 배열

읽기 전용 속성입니다.

캐시 정보로, 구조체형 배열로 지정됩니다. 캐시 정보는 다음 표에 설명되어 있는 필드를 포함합니다.

필드	설명
크기	소프트웨어에서 SVM 분류기 훈련을 위해 예약하는 캐시 크기(단위: MB)입니다. 자세한 내용은 `'CacheSize'`를 참조하십시오.
알고리즘	최적화 중에 소프트웨어가 사용하는 캐시 알고리즘입니다. 현재, 사용 가능한 캐시 알고리즘은 `Queue`뿐입니다. 따라서 캐시 알고리즘을 설정할 수 없습니다.

점 표기법을 사용하여 CacheInfo의 필드를 표시할 수 있습니다. 예를 들어, Mdl.CacheInfo.Size는 캐시 크기의 값을 표시합니다.

데이터형: struct

`IsSupportVector` — 서포트 벡터 표시자
읽기 전용: 논리형 벡터

읽기 전용 속성입니다.

서포트 벡터 표시자로, 예측 변수 데이터 행렬에서 대응하는 관측값이 서포트 벡터인지 여부를 나타내는 n×1 논리형 벡터로 지정됩니다. n은 훈련 데이터의 관측값 개수입니다(NumObservations 참조).

fitcsvm의 RemoveDuplicates 이름-값 쌍의 인수를 사용하여 중복 항목을 제거할 경우, 관측값 중 서포트 벡터에 해당하는 중복 관측값의 집합에 대해 IsSupportVector는 하나의 관측값만 서포트 벡터로 지정합니다.

데이터형: logical

`KernelParameters` — 커널 모수
읽기 전용: 구조체형 배열

읽기 전용 속성입니다.

커널 모수로, 구조체형 배열로 지정됩니다. 커널 모수 속성은 다음 표에 나와 있는 필드를 포함합니다.

필드	설명
함수	그람 행렬(Gram Matrix)의 요소를 계산하는 데 사용되는 커널 함수입니다. 자세한 내용은 `'KernelFunction'`을 참조하십시오.
스케일	모델 훈련이 이루어지는 예측 변수 데이터의 모든 요소를 스케일링하는 데 사용되는 커널 스케일 모수입니다. 자세한 내용은 `'KernelScale'`을 참조하십시오.

KernelParameters의 값을 표시하려면 점 표기법을 사용하십시오. 예를 들어, Mdl.KernelParameters.Scale은 커널 스케일 모수 값을 표시합니다.

소프트웨어는 KernelParameters를 입력값으로 받으며 이를 수정하지 않습니다.

데이터형: struct

`Nu` — 단일 클래스 학습 모수
읽기 전용: 양의 스칼라

읽기 전용 속성입니다.

단일 클래스 학습 모수 ν로, 양의 스칼라로 지정됩니다.

데이터형: single | double

`OutlierFraction` — 이상값 비율
읽기 전용: 숫자형 스칼라

읽기 전용 속성입니다.

훈련 데이터의 이상값 비율로, 숫자형 스칼라로 지정됩니다.

데이터형: double

`Solver` — 최적화 루틴
읽기 전용: `'ISDA'` | `'L1QP'` | `'SMO'`

읽기 전용 속성입니다.

SVM 분류기를 훈련시키는 데 사용되는 최적화 루틴으로, 'ISDA', 'L1QP' 또는 'SMO'로 지정됩니다. 자세한 내용은 'Solver'를 참조하십시오.

`SupportVectorLabels` — 서포트 벡터 클래스 레이블
읽기 전용: s×1 숫자형 벡터

읽기 전용 속성입니다.

서포트 벡터 클래스 레이블로, s×1 숫자형 벡터로 지정됩니다. s는 훈련된 분류기에 포함된 서포트 벡터의 개수, 즉 sum(Mdl.IsSupportVector)입니다.

SupportVectorLabels의 값이 +1이면 대응하는 서포트 벡터가 양성 클래스에 속함을 나타냅니다(ClassNames{2}). 값이 –1이면 대응하는 서포트 벡터가 음성 클래스에 속함을 나타냅니다(ClassNames{1}).

fitcsvm의 RemoveDuplicates 이름-값 쌍의 인수를 사용하여 중복 항목을 제거할 경우, 관측값 중 서포트 벡터에 해당하는 중복 관측값의 집합에 대해 SupportVectorLabels는 하나의 고유한 서포트 벡터 레이블을 포함합니다.

데이터형: single | double

`SupportVectors` — 서포트 벡터
읽기 전용: s×p 숫자형 행렬

읽기 전용 속성입니다.

훈련된 분류기에 포함된 서포트 벡터로, s×p 숫자형 행렬로 지정됩니다. s는 훈련된 분류기에 포함된 서포트 벡터의 개수, 즉 sum(Mdl.IsSupportVector)이며, p는 예측 변수 데이터에 포함된 예측 변수의 개수입니다.

SupportVectors는 MATLAB이 서포트 벡터로 간주하는 예측 변수 데이터 X의 행을 포함합니다. fitcsvm을 사용하여 SVM 분류기를 훈련시킬 때 'Standardize',true를 지정할 경우 SupportVectors는 X의 표준화된 행을 포함합니다.

fitcsvm의 RemoveDuplicates 이름-값 쌍의 인수를 사용하여 중복 항목을 제거할 경우, 관측값 중 서포트 벡터에 해당하는 중복 관측값의 집합에 대해 SupportVectors는 하나의 고유한 서포트 벡터를 포함합니다.

데이터형: single | double

기타 분류 속성

`CategoricalPredictors` — 범주형 예측 변수의 인덱스
읽기 전용: 양의 정수로 구성된 벡터 | `[]`

읽기 전용 속성입니다.

범주형 예측 변수의 인덱스로, 양의 정수로 구성된 벡터로 지정됩니다. CategoricalPredictors는 대응하는 예측 변수가 범주형임을 나타내는 인덱스 값을 포함합니다. 인덱스 값은 1과 p 사이입니다. 여기서 p는 모델을 훈련시킬 때 사용되는 예측 변수의 개수입니다. 범주형 예측 변수가 없는 경우 이 속성은 비어 있습니다([]).

데이터형: double

`ClassNames` — 고유한 클래스 레이블
읽기 전용: categorical형 배열 | 문자형 배열 | 논리형 벡터 | 숫자형 벡터 | 문자형 벡터로 구성된 셀형 배열

읽기 전용 속성입니다.

훈련에 사용되는 고유한 클래스 레이블로, categorical형 배열 또는 문자형 배열, 논리형 벡터 또는 숫자형 벡터, 문자형 벡터로 구성된 셀형 배열로 지정됩니다. ClassNames는 클래스 레이블 Y와 데이터형이 동일합니다. (소프트웨어는 string형 배열을 문자형 벡터로 구성된 셀형 배열로 처리합니다.) ClassNames는 클래스 순서도 결정합니다.

`Cost` — 오분류 비용
읽기 전용: 숫자형 정사각 행렬

읽기 전용 속성입니다.

오분류 비용으로, 숫자형 정사각 행렬로 지정됩니다.

2-클래스 학습의 경우 Cost 속성은 피팅 함수의 Cost 이름-값 인수로 지정된 오분류 비용 행렬을 저장합니다. 행은 실제 클래스에 대응되고, 열은 예측 클래스에 대응됩니다. 즉, Cost(i,j)는 실제 클래스가 i인 한 점을 클래스 j로 분류하는 비용입니다. Cost의 행과 열 순서는 ClassNames의 클래스 순서와 일치합니다.
단일 클래스 학습의 경우, Cost = 0입니다.

데이터형: double

`ExpandedPredictorNames` — 확장 예측 변수 이름
읽기 전용: 문자형 벡터로 구성된 셀형 배열

읽기 전용 속성입니다.

확장 예측 변수 이름으로, 문자형 벡터로 구성된 셀형 배열로 지정됩니다.

모델이 범주형 변수에 대한 가변수 인코딩을 사용하는 경우 ExpandedPredictorNames는 확장 변수를 설명하는 이름을 포함합니다. 그렇지 않은 경우, ExpandedPredictorNames는 PredictorNames와 동일합니다.

데이터형: cell

`Gradient` — 훈련 데이터 기울기 값
읽기 전용: 숫자형 벡터

읽기 전용 속성입니다.

훈련 데이터 기울기 값으로, 숫자형 벡터로 지정됩니다. Gradient의 길이는 관측값의 개수(NumObservations)와 같습니다.

데이터형: single | double

`ModelParameters` — 모델 훈련에 사용되는 모수
읽기 전용: 객체

읽기 전용 속성입니다.

ClassificationSVM 모델 훈련에 사용되는 모수로, 객체로 지정됩니다. ModelParameters는 모수 값(예: SVM 분류기 훈련에 사용되는 이름-값 쌍의 인수 값)을 포함합니다. ModelParameters는 추정된 모수를 포함하지 않습니다.

점 표기법을 사용하여 ModelParameters의 속성에 액세스할 수 있습니다. 예를 들어, Mdl.ModelParameters.Alpha를 사용하여 Alpha를 추정하는 데 사용할 초기값을 액세스할 수 있습니다.

`Mu` — 예측 변수 평균
읽기 전용: 숫자형 벡터 | `[]`

읽기 전용 속성입니다.

예측 변수 평균으로, 숫자형 벡터로 지정됩니다. fitcsvm을 사용하여 SVM 분류기를 훈련시킬 때 'Standardize',1 또는 'Standardize',true를 지정하는 경우 Mu의 길이는 예측 변수 개수와 같습니다.

MATLAB은 가변수를 사용하여 예측 변수 데이터에서 범주형 변수를 확장합니다. Mu는 가변수를 포함하여 각 예측 변수마다 하나의 값을 저장합니다. 그러나, MATLAB은 범주형 변수를 포함하는 열을 표준화하지 않습니다.

fitcsvm을 사용하여 SVM 분류기를 훈련시킬 때 'Standardize',false를 설정하는 경우 Mu는 빈 벡터([])입니다.

데이터형: single | double

`NumObservations` — 관측값 개수
읽기 전용: 숫자형 스칼라

읽기 전용 속성입니다.

X 및 Y에 저장된 훈련 데이터에 포함된 관측값 개수로, 숫자형 스칼라로 지정됩니다.

데이터형: double

`PredictorNames` — 예측 변수 이름
읽기 전용: 문자형 벡터로 구성된 셀형 배열

읽기 전용 속성입니다.

예측 변수 이름으로, 문자형 벡터로 구성된 셀형 배열로 지정됩니다. PredictorNames에 포함된 요소의 순서는 예측 변수 이름이 훈련 데이터에 나타나는 순서와 일치합니다.

데이터형: cell

`Prior` — 사전 확률
읽기 전용: 숫자형 벡터

읽기 전용 속성입니다.

각 클래스에 대한 사전 확률로, 숫자형 벡터로 지정됩니다.

2-클래스 학습의 경우, 비용 행렬을 지정하면 소프트웨어가 비용 행렬에 설명된 벌점을 통합하여 사전 확률을 업데이트합니다.

2-클래스 학습의 경우 소프트웨어는 피팅 함수의 Prior 이름-값 인수로 지정된 사전 확률을 합이 1이 되도록 정규화합니다. Prior 속성은 정규화된 사전 확률을 저장합니다. Prior의 요소 순서는 Mdl.ClassNames의 요소 순서와 일치합니다.
단일 클래스 학습의 경우, Prior = 1입니다.

데이터형: single | double

`ResponseName` — 응답 변수 이름
읽기 전용: 문자형 벡터

읽기 전용 속성입니다.

응답 변수 이름으로, 문자형 벡터로 지정됩니다.

데이터형: char

`RowsUsed` — 저장된 원래 훈련 데이터의 행
읽기 전용: 논리형 벡터 | `[]`

읽기 전용 속성입니다.

모델에 저장된 원래 훈련 데이터의 행으로, 논리형 벡터로 지정됩니다. 모든 행이 X와 Y에 저장되어 있는 경우 이 속성은 비어 있습니다.

데이터형: logical

`ScoreTransform` — 점수 변환 방식
문자형 벡터 | 함수 핸들

점수 변환 방식으로, 문자형 벡터 또는 함수 핸들로 지정됩니다. ScoreTransform은 내장 변환 함수 또는 예측된 분류 점수를 변환하는 데 사용하는 함수 핸들을 나타냅니다.

예를 들어, 점수 변환 함수를 function으로 변경하려면 점 표기법을 사용하십시오.

내장 함수의 경우 문자형 벡터를 입력합니다.

Mdl.ScoreTransform = 'function';

다음 표에는 사용 가능한 내장 함수에 대한 설명이 나와 있습니다.

값	설명
`'doublelogit'`	1/(1 + e^–2x)
`'invlogit'`	log(x / (1 – x))
`'ismax'`	최대 점수를 갖는 클래스의 점수를 1로 설정하고, 다른 모든 클래스의 점수를 0으로 설정합니다.
`'logit'`	1/(1 + e^–x)
`'none'` 또는 `'identity'`	x(변환 없음)
`'sign'`	x < 0의 경우 –1 x = 0의 경우 0 x > 0의 경우 1
`'symmetric'`	2x – 1
`'symmetricismax'`	최대 점수를 갖는 클래스의 점수를 1로 설정하고, 다른 모든 클래스의 점수를 -1로 설정합니다.
`'symmetriclogit'`	2/(1 + e^–x) – 1

MATLAB 함수나 사용자가 직접 정의하는 함수의 경우, 이에 대한 함수 핸들을 입력하십시오.
```
Mdl.ScoreTransform = @function;
```
function은 행렬(원래 점수)을 받아 동일한 크기의 행렬(변환된 점수)을 반환해야 합니다.

데이터형: char | function_handle

`Sigma` — 예측 변수 표준편차
읽기 전용: `[]` (디폴트 값) | 숫자형 벡터

읽기 전용 속성입니다.

예측 변수 표준편차로, 숫자형 벡터로 지정됩니다.

fitcsvm을 사용하여 SVM 분류기를 훈련시킬 때 'Standardize',true를 지정하는 경우 Sigma의 길이는 예측 변수 개수와 같습니다.

MATLAB은 가변수를 사용하여 예측 변수 데이터에서 범주형 변수를 확장합니다. Sigma는 가변수를 포함하여 각 예측 변수마다 하나의 값을 저장합니다. 그러나, MATLAB은 범주형 변수를 포함하는 열을 표준화하지 않습니다.

fitcsvm을 사용하여 SVM 분류기를 훈련시킬 때 'Standardize',false를 설정하는 경우 Sigma는 빈 벡터([])입니다.

데이터형: single | double

`W` — 관측값 가중치
읽기 전용: 숫자형 벡터

읽기 전용 속성입니다.

SVM 분류기를 훈련시키는 데 사용되는 관측값 가중치로, n×1 숫자형 벡터로 지정됩니다. n은 관측값의 개수입니다(NumObservations 참조).

fitcsvm은 특정 클래스 내의 W 요소의 합이 해당 클래스의 사전 확률이 되도록 'Weights' 이름-값 쌍의 인수에 지정된 관측값 가중치를 정규화합니다.

데이터형: single | double

`X` — 표준화되지 않은 예측 변수
읽기 전용: 숫자형 행렬 | table형

읽기 전용 속성입니다.

SVM 분류기를 훈련시키는 데 사용되는 표준화되지 않은 예측 변수로, 숫자형 행렬 또는 테이블로 지정됩니다.

X의 각 행은 하나의 관측값에 대응되고, 각 열은 하나의 변수에 대응됩니다.

데이터형: single | double

`Y` — 클래스 레이블
읽기 전용: categorical형 배열 | 문자형 배열 | 논리형 벡터 | 숫자형 벡터 | 문자형 벡터로 구성된 셀형 배열

읽기 전용 속성입니다.

SVM 분류기를 훈련시키는 데 사용되는 클래스 레이블로, categorical형 배열이나 문자형 배열, 논리형 벡터나 숫자형 벡터, 또는 문자형 벡터로 구성된 셀형 배열로 지정됩니다. Y는 fitcsvm의 입력 인수 Y와 데이터형이 같습니다. (소프트웨어는 string형 배열을 문자형 벡터로 구성된 셀형 배열로 처리합니다.)

Y의 각 행은 이에 대응되는 X 행의 관측된 분류를 나타냅니다.

수렴 제어 속성

`ConvergenceInfo` — 수렴 정보
읽기 전용: 구조체형 배열

읽기 전용 속성입니다.

수렴 정보로, 구조체형 배열로 지정됩니다.

필드	설명
`Converged`	알고리즘이 수렴되는지 여부를 나타내는 논리형 플래그(`1`은 수렴을 나타냄)
`ReasonForConvergence`	소프트웨어가 수렴을 감지하는 데 사용하는 기준을 나타내는 문자형 벡터
`Gap`	쌍대 문제 목적 함수와 원문제 목적 함수 간 스칼라 실현가능성 격차
`GapTolerance`	스칼라 실현가능성 격차 허용오차. 예를 들어, `fitcsvm`의 이름-값 쌍의 인수 `'GapTolerance',1e-2`를 사용하여 이 허용오차를 `1e-2`로 설정할 수 있습니다.
`DeltaGradient`	상한 이탈값과 하한 이탈값 간의 스칼라로 계산된 기울기 차이
`DeltaGradientTolerance`	상한 이탈값과 하한 이탈값 간의 기울기 차이에 대한 스칼라 허용오차. 예를 들어, `fitcsvm`의 이름-값 쌍의 인수 `'DeltaGradientTolerance',1e-2`를 사용하여 이 허용오차를 `1e-2`로 설정할 수 있습니다.
`LargestKKTViolation`	최대 스칼라 카루쉬-쿤-터커(KKT: Karush-Kuhn-Tucker) 위반 값
`KKTTolerance`	최대 KKT 위반에 대한 스칼라 허용오차. 예를 들어, `fitcsvm`의 이름-값 쌍의 인수 `'KKTTolerance',1e-3`을 사용하여 이 허용오차를 `1e-3`으로 설정할 수 있습니다.
`History`	설정된 최적화 반복에서의 수렴 정보를 포함하는 구조체형 배열. 필드는 다음과 같습니다. `NumIterations`: 소프트웨어가 수렴 정보를 기록하는 반복에 대한 인덱스로 구성된 숫자형 벡터 `Gap`: 반복에서의 `Gap` 값으로 구성된 숫자형 벡터 `DeltaGradient`: 반복에서의 `DeltaGradient` 값으로 구성된 숫자형 벡터 `LargestKKTViolation`: 반복에서의 `LargestKKTViolation` 값으로 구성된 숫자형 벡터 `NumSupportVectors`: 반복에서의 서포트 벡터 개수를 나타내는 숫자형 벡터 `Objective`: 반복에서의 `Objective` 값으로 구성된 숫자형 벡터
`Objective`	쌍대 문제 목적 함수의 스칼라 값

데이터형: struct

`NumIterations` — 반복 횟수
읽기 전용: 양의 정수

읽기 전용 속성입니다.

수렴을 달성하기 위해 최적화 루틴에 필요한 반복 횟수로, 양의 정수로 지정됩니다.

예를 들어, 반복 횟수 제한을 1000으로 설정하려면 fitcsvm을 사용하여 SVM 분류기를 훈련시킬 때 'IterationLimit',1000을 지정하십시오.

데이터형: double

`ShrinkagePeriod` — 활성 세트 감소 간의 반복 횟수
읽기 전용: 음이 아닌 정수

읽기 전용 속성입니다.

활성 세트 감소 간의 반복 횟수로, 음이 아닌 정수로 지정됩니다.

예를 들어, 축소 기간을 1000으로 설정하려면 fitcsvm을 사용하여 SVM 분류기를 훈련시킬 때 'ShrinkagePeriod',1000을 지정하십시오.

데이터형: single | double

하이퍼파라미터 최적화 속성

`HyperparameterOptimizationResults` — 하이퍼파라미터에 대한 교차 검증 최적화와 관련된 설명
읽기 전용: `BayesianOptimization` 객체 | table형

읽기 전용 속성입니다.

하이퍼파라미터에 대한 교차 검증 최적화와 관련된 설명으로, BayesianOptimization 객체 또는 하이퍼파라미터 및 관련 값으로 구성된 테이블로 지정됩니다. fitcsvm의 'OptimizeHyperparameters' 이름-값 쌍의 인수가 생성 시 비어 있지 않은 경우, 이 속성은 비어 있지 않습니다. HyperparameterOptimizationResults의 값은 생성 시 fitcsvm의 HyperparameterOptimizationOptions 구조체 내 Optimizer 필드의 설정에 따라 결정됩니다(다음 표의 설명 참조).

`Optimizer` 옵션의 값	`HyperparameterOptimizationResults`의 값
`"bayesopt"`(디폴트 값)	`BayesianOptimization` 클래스의 객체
`"gridsearch"` 또는 `"randomsearch"`	사용된 하이퍼파라미터, 관측된 목적 함수 값(교차 검증 손실), 그리고 관측값 순위가 가장 낮은 값(최상)에서 가장 높은 값(최하)순으로 포함된 테이블

객체 함수

`compact`	Reduce size of machine learning model
`compareHoldout`	Compare accuracies of two classification models using new data
`crossval`	Cross-validate machine learning model
`discardSupportVectors`	Discard support vectors for linear support vector machine (SVM) classifier
`edge`	Find classification edge for support vector machine (SVM) classifier
`fitPosterior`	Fit posterior probabilities for support vector machine (SVM) classifier
`gather`	Gather properties of Statistics and Machine Learning Toolbox object from GPU
`incrementalLearner`	Convert binary classification support vector machine (SVM) model to incremental learner
`lime`	Local interpretable model-agnostic explanations (LIME)
`loss`	Find classification error for support vector machine (SVM) classifier
`margin`	Find classification margins for support vector machine (SVM) classifier
`partialDependence`	Compute partial dependence
`plotPartialDependence`	Create partial dependence plot (PDP) and individual conditional expectation (ICE) plots
`predict`	서포트 벡터 머신(SVM) 분류기를 사용하여 관측값 분류
`resubEdge`	Resubstitution classification edge
`resubLoss`	Resubstitution classification loss
`resubMargin`	Resubstitution classification margin
`resubPredict`	Classify training data using trained classifier
`resume`	Resume training support vector machine (SVM) classifier
`shapley`	Shapley values
`testckfold`	Compare accuracies of two classification models by repeated cross-validation

예제

모두 축소

SVM 분류기 훈련시키기

라이브 스크립트 열기

피셔(Fisher)의 붓꽃 데이터 세트를 불러옵니다. 꽃받침 길이와 너비, 그리고 관측된 모든 부채붓꽃(Setosa Iris)을 제거합니다.

load fisheriris
inds = ~strcmp(species,'setosa');
X = meas(inds,3:4);
y = species(inds);

처리된 데이터 세트를 사용하여 SVM 분류기를 훈련시킵니다.

SVMModel = fitcsvm(X,y)

SVMModel = 
  ClassificationSVM
             ResponseName: 'Y'
    CategoricalPredictors: []
               ClassNames: {'versicolor'  'virginica'}
           ScoreTransform: 'none'
          NumObservations: 100
                    Alpha: [24×1 double]
                     Bias: -14.4149
         KernelParameters: [1×1 struct]
           BoxConstraints: [100×1 double]
          ConvergenceInfo: [1×1 struct]
          IsSupportVector: [100×1 logical]
                   Solver: 'SMO'


  Properties, Methods

SVMModel은 훈련된 ClassificationSVM 분류기입니다. SVMModel의 속성을 표시합니다. 예를 들어, 클래스 순서를 확인하려면 점 표기법을 사용하십시오.

classOrder = SVMModel.ClassNames

classOrder = 2×1 cell
    {'versicolor'}
    {'virginica' }

첫 번째 클래스('versicolor')는 음성 클래스이고, 두 번째 클래스('virginica')는 양성 클래스입니다. 'ClassNames' 이름-값 쌍의 인수를 사용하여 훈련 중에 클래스 순서를 변경할 수 있습니다.

데이터의 산점도 도식을 플로팅하고 서포트 벡터를 원으로 표시합니다.

sv = SVMModel.SupportVectors;
figure
gscatter(X(:,1),X(:,2),y)
hold on
plot(sv(:,1),sv(:,2),'ko','MarkerSize',10)
legend('versicolor','virginica','Support Vector')
hold off

Figure contains an axes object. The axes object contains 3 objects of type line. One or more of the lines displays its values using only markers These objects represent versicolor, virginica, Support Vector.

서포트 벡터는 추정된 클래스 경계 또는 그 너머에 있는 관측값입니다.

'BoxConstraint' 이름-값 쌍의 인수를 사용하여 훈련 중에 상자 제약 조건을 설정하여 경계(즉, 서포트 벡터 개수)를 조정할 수 있습니다.

SVM 분류기를 훈련시키고 교차 검증하기

라이브 스크립트 열기

ionosphere 데이터 세트를 불러옵니다.

load ionosphere

SVM 분류기를 훈련시키고 교차 검증합니다. 예측 변수 데이터를 표준화하고 클래스의 순서를 지정합니다.

rng(1);  % For reproducibility
CVSVMModel = fitcsvm(X,Y,'Standardize',true,...
    'ClassNames',{'b','g'},'CrossVal','on')

CVSVMModel = 
  ClassificationPartitionedModel
    CrossValidatedModel: 'SVM'
         PredictorNames: {'x1'  'x2'  'x3'  'x4'  'x5'  'x6'  'x7'  'x8'  'x9'  'x10'  'x11'  'x12'  'x13'  'x14'  'x15'  'x16'  'x17'  'x18'  'x19'  'x20'  'x21'  'x22'  'x23'  'x24'  'x25'  'x26'  'x27'  'x28'  'x29'  'x30'  'x31'  'x32'  'x33'  'x34'}
           ResponseName: 'Y'
        NumObservations: 351
                  KFold: 10
              Partition: [1×1 cvpartition]
             ClassNames: {'b'  'g'}
         ScoreTransform: 'none'


  Properties, Methods

CVSVMModel은 ClassificationPartitionedModel의 교차 검증된 SVM 분류기입니다. 기본적으로 소프트웨어는 10겹 교차 검증을 구현합니다.

또는, 훈련된 ClassificationSVM 분류기를 crossval로 전달하여 교차 검증할 수 있습니다.

점 표기법을 사용하여 훈련된 겹 중 하나를 검사합니다.

CVSVMModel.Trained{1}

ans = 
  CompactClassificationSVM
             ResponseName: 'Y'
    CategoricalPredictors: []
               ClassNames: {'b'  'g'}
           ScoreTransform: 'none'
                    Alpha: [78×1 double]
                     Bias: -0.2210
         KernelParameters: [1×1 struct]
                       Mu: [0.8888 0 0.6320 0.0406 0.5931 0.1205 0.5361 0.1286 0.5083 0.1879 0.4779 0.1567 0.3924 0.0875 0.3360 0.0789 0.3839 9.6066e-05 0.3562 -0.0308 0.3398 -0.0073 0.3590 -0.0628 0.4064 -0.0664 0.5535 -0.0749 0.3835 … ] (1×34 double)
                    Sigma: [0.3149 0 0.5033 0.4441 0.5255 0.4663 0.4987 0.5205 0.5040 0.4780 0.5649 0.4896 0.6293 0.4924 0.6606 0.4535 0.6133 0.4878 0.6250 0.5140 0.6075 0.5150 0.6068 0.5222 0.5729 0.5103 0.5061 0.5478 0.5712 0.5032 … ] (1×34 double)
           SupportVectors: [78×34 double]
      SupportVectorLabels: [78×1 double]


  Properties, Methods

각각의 겹은 데이터의 90%에 대해 훈련된 CompactClassificationSVM 분류기입니다.

일반화 오차를 추정합니다.

genError = kfoldLoss(CVSVMModel)

genError = 
0.1168

평균적으로 일반화 오차는 약 12%입니다.

세부 정보

모두 확장

상자 제약 조건

상자 제약 조건은 마진을 위반하는 관측값에 적용되는 최대 벌점을 제어하고 과적합을 방지(정규화)하는 데 도움이 되는 모수입니다.

상자 제약 조건을 늘리면 SVM 분류기가 더 적은 서포트 벡터를 할당합니다. 그러나, 상자 제약 조건을 늘리면 훈련 시간이 더 길어질 수 있습니다.

그람 행렬(Gram matrix)

n개 벡터의 집합으로 구성된 그람 행렬 {x₁,..,x_n; x_j ∊ R^p}는 커널 함수 ϕ를 사용하여 변환된 예측 변수의 내적인 G(x_j,x_k) = <ϕ(x_j),ϕ(x_k)>로 정의된 요소 (j,k)를 갖는 n×n 행렬입니다.

비선형 SVM의 경우, 이 알고리즘은 예측 변수 데이터 X의 행을 사용하여 그람 행렬을 형성합니다. 쌍대 문제 형식화는 X에 포함된 관측값의 내적을 결과로 생성되는 그람 행렬의 대응 요소로 바꿉니다(“커널 트릭(Kernel trick)”이라고 함). 그 결과, 비선형 SVM은 변환된 예측 변수 공간에서 동작하여 분리 초평면을 찾습니다.

카루쉬-쿤-터커(Karush-Kuhn-Tucker) 상보성 조건

카루쉬-쿤-터커(KKT) 상보성 조건은 최적의 비선형 계획법 해에 요구되는 최적화 제약 조건입니다.

SVM에서 KKT 상보성 조건은 다음과 같습니다.

${\begin{cases} α_{j} [y_{j} f (x_{j}) - 1 + ξ_{j}] = 0 \\ ξ_{j} (C - α_{j}) = 0 \end{cases}$

이는 모든 j = 1,...,n에 대해 적용됩니다. 여기서 $f (x_{j}) = ϕ (x_{j})' β + b,$ ϕ는 커널 함수(그람 행렬 참조)이고, ξ_j는 여유 변수입니다. 클래스가 완벽하게 분리 가능한 경우, 모든 j = 1,...,n에 대해 ξ_j = 0입니다.

단일 클래스 학습

단일 클래스 학습, 즉 비지도 SVM은 고차원 예측 변수 공간(원래 예측 변수 공간이 아님)의 원점에서 데이터를 분리하는 것이 목적이며, 이상값 감지에 사용되는 알고리즘입니다.

이 알고리즘은 이진 분류를 위한 SVM의 알고리즘과 비슷합니다. 목적은 다음과 같은 쌍대 문제 표현식의 크기를 최소화하는 것입니다.

$0.5 \sum_{j k} α_{j} α_{k} G (x_{j}, x_{k})$

여기에서 $α_{1}, ..., α_{n}$ 은 다음의 값입니다.

$\sum α_{j} = n ν$

또한, 모든 j = 1,...,n에 대해 $0 \leq α_{j} \leq 1$ 입니다. G(x_j,x_k)의 값은 그람 행렬의 요소 (j,k)에 있습니다.

ν의 값이 작을 경우 서포트 벡터의 수가 더 적어지고, 이에 따라 매끄럽고 엄격한 결정 경계가 생성됩니다. ν의 값이 클 경우 서포트 벡터의 수가 더 많아지고, 이에 따라 굴곡이 많은 유연한 결정 경계가 생성됩니다. ν의 최적 값은 데이터 복잡성을 포착할 만큼 커야 하고 과잉훈련을 피할 수 있을 정도로 작아야 합니다. 또한, 0 < ν ≤ 1입니다.

자세한 내용은 [4] 항목을 참조하십시오.

서포트 벡터

서포트 벡터는 순양수 추정값 α₁,...,α_n에 대응되는 관측값입니다.

주어진 훈련 세트에 대해 더 적은 수의 서포트 벡터를 생성하는 SVM 분류기가 더 좋습니다.

이진 분류를 위한 서포트 벡터 머신

SVM 이진 분류 알고리즘은 두 클래스로 데이터를 분리하는 최적의 초평면을 탐색합니다. 분리 가능한 클래스에 대해 최적의 초평면은 양성 클래스와 음성 클래스에 대한 경계를 생성하는, 이를 둘러싸는 마진(관측값을 포함하지 않는 공간)을 극대화합니다. 분리가 불가능한 클래스에 대해서도 목적은 같지만, 이 알고리즘은 클래스 경계의 잘못된 변에 있는 모든 관측값에 대한 마진의 길이에 벌점을 적용합니다.

선형 SVM 점수 함수는 다음과 같습니다.

$f (x) = x' β + b,$

여기서는 다음을 조건으로 합니다.

x는 (X의 행에 대응하는)관측값입니다.
벡터 β는 초평면에 대한 직교 벡터를 정의하는 계수(Mdl.Beta에 대응)를 포함합니다. 분리 가능한 데이터에 대해 최적의 마진 길이는 $2 / ‖ β ‖ .$ 입니다.
b는 (Mdl.Bias에 대응하는) 편향 항입니다.

특정 계수에 대한 f(x)의 근은 초평면을 정의합니다. 특정 초평면에 대해 f(z)는 점 z에서 초평면까지의 거리입니다.

이 알고리즘은 양성 클래스(y = 1)와 음성 클래스(y = –1)의 관측값을 분리된 상태로 유지하면서 최대 마진 길이를 탐색합니다.

분리 가능한 클래스인 경우, 모든 j = 1,..,n에 대해 y_jf(x_j) ≥ 1을 만족하는 β 및 b에 대해 $‖ β ‖$ 를 최소화하는 것이 목적입니다. 이것은 분리 가능한 클래스에 대한 원문제(Primal) 형식화입니다.
분리가 불가능한 클래스에 대해 이 알고리즘은 여유 변수(ξ_j)를 사용하여 해당 클래스의 마진 경계를 교차하는 관측값의 목적 함수에 벌점을 적용합니다. 해당 클래스의 마진 경계를 교차하지 않는 관측값에 대해서는 ξ_j = 0이고, 그렇지 않은 경우 ξ_j ≥ 0입니다.
모든 j = 1,..,n에 대해, 그리고 양의 스칼라 상자 제약 조건 C에 대해 $y_{j} f (x_{j}) \geq 1 - ξ_{j}$ 및 $ξ_{j} \geq 0$ 을 만족하는 β, b, ξ_j에 대해 $0.5 {‖ β ‖}^{2} + C \sum ξ_{j}$ 를 최소화하는 것이 목적입니다. 이것은 분리가 불가능한 클래스에 대한 원문제(Primal) 형식화입니다.

이 알고리즘은 목적 함수를 최적화하기 위해 라그랑주 승수 방법을 사용합니다. 여기에는 n개의 계수 α₁,...,α_n(Mdl.Alpha에 대응)이 사용됩니다. 선형 SVM의 쌍대 문제 형식화는 다음과 같습니다.

분리 가능한 클래스에 대해 다음을 최소화합니다.

$0.5 \sum_{j = 1}^{n} \sum_{k = 1}^{n} α_{j} α_{k} y_{j} y_{k} x_{j}' x_{k} - \sum_{j = 1}^{n} α_{j}$
이는 α₁,...,α_n에 대해 수행되고 $\sum α_{j} y_{j} = 0$ , 모든 j = 1,...,n에 대해 α_j ≥ 0 및 카루쉬-쿤-터커(KKT) 상보성 조건이 적용됩니다.
분리가 불가능한 클래스의 경우, 목적은 분리 가능한 클래스와 동일하되 모든 j = 1,..,n에 대해 $0 \leq α_{j} \leq C$ 라는 추가 조건이 적용됩니다.

결과로 생성되는 점수 함수는 다음과 같습니다.

$\hat{f} (x) = \sum_{j = 1}^{n} {\hat{α}}_{j} y_{j} x' x_{j} + \hat{b} .$

$\hat{b}$ 는 편향에 대한 추정값이고 ${\hat{α}}_{j}$ 는 벡터 $\hat{α}$ , j = 1,...,n에 대한 j번째 추정값입니다. 이렇게 작성된 점수 함수는 원문제 형식화의 결과로 β의 추정값을 생성하지 않습니다.

SVM 알고리즘은 $sign (\hat{f} (z)) .$ 를 사용하여 새 관측값 z를 분류합니다.

비선형 경계가 클래스를 분리하는 경우가 있습니다. 비선형 SVM은 변환된 예측 변수 공간에서 동작하여 최적의 분리 초평면을 찾습니다.

비선형 SVM의 쌍대 문제 형식화는 다음과 같습니다.

$0.5 \sum_{j = 1}^{n} \sum_{k = 1}^{n} α_{j} α_{k} y_{j} y_{k} G (x_{j}, x_{k}) - \sum_{j = 1}^{n} α_{j}$

이는 α₁,...,α_n에 대해 수행되고 $\sum α_{j} y_{j} = 0$ , 모든 j = 1,..,n에 대해 $0 \leq α_{j} \leq C$ 및 KKT 상보성 조건이 적용됩니다. G(x_k,x_j)는 그람 행렬의 요소입니다. 결과로 나타나는 점수 함수는 다음과 같습니다.

$\hat{f} (x) = \sum_{j = 1}^{n} {\hat{α}}_{j} y_{j} G (x, x_{j}) + \hat{b} .$

자세한 내용은 서포트 벡터 머신 이해하기, [3] 항목, [1] 항목을 참조하십시오.

알고리즘

SVM 이진 분류 알고리즘의 수학적 공식은 이진 분류를 위한 서포트 벡터 머신 항목과 서포트 벡터 머신 이해하기 항목을 참조하십시오.
NaN, <undefined>, 빈 문자형 벡터(''), 빈 string형(""), <missing> 값은 누락값을 나타냅니다. fitcsvm은 누락값인 응답 변수에 대응되는 데이터의 전체 행을 제거합니다. 총 가중치를 계산할 때(다음 글머리 기호 항목 참조), fitcsvm은 누락값인 예측 변수를 하나라도 갖는 관측값에 대응되는 가중치를 모두 무시합니다. 이 동작은 균형 클래스 문제에서 불균형 사전 확률을 초래할 수 있습니다. 따라서, 관측값 상자 제약 조건은 BoxConstraint와 일치하지 않을 수 있습니다.
Cost, Prior 및 Weights 이름-값 인수를 지정할 경우 출력 모델 객체는 지정된 값을 각각 Cost, Prior 및 W 속성에 저장합니다. Cost 속성이 사용자가 지정한 비용 행렬(C)을 수정 없이 저장합니다. Prior 속성과 W 속성은 각각 정규화한 후의 사전 확률 및 관측값 가중치를 저장합니다. 모델 훈련 시, 소프트웨어는 비용 행렬에 있는 벌점을 통합하도록 사전 확률과 관측값 가중치를 업데이트합니다. 자세한 내용은 오분류 비용 행렬, 사전 확률 및 관측값 가중치 항목을 참조하십시오.
Cost 및 Prior 이름-값 인수는 2-클래스 학습에 사용됩니다. 단일 클래스 학습의 경우 Cost 및 Prior 속성은 각각 0과 1을 저장합니다.
2-클래스 학습의 경우, fitcsvm은 상자 제약 조건을 훈련 데이터의 각 관측값에 할당합니다. 관측값 j의 상자 제약 조건에 대한 공식은 다음과 같습니다.

$C_{j} = n C_{0} w_{j}^{*},$
여기서 C₀은 초기 상자 제약 조건이고(BoxConstraint 이름-값 인수 참조), w_j^*는 관측값 j에 대해 Cost 및 Prior에 의해 조정된 관측값 가중치입니다. 관측값 가중치에 대한 자세한 내용은 오분류 비용 행렬에 대한 사전 확률 및 관측값 가중치 조정하기 항목을 참조하십시오.
Standardize를 true로 지정하고 Cost, Prior 또는 Weights 이름-값 인수를 설정하면 fitcsvm이 대응되는 가중 평균과 가중 표준편차를 사용하여 예측 변수를 표준화합니다. 즉, fitcsvm은 다음을 사용하여 예측 변수 j(x_j)를 표준화합니다.

$x_{j}^{*} = \frac{x_{j} - μ_{j}^{*}}{σ_{j}^{*}},$
여기서 x_jk는 예측 변수 j(열)의 관측값 k(행)이며 다음이 성립됩니다.

$\begin{matrix} μ_{j}^{*} = \frac{1}{\sum_{k} w_{k}^{*}} \sum_{k} w_{k}^{*} x_{j k}, \\ {(σ_{j}^{*})}^{2} = \frac{v_{1}}{v_{1}^{2} - v_{2}} \sum_{k} w_{k}^{*} {(x_{j k} - μ_{j}^{*})}^{2}, \\ v_{1} = \sum_{j} w_{j}^{*}, \\ v_{2} = \sum_{j} {(w_{j}^{*})}^{2} . \end{matrix}$
p가 훈련 데이터에서 사용자가 예상하는 이상값 비율이고 'OutlierFraction',p를 설정한다고 가정합니다.
- 단일 클래스 학습의 경우, 소프트웨어가 훈련 데이터에 포함된 관측값의 100p%가 음의 점수를 가지도록 편향 항을 훈련시킵니다.
- 2-클래스 학습의 경우 소프트웨어가 로버스트 학습을 구현합니다. 다시 말해, 최적화 알고리즘이 수렴될 때 소프트웨어가 관측값의 100p%를 제거한다는 의미입니다. 제거되는 관측값은 크기가 큰 기울기에 해당합니다.
예측 변수 데이터에 범주형 변수가 포함된 경우 소프트웨어가 일반적으로 이러한 변수에 대해 전체 가변수 인코딩을 사용합니다. 소프트웨어는 각 범주형 변수의 각 수준마다 하나의 가변수를 생성합니다.
- PredictorNames 속성은 원래 예측 변수 이름마다 하나의 요소를 저장합니다. 예를 들어, 세 개의 예측 변수가 있고, 그중 하나가 세 개 수준을 갖는 범주형 변수라고 가정해 보겠습니다. 그러면 PredictorNames는 예측 변수의 원래 이름을 포함하는 문자형 벡터로 구성된 1×3 셀형 배열이 됩니다.
- ExpandedPredictorNames 속성은 가변수를 포함하여 예측 변수마다 하나의 요소를 저장합니다. 예를 들어, 세 개의 예측 변수가 있고, 그중 하나가 세 개 수준을 갖는 범주형 변수라고 가정해 보겠습니다. 그러면 ExpandedPredictorNames는 예측 변수 이름 및 새 가변수의 이름을 포함하는 문자형 벡터로 구성된 1×5 셀형 배열이 됩니다.
- 마찬가지로, Beta 속성은 가변수를 포함하여 예측 변수마다 하나의 베타 계수를 저장합니다.
- SupportVectors 속성은 가변수를 포함하여 서포트 벡터에 대한 예측 변수 값을 저장합니다. 예를 들어, m개의 서포트 벡터와 세 개의 예측 변수가 있고, 그중 하나가 세 개의 수준을 갖는 범주형 변수라고 가정해 보겠습니다. 그러면 SupportVectors는 n×5 행렬이 됩니다.
- X 속성은 훈련 데이터를 원래 입력된 대로 저장하고 가변수는 포함하지 않습니다. 입력값이 테이블인 경우, X는 예측 변수로 사용된 열만 포함합니다.
테이블에 지정된 예측 변수에 대해 변수 중 하나가 순서가 지정된(순서형) 범주를 포함하는 경우 소프트웨어는 이러한 변수에 대해 순서형 인코딩(Ordinal Encoding)을 사용합니다.
- 순서가 지정된 k개의 수준을 갖는 변수에 대해 소프트웨어는 k – 1개의 가변수를 생성합니다. j번째 가변수는 j 수준까지는 –1이 되고, j + 1에서 k까지의 수준에서는 +1이 됩니다.
- ExpandedPredictorNames 속성에 저장된 가변수의 이름은 값 +1을 갖는 첫 번째 수준을 나타냅니다. 소프트웨어는 수준 2, 3, ..., k의 이름을 포함하여 가변수에 대해 k – 1개의 추가 예측 변수 이름을 저장합니다.
모든 솔버는 L1 소프트 마진(Soft-Margin) 최소화를 구현합니다.
단일 클래스 학습의 경우, 소프트웨어는 다음을 만족하는 라그랑주 승수 α₁,...,α_n을 추정합니다.

$\sum_{j = 1}^{n} α_{j} = n ν .$

참고 문헌

[1] Hastie, T., R. Tibshirani, and J. Friedman. The Elements of Statistical Learning, Second Edition. NY: Springer, 2008.

[2] Scholkopf, B., J. C. Platt, J. C. Shawe-Taylor, A. J. Smola, and R. C. Williamson. “Estimating the Support of a High-Dimensional Distribution.” Neural Comput., Vol. 13, Number 7, 2001, pp. 1443–1471.

[3] Christianini, N., and J. C. Shawe-Taylor. An Introduction to Support Vector Machines and Other Kernel-Based Learning Methods. Cambridge, UK: Cambridge University Press, 2000.

[4] Scholkopf, B., J. C. Platt, J. C. Shawe-Taylor, A. J. Smola, and R. C. Williamson. “Estimating the Support of a High-Dimensional Distribution.” Neural Comput., Vol. 13, Number 7, 2001, pp. 1443–1471.

[5] Scholkopf, B., and A. Smola. Learning with Kernels: Support Vector Machines, Regularization, Optimization and Beyond, Adaptive Computation and Machine Learning. Cambridge, MA: The MIT Press, 2002.

확장 기능

모두 확장

C/C++ 코드 생성
MATLAB® Coder™를 사용하여 C 코드나 C++ 코드를 생성할 수 있습니다.

사용법 관련 참고 및 제한 사항:

predict 함수 및 update 함수는 코드 생성을 지원합니다.
SVM 분류 모델의 예측을 Simulink^®에 통합하려면 Statistics and Machine Learning Toolbox™ 라이브러리의 ClassificationSVM Predict 블록을 사용하거나 MATLAB Function 블록에 predict 함수를 사용할 수 있습니다.
fitcsvm을 사용하여 SVM 모델을 훈련시키는 경우 다음 제한 사항이 적용됩니다.
- 'ScoreTransform' 이름-값 쌍의 인수의 값은 익명 함수일 수 없습니다. 주어진 새 관측값을 고려하여 사후 확률을 예측하는 코드를 생성하는 경우 훈련된 SVM 모델을 fitPosterior 또는 fitSVMPosterior로 전달하십시오. 반환된 모델의 ScoreTransform 속성은 점수-사후 확률 함수를 나타내는 익명 함수를 포함하며 코드 생성에 사용하도록 구성됩니다.
- 고정소수점 코드를 생성하려면 'ScoreTransform' 이름-값 쌍 인수의 값은 'invlogit'일 수 없습니다. 또한 'KernelFunction' 이름-값 쌍의 인수 값은 'gaussian', 'linear' 또는 'polynomial'이어야 합니다.
- 코더 구성기를 사용한 고정소수점 코드 생성 및 코드 생성에는 다음과 같은 추가 제한 사항이 적용됩니다.
  - 범주형 예측 변수(logical, categorical, char, string 또는 cell)는 지원되지 않습니다. CategoricalPredictors 이름-값 인수를 사용할 수 없습니다. 모델에 범주형 예측 변수를 포함하려면 모델을 피팅하기 전에 dummyvar를 사용하여 해당 변수를 전처리하십시오.
  - categorical 데이터형을 가진 클래스 레이블은 지원되지 않습니다. 훈련 데이터의 클래스 레이블 값(Tbl 또는 Y) 및 ClassNames 이름-값 인수의 값은 모두 categorical 데이터형의 배열일 수 없습니다.

자세한 내용은 Introduction to Code Generation 항목을 참조하십시오.

GPU 배열
Parallel Computing Toolbox™를 사용해 GPU(그래픽스 처리 장치)에서 실행하여 코드 실행 속도를 높일 수 있습니다.

사용법 관련 참고 및 제한 사항:

다음 객체 함수는 GPU 배열을 완전히 지원합니다.
다음 객체 함수는 GPU 배열을 제한적으로 지원합니다.
다음 중 적어도 하나가 적용되는 경우 객체 함수가 GPU에서 실행됩니다.
- 모델이 GPU 배열을 사용하여 피팅되었습니다.
- 객체 함수에 전달하는 예측 변수 데이터가 GPU 배열입니다.

자세한 내용은 GPU에서 MATLAB 함수 실행하기 (Parallel Computing Toolbox) 항목을 참조하십시오.

버전 내역

R2014a에 개발됨

모두 확장

R2023b: 모델이 누락값인 예측 변수가 포함된 관측값을 저장함

R2023b부터는 누락값인 예측 변수를 갖는 훈련 관측값이 X, Y, W 데이터 속성에 포함됩니다. RowsUsed 속성은 훈련에 사용되는 관측값이 아닌 모델에 저장된 훈련 관측값을 나타냅니다. 누락값인 예측 변수를 갖는 관측값은 모델 훈련 과정에서 여전히 생략됩니다.

이전 릴리스에서는 누락값인 예측 변수가 포함된 훈련 관측값을 모델의 데이터 속성에서 제외했습니다.

R2022a: `Cost` 속성이 사용자가 지정한 비용 행렬을 저장함

R2022a부터는 사용자가 지정한 비용 행렬이 Cost 속성에 저장되므로, 지정된 비용 값을 사용하여 관측 오분류 비용을 계산할 수 있습니다. 소프트웨어는 비용 벌점을 반영하지 않도록 하면서 정규화한 사전 확률(Prior)과 관측값 가중치(W)를 저장합니다. 관측 오분류 비용을 계산하려면 loss 함수 또는 resubLoss 함수를 호출할 때 LossFun 이름-값 인수를 "classifcost"로 지정합니다.

모델 훈련이 변경되지 않았으므로 클래스 간 결정 경계도 변경되지 않았습니다.

훈련 시, 피팅 함수는 주어진 비용 행렬에 있는 벌점을 통합하여 주어진 사전 확률을 업데이트한 다음, 사전 확률과 관측값 가중치를 정규화합니다. 이 동작은 변경되지 않았습니다. 이전 릴리스에서는 소프트웨어가 디폴트 비용 행렬을 Cost 속성에 저장하고 훈련에 사용한 사전 확률과 관측값 가중치를 각각 Prior와 W 속성에 저장했습니다. R2022a부터는 사용자가 지정한 비용 행렬이 수정 없이 저장되고, 비용 벌점을 반영하지 않도록 하면서 정규화된 사전 확률과 관측값 가중치가 저장됩니다. 자세한 내용은 오분류 비용 행렬, 사전 확률 및 관측값 가중치 항목을 참조하십시오.

일부 객체 함수가 Cost, Prior 및 W 속성을 사용합니다.

loss 및 resubLoss 함수는 사용자가 LossFun 이름-값 인수를 "classifcost" 또는 "mincost"로 지정하면 Cost 속성에 저장된 비용 행렬을 사용합니다.
loss 및 edge 함수는 Prior 속성에 저장된 사전 확률을 사용하여 입력 데이터의 관측값 가중치를 정규화합니다.
resubLoss 및 resubEdge 함수는 W 속성에 저장된 관측값 가중치를 사용합니다.

분류 모델을 훈련할 때 디폴트가 아닌 비용 행렬을 지정하면 객체 함수는 이전 릴리스와 다른 값을 반환합니다.

소프트웨어가 비용 행렬, 사전 확률, 관측값 가중치를 이전 릴리스에서와 같은 방식으로 처리하게 하려면, 오분류 비용 행렬에 대한 사전 확률 및 관측값 가중치 조정하기의 설명에 따라 사전 확률과 관측값 가중치를 디폴트가 아닌 비용 행렬에 적합하게 조정하십시오. 분류 모델을 훈련할 때, 조정된 사전 확률과 관측값 가중치를 Prior와 Weights 이름-값 인수를 사용하여 지정하고 디폴트 비용 행렬을 사용하십시오.

참고 항목

fitcsvm | CompactClassificationSVM | ClassificationPartitionedModel

ClassificationSVM

설명

생성

속성

SVM 속성

Alpha — 훈련된 분류기 계수 읽기 전용: 숫자형 벡터

Beta — 선형 예측 변수 계수 읽기 전용: 숫자형 벡터

Bias — 편향 항 읽기 전용: 스칼라

BoxConstraints — 상자 제약 조건 읽기 전용: 숫자형 벡터

CacheInfo — 캐시 정보 읽기 전용: 구조체형 배열

IsSupportVector — 서포트 벡터 표시자 읽기 전용: 논리형 벡터

KernelParameters — 커널 모수 읽기 전용: 구조체형 배열

Nu — 단일 클래스 학습 모수 읽기 전용: 양의 스칼라

OutlierFraction — 이상값 비율 읽기 전용: 숫자형 스칼라

Solver — 최적화 루틴 읽기 전용: 'ISDA' | 'L1QP' | 'SMO'

SupportVectorLabels — 서포트 벡터 클래스 레이블 읽기 전용: s×1 숫자형 벡터

SupportVectors — 서포트 벡터 읽기 전용: s×p 숫자형 행렬

기타 분류 속성

CategoricalPredictors — 범주형 예측 변수의 인덱스 읽기 전용: 양의 정수로 구성된 벡터 | []

ClassNames — 고유한 클래스 레이블 읽기 전용: categorical형 배열 | 문자형 배열 | 논리형 벡터 | 숫자형 벡터 | 문자형 벡터로 구성된 셀형 배열

Cost — 오분류 비용 읽기 전용: 숫자형 정사각 행렬

ExpandedPredictorNames — 확장 예측 변수 이름 읽기 전용: 문자형 벡터로 구성된 셀형 배열

Gradient — 훈련 데이터 기울기 값 읽기 전용: 숫자형 벡터

ModelParameters — 모델 훈련에 사용되는 모수 읽기 전용: 객체

Mu — 예측 변수 평균 읽기 전용: 숫자형 벡터 | []

NumObservations — 관측값 개수 읽기 전용: 숫자형 스칼라

PredictorNames — 예측 변수 이름 읽기 전용: 문자형 벡터로 구성된 셀형 배열

Prior — 사전 확률 읽기 전용: 숫자형 벡터

ResponseName — 응답 변수 이름 읽기 전용: 문자형 벡터

RowsUsed — 저장된 원래 훈련 데이터의 행 읽기 전용: 논리형 벡터 | []

ScoreTransform — 점수 변환 방식 문자형 벡터 | 함수 핸들

Sigma — 예측 변수 표준편차 읽기 전용: [] (디폴트 값) | 숫자형 벡터

W — 관측값 가중치 읽기 전용: 숫자형 벡터

X — 표준화되지 않은 예측 변수 읽기 전용: 숫자형 행렬 | table형

Y — 클래스 레이블 읽기 전용: categorical형 배열 | 문자형 배열 | 논리형 벡터 | 숫자형 벡터 | 문자형 벡터로 구성된 셀형 배열

수렴 제어 속성

ConvergenceInfo — 수렴 정보 읽기 전용: 구조체형 배열

NumIterations — 반복 횟수 읽기 전용: 양의 정수

ShrinkagePeriod — 활성 세트 감소 간의 반복 횟수 읽기 전용: 음이 아닌 정수

하이퍼파라미터 최적화 속성

HyperparameterOptimizationResults — 하이퍼파라미터에 대한 교차 검증 최적화와 관련된 설명 읽기 전용: BayesianOptimization 객체 | table형

객체 함수

예제

SVM 분류기 훈련시키기

SVM 분류기를 훈련시키고 교차 검증하기

세부 정보

상자 제약 조건

그람 행렬(Gram matrix)

카루쉬-쿤-터커(Karush-Kuhn-Tucker) 상보성 조건

단일 클래스 학습

서포트 벡터

이진 분류를 위한 서포트 벡터 머신

알고리즘

참고 문헌

확장 기능

C/C++ 코드 생성 MATLAB® Coder™를 사용하여 C 코드나 C++ 코드를 생성할 수 있습니다.

GPU 배열 Parallel Computing Toolbox™를 사용해 GPU(그래픽스 처리 장치)에서 실행하여 코드 실행 속도를 높일 수 있습니다.

버전 내역

R2023b: 모델이 누락값인 예측 변수가 포함된 관측값을 저장함

R2022a: Cost 속성이 사용자가 지정한 비용 행렬을 저장함

참고 항목

도움말 항목

`Alpha` — 훈련된 분류기 계수
읽기 전용: 숫자형 벡터

`Beta` — 선형 예측 변수 계수
읽기 전용: 숫자형 벡터

`Bias` — 편향 항
읽기 전용: 스칼라

`BoxConstraints` — 상자 제약 조건
읽기 전용: 숫자형 벡터

`CacheInfo` — 캐시 정보
읽기 전용: 구조체형 배열

`IsSupportVector` — 서포트 벡터 표시자
읽기 전용: 논리형 벡터

`KernelParameters` — 커널 모수
읽기 전용: 구조체형 배열

`Nu` — 단일 클래스 학습 모수
읽기 전용: 양의 스칼라

`OutlierFraction` — 이상값 비율
읽기 전용: 숫자형 스칼라

`Solver` — 최적화 루틴
읽기 전용: `'ISDA'` | `'L1QP'` | `'SMO'`

`SupportVectorLabels` — 서포트 벡터 클래스 레이블
읽기 전용: s×1 숫자형 벡터

`SupportVectors` — 서포트 벡터
읽기 전용: s×p 숫자형 행렬

`CategoricalPredictors` — 범주형 예측 변수의 인덱스
읽기 전용: 양의 정수로 구성된 벡터 | `[]`

`ClassNames` — 고유한 클래스 레이블
읽기 전용: categorical형 배열 | 문자형 배열 | 논리형 벡터 | 숫자형 벡터 | 문자형 벡터로 구성된 셀형 배열

`Cost` — 오분류 비용
읽기 전용: 숫자형 정사각 행렬

`ExpandedPredictorNames` — 확장 예측 변수 이름
읽기 전용: 문자형 벡터로 구성된 셀형 배열

`Gradient` — 훈련 데이터 기울기 값
읽기 전용: 숫자형 벡터

`ModelParameters` — 모델 훈련에 사용되는 모수
읽기 전용: 객체

`Mu` — 예측 변수 평균
읽기 전용: 숫자형 벡터 | `[]`

`NumObservations` — 관측값 개수
읽기 전용: 숫자형 스칼라

`PredictorNames` — 예측 변수 이름
읽기 전용: 문자형 벡터로 구성된 셀형 배열

`Prior` — 사전 확률
읽기 전용: 숫자형 벡터

`ResponseName` — 응답 변수 이름
읽기 전용: 문자형 벡터

`RowsUsed` — 저장된 원래 훈련 데이터의 행
읽기 전용: 논리형 벡터 | `[]`

`ScoreTransform` — 점수 변환 방식
문자형 벡터 | 함수 핸들

`Sigma` — 예측 변수 표준편차
읽기 전용: `[]` (디폴트 값) | 숫자형 벡터

`W` — 관측값 가중치
읽기 전용: 숫자형 벡터

`X` — 표준화되지 않은 예측 변수
읽기 전용: 숫자형 행렬 | table형

`Y` — 클래스 레이블
읽기 전용: categorical형 배열 | 문자형 배열 | 논리형 벡터 | 숫자형 벡터 | 문자형 벡터로 구성된 셀형 배열

`ConvergenceInfo` — 수렴 정보
읽기 전용: 구조체형 배열

`NumIterations` — 반복 횟수
읽기 전용: 양의 정수

`ShrinkagePeriod` — 활성 세트 감소 간의 반복 횟수
읽기 전용: 음이 아닌 정수

`HyperparameterOptimizationResults` — 하이퍼파라미터에 대한 교차 검증 최적화와 관련된 설명
읽기 전용: `BayesianOptimization` 객체 | table형

C/C++ 코드 생성
MATLAB® Coder™를 사용하여 C 코드나 C++ 코드를 생성할 수 있습니다.

GPU 배열
Parallel Computing Toolbox™를 사용해 GPU(그래픽스 처리 장치)에서 실행하여 코드 실행 속도를 높일 수 있습니다.

R2022a: `Cost` 속성이 사용자가 지정한 비용 행렬을 저장함