relativeEntropy

클래스 분리도를 측정하기 위한 2개의 독립 데이터 그룹의 1차원 쿨백-라이블러 발산

구문

Z = relativeEntropy(X,I)

설명

relativeEntropy는 진단 특징 디자이너에서 생성된 코드에 사용되는 함수입니다.

Z = relativeEntropy(X,I)는 I의 논리형 레이블에 따라 그룹화된, 데이터 세트 X의 2개의 독립 서브셋에 대해 1차원 쿨백-라이블러 발산을 계산합니다. 상대 엔트로피는 데이터의 두 클래스(예: 정상 기계와 결함 있는 기계)를 분리할 수 있는 정도에 따라 특징에 순위를 지정하기 위한 메트릭을 제공합니다. 엔트로피 계산에서는 X의 데이터가 가우스 분포를 따르는 것으로 가정합니다.

진단 특징 디자이너에서 생성된 코드는 이 방법을 사용하여 특징에 순위를 지정할 때 relativeEntropy를 사용합니다.

입력 인수

모두 축소

`X` — 그룹화할 데이터 샘플
벡터 | 행렬

논리적으로 2개의 그룹으로 분류할 수 있는 데이터 샘플이 포함된 데이터 세트로, 단일 샘플 세트(예: 하나의 특징에 대한 값)가 있는 경우 벡터로 지정되고 여러 개의 샘플 세트가 있는 경우 행렬로 지정됩니다.

X에 n개 특징의 단일 세트(예: 단일 데이터 소스에서 추출된 여러 개의 특징)가 포함된 경우 X는 1×n 벡터입니다.
X에 n개 특징의 세트 m개가 포함된 경우 X는 m×n 행렬입니다. X의 각 행은 하나의 데이터 소스를 나타내며, 하나의 논리형 클래스에 대응되어야 합니다.

적합한 상대 엔트로피 값을 계산하기 위해 X는 I의 0 논리형 클래스에 대응하는 행과 1 논리형 클래스에 대응하는 행을 각각 적어도 2개씩 포함해야 합니다.

예를 들어, 20개의 기어박스 각각에 대한 5개의 특징으로 구성된 세트가 있고 상대 엔트로피를 계산하여 이러한 특징을 평가하려 한다고 가정하겠습니다. X는 20×5 행렬입니다. 각 행은 관련된 논리형 클래스 레이블 0 또는 1로 표시된, 정상 또는 결함 있는 기어박스를 나타냅니다. 최소 2개의 기어박스는 정상이어야 하고, 최소 2개의 기어박스는 결함이 있어야 합니다. 상대 엔트로피는 각 특징이 결함 있는 기어박스에 대한 데이터에서 정상 기어박스에 대한 데이터를 얼마나 잘 분리하는지 나타냅니다.

`I` — 논리형 분류 레이블
벡터 | 행렬

X의 행을 2개의 논리형 클래스 중 하나에 할당하는 논리형 분류 레이블로, 길이가 m인 벡터로 지정됩니다. 여기서 m은 X의 행 개수입니다.

예를 들어, X가 20개의 기어박스에 대응하는 20×5 행렬이라고 다시 한 번 가정하겠습니다. 처음 9개의 기어박스는 정상입니다. 나머지 11개의 기어박스는 결함이 있습니다. 정상 상태를 0으로 정의하고, 결함 상태를 1로 정의합니다. 그러면 I의 길이는 20이 됩니다. I의 처음 9개 레이블은 0이고, 나머지 11개의 레이블은 1입니다.

출력 인수

모두 축소

`Z` — 상대 엔트로피
스칼라 | 벡터

레이블이 지정된 두 그룹의 상대 엔트로피로, 스칼라나 벡터로 반환됩니다.

X가 벡터이면 Z는 스칼라입니다.
X가 행렬이면 relativeEntropy는 각 특징에 대해 별도로 거리를 계산합니다. Z는 길이가 n인 벡터가 됩니다. 여기서 n은 Z의 열 개수입니다.

relativeEntropy는 X에 있는 NaN 요소를 누락값으로 처리하고 이 요소들을 무시합니다.

참고 문헌

[1] Theodoridis, Sergios, and Konstantinos Koutroumbas. Pattern Recognition, 175–177. 2nd ed. Amsterdam; Boston: Academic Press, 2003.

버전 내역

R2020a에 개발됨

참고 항목

correlationWeightedScore | 진단 특징 디자이너

relativeEntropy

구문

설명

입력 인수

X — 그룹화할 데이터 샘플 벡터 | 행렬

I — 논리형 분류 레이블 벡터 | 행렬