Main Content

cophenet

코페네틱(Cophenetic) 상관 계수

구문

c = cophenet(Z,Y)
[c,d] = cophenet(Z,Y)

설명

c = cophenet(Z,Y)Z로 표시되는 계층적 군집 트리에 대한 코페네틱 상관 계수를 계산합니다. Zlinkage 함수의 출력입니다. Ypdist 함수의 출력으로 Z를 구성하는 데 사용되는 거리 또는 비유사성을 포함합니다. Z는 크기가 (m–1)×3인 행렬이며, 세 번째 열에 거리 정보가 있습니다. Y는 크기가 m*(m–1)/2인 벡터입니다.

[c,d] = cophenet(Z,Y)Y와 동일한 하부 삼각 거리 벡터 형식으로 코페네틱 거리 d를 반환합니다.

군집 트리에 대한 코페네틱 상관은 트리에서 구한 코페네틱 거리와 트리를 구성하는 데 사용된 원래 거리(또는 비유사성) 간의 선형 상관 계수로 정의됩니다. 따라서 이 상관 계수로 트리가 관측값 간의 비유사성을 얼마나 충실하게 나타내는지 측정할 수 있습니다.

두 관측값 사이의 코페네틱 거리는 두 관측값이 처음 결합되는 연결의 높이로 덴드로그램에 표시됩니다. 이 높이는 해당 연결에 의해 병합되는 두 하위 군집 사이의 거리입니다.

출력값 c는 코페네틱 상관 계수입니다. 품질이 우수한 해의 경우 이 값의 크기가 1에 매우 가깝습니다. 이 측정을 사용하여 다양한 알고리즘으로 구한 대체 군집 해를 비교할 수 있습니다.

Z(:,3)Y 사이의 코페네틱 상관은 다음과 같이 정의됩니다.

c=i<j(Yijy)(Zijz)i<j(Yijy)2i<j(Zijz)2

여기서

  • YijY에서 객체 ij 사이의 거리입니다.

  • ZijZ(:,3)을 기준으로 한 객체 ij 사이의 코페네틱 거리입니다.

  • yz는 각각 YZ(:,3)의 평균입니다.

예제

X = [rand(10,3); rand(10,3)+1; rand(10,3)+2];
Y = pdist(X);
Z = linkage(Y,'average');

% Compute Spearman's rank correlation between the
% dissimilarities and the cophenetic distances
[c,D] = cophenet(Z,Y);
r = corr(Y',D','type','spearman')
r =
   0.8279 

버전 내역

R2006a 이전에 개발됨