cophenet
코페네틱(Cophenetic) 상관 계수
구문
c = cophenet(Z,Y)
[c,d] = cophenet(Z,Y)
설명
c = cophenet(Z,Y)
는 Z
로 표시되는 계층적 군집 트리에 대한 코페네틱 상관 계수를 계산합니다. Z
는 linkage
함수의 출력입니다. Y
는 pdist
함수의 출력으로 Z
를 구성하는 데 사용되는 거리 또는 비유사성을 포함합니다. Z
는 크기가 (m–1)×3인 행렬이며, 세 번째 열에 거리 정보가 있습니다. Y
는 크기가 m*(m–1)/2인 벡터입니다.
[c,d] = cophenet(Z,Y)
는 Y
와 동일한 하부 삼각 거리 벡터 형식으로 코페네틱 거리 d
를 반환합니다.
군집 트리에 대한 코페네틱 상관은 트리에서 구한 코페네틱 거리와 트리를 구성하는 데 사용된 원래 거리(또는 비유사성) 간의 선형 상관 계수로 정의됩니다. 따라서 이 상관 계수로 트리가 관측값 간의 비유사성을 얼마나 충실하게 나타내는지 측정할 수 있습니다.
두 관측값 사이의 코페네틱 거리는 두 관측값이 처음 결합되는 연결의 높이로 덴드로그램에 표시됩니다. 이 높이는 해당 연결에 의해 병합되는 두 하위 군집 사이의 거리입니다.
출력값 c
는 코페네틱 상관 계수입니다. 품질이 우수한 해의 경우 이 값의 크기가 1에 매우 가깝습니다. 이 측정을 사용하여 다양한 알고리즘으로 구한 대체 군집 해를 비교할 수 있습니다.
Z(:,3)
과 Y
사이의 코페네틱 상관은 다음과 같이 정의됩니다.
여기서
Yij는
Y
에서 객체 i와 j 사이의 거리입니다.Zij는
Z(:,3)
을 기준으로 한 객체 i와 j 사이의 코페네틱 거리입니다.y와 z는 각각
Y
와Z(:,3)
의 평균입니다.
예제
X = [rand(10,3); rand(10,3)+1; rand(10,3)+2]; Y = pdist(X); Z = linkage(Y,'average'); % Compute Spearman's rank correlation between the % dissimilarities and the cophenetic distances [c,D] = cophenet(Z,Y); r = corr(Y',D','type','spearman') r = 0.8279
버전 내역
R2006a 이전에 개발됨
참고 항목
cluster
| dendrogram
| inconsistent
| linkage
| pdist
| squareform