clusterdata
데이터로부터 병합 군집 생성
구문
설명
는 위에 열거된 구문에 나와 있는 입력 인수 조합 외에 하나 이상의 이름-값 인수를 사용하여 옵션을 지정합니다. 예를 들어 T = clusterdata(___,Name=Value)clusterdata(X,MaxClust=5,Depth=3)을 지정하면 각 노드 아래 깊이 3까지의 거리 값을 계산하여 최대 5개의 군집을 찾을 수 있습니다.
예제
입력 인수
이름-값 인수
출력 인수
팁
Linkage가"centroid"또는"median"인 경우linkage는 단조적(Monotonic)이지 않은 군집 트리를 생성할 수 있습니다. 이 결과는 두 군집 r과 s의 합집합에서 세 번째 군집까지의 거리가 r과 s 간의 거리보다 작을 경우에 발생합니다. 이 경우, 디폴트 방향으로 그린 덴드로그램에서 리프로부터 루트 노드까지의 경로는 아래쪽 방향의 일부 단계를 지나게 됩니다. 이 결과를 방지하려면Linkage를 다른 값으로 지정하십시오. 다음 이미지는 비단조적 군집 트리를 나타냅니다.
이 경우, 군집 1과 군집 3이 새 군집으로 결합되며, 이 새 군집과 군집 2 간의 거리는 군집 1과 군집 3 간의 거리보다 작습니다.
알고리즘
선택적 이름-값 인수를 지정하지 않으면 clusterdata 함수는 다음 단계를 수행합니다.
pdist를 사용하여X의 관측값 쌍 간 유클리드 거리 벡터를 생성합니다.Y =pdist(X,"euclidean")군집 간 최단 거리를 계산하는
"single"방법을 지정해서linkage를 사용하여Y에서 계층적 병합 군집 트리를 생성합니다.Z =linkage(Y,"single")cutoff를 지정하면clusterdata함수는 불일치 값이cutoff보다 작을 경우cluster를 사용하여Z에서 군집을 정의합니다.T=cluster(Z,Cutoff=cutoff)maxclust를 지정하면clusterdata함수는cluster를 사용하여Z에서 최대maxclust개의 군집을 찾고"distance"를 군집 정의의 기준으로 사용합니다.T= cluster(Z,MaxClust=maxclust)
대체 기능
계층적 군집 트리 Z(입력 데이터 행렬 X에 대해 linkage 함수를 사용하여 생성된 출력 결과)가 있는 경우, cluster를 사용하여 Z에 대한 병합 군집화를 수행하고 X의 각 관측값(행)에 대한 군집 할당을 반환할 수 있습니다.


