주요 콘텐츠

그룹 거리

그룹 거리를 선택하여 각 상태 레이블 쌍에 대해 데이터 그룹 간의 분리를 확인합니다. 이 분리 메트릭(KS 통계량)은 특징이 예를 들어 결함 데이터와 정상 데이터를 구분하는 데 수치적으로 얼마만큼 효과적인지를 나타냅니다.

여러 색 그룹의 데이터가 결합되면 히스토그램을 해석하기가 어려워지기 때문에 그룹 거리는 하나의 상태 변수에 대해 셋 이상의 레이블이 있는 경우에 특히 유용합니다.

특징에 대한 그룹화 표시에서 검토하려는 특징을 선택합니다. 표에 각 레이블 쌍에 대한 KS 통계량이 표시됩니다. 이 통계량의 범위는 0~1입니다.

  • 값이 0이면 데이터 그룹이 완전히 혼합되었으며 따라서 상태 값이 완전히 모호함을 의미합니다. 관련 특징에는 이 데이터에 대한 구분 능력이 없습니다.

  • 값이 1이면 데이터 그룹이 잘 분리되었으며 관련 특징에 이 데이터에 대한 완전한 구분 능력이 있음을 의미합니다.

추가 정보

KS 통계량은 2-표본 콜모고로프-스미르노프 검정을 사용하여 두 상태의 분포의 누적 분포 함수가 얼마나 잘 분리되었는지를 나타냅니다. 이 검정에 대한 자세한 내용은 kstest2를 참조하십시오.