kruskalwallis
크루스칼-왈리스 검정
구문
설명
는 행렬 p = kruskalwallis(x)x의 각 열에 있는 데이터가 동일한 분포에서 나온다는 귀무가설에 대해 크루스칼-왈리스 검정을 사용하여 p-값을 반환합니다. 대립가설은 모든 표본이 동일한 분포에서 나오지는 않는다는 것입니다. 크루스칼-왈리스 검정은 일원분산분석에 대한 비모수적 대안을 제공합니다. 자세한 내용은 크루스칼-왈리스 검정 항목을 참조하십시오.
는 검정의 p-값을 반환하면서 분산분석표와 상자 플롯을 표시하도록 하거나 표시하지 않도록 할 수 있습니다.p = kruskalwallis(x,group,displayopt)
예제
두 개의 서로 다른 정규 확률 분포 객체를 생성합니다. 첫 번째 분포는 mu = 0 및 sigma = 1이고, 두 번째 분포는 mu = 2 및 sigma = 1입니다.
pd1 = makedist('Normal'); pd2 = makedist('Normal','mu',2,'sigma',1);
이러한 두 개의 분포에서 난수를 생성하여 표본 데이터에 대한 행렬을 만듭니다.
rng('default'); % for reproducibility x = [random(pd1,20,2),random(pd2,20,1)];
x의 처음 두 열에는 첫 번째 분포에서 생성된 데이터가 있고, 세 번째 열에는 두 번째 분포에서 생성된 데이터가 있습니다.
x의 각 열에 있는 표본 데이터가 동일한 분포에서 나왔다는 귀무가설을 검정합니다.
p = kruskalwallis(x)


p = 3.6896e-06
반환된 값 p는 kruskalwallis가 1% 유의수준에서 모든 세 가지 데이터 표본이 동일한 분포에서 나온다는 귀무가설을 기각함을 나타냅니다. 분산분석표는 추가적인 검정 결과를 제공하고, 상자 플롯은 x의 각 열에 대한 요약 통계량을 시각적으로 보여줍니다.
두 개의 서로 다른 정규 확률 분포 객체를 생성합니다. 첫 번째 분포는 mu = 0 및 sigma = 1을 갖습니다. 두 번째 분포는 mu = 2 및 sigma = 1을 갖습니다.
pd1 = makedist('Normal'); pd2 = makedist('Normal','mu',2,'sigma',1);
이러한 두 개의 분포에서 난수를 생성하여 표본 데이터에 대한 행렬을 만듭니다.
rng('default'); % for reproducibility x = [random(pd1,20,2),random(pd2,20,1)];
x의 처음 두 열에는 첫 번째 분포에서 생성된 데이터가 있고, 세 번째 열에는 두 번째 분포에서 생성된 데이터가 있습니다.
x의 각 열에 있는 표본 데이터가 동일한 분포에서 나왔다는 귀무가설을 검정합니다. 출력값 표시를 차단하고 추가 검정에 사용할 구조체 stats를 생성합니다.
[p,tbl,stats] = kruskalwallis(x,[],'off')p = 3.6896e-06
tbl=4×6 cell array
{'Source' } {'SS' } {'df'} {'MS' } {'Chi-sq' } {'Prob>Chi-sq'}
{'Columns'} {[7.6311e+03]} {[ 2]} {[3.8155e+03]} {[ 25.0200]} {[ 3.6896e-06]}
{'Error' } {[1.0364e+04]} {[57]} {[ 181.8228]} {0×0 double} {0×0 double }
{'Total' } {[ 17995]} {[59]} {0×0 double } {0×0 double} {0×0 double }
stats = struct with fields:
gnames: [3×1 char]
n: [20 20 20]
source: 'kruskalwallis'
meanranks: [26.7500 18.9500 45.8000]
sumt: 0
반환된 값 p는 검정이 1% 유의수준에서 귀무가설을 기각함을 나타냅니다. 구조체 stats를 사용하여 추가 후속 검정을 수행할 수도 있습니다. 셀형 배열 tbl에는 그래픽 분산분석표와 동일한 데이터가 포함되어 있습니다(열과 행 레이블 포함).
다른 분포에서 나온 데이터 표본이 어느 표본인지를 식별하기 위해 후속 검정을 수행합니다.
c = multcompare(stats);
Note: Intervals can be used for testing but are not simultaneous confidence intervals.

여러 개의 비교 결과를 테이블로 표시합니다.
tbl = array2table(c,"VariableNames", ... ["Group A","Group B","Lower Limit","A-B","Upper Limit","P-value"])
tbl=3×6 table
Group A Group B Lower Limit A-B Upper Limit P-value
_______ _______ ___________ ______ ___________ __________
1 2 -5.1435 7.8 20.744 0.33446
1 3 -31.994 -19.05 -6.1065 0.0016282
2 3 -39.794 -26.85 -13.906 3.4768e-06
결과는 그룹 1과 3 사이에 유의미한 차이가 있음을 나타내므로, 이 검정은 두 그룹의 데이터가 동일한 분포에서 나왔다는 귀무가설을 기각합니다. 그룹 2와 3에서도 마찬가지입니다. 그러나 그룹 1과 2 사이에 유의미한 차이가 없으므로, 이 검정은 두 그룹이 동일한 분포에서 나왔다는 귀무가설을 기각하지 않습니다. 따라서 이러한 결과는 그룹 1과 2의 데이터는 동일한 분포에서 나왔고, 그룹 3의 데이터는 다른 분포에서 나왔다는 것을 의미합니다.
금속 빔 강도의 측정값을 포함하는 벡터 strength를 생성합니다. 해당 빔이 만들어진 금속 합금의 유형을 나타내는 두 번째 벡터 alloy를 만듭니다.
strength = [82 86 79 83 84 85 86 87 74 82 ... 78 75 76 77 79 79 77 78 82 79]; alloy = {'st','st','st','st','st','st','st','st',... 'al1','al1','al1','al1','al1','al1',... 'al2','al2','al2','al2','al2','al2'};
세 가지 합금 모두에서 빔 강도 측정값이 동일한 분포를 갖는다는 귀무가설을 검정합니다.
p = kruskalwallis(strength,alloy,'off')p = 0.0018
반환된 값 p는 검정이 1% 유의수준에서 귀무가설을 기각함을 나타냅니다.
입력 인수
가설검정에 대한 표본 데이터로, 벡터 또는 m×n 행렬로 지정됩니다. x가 m×n 행렬이면, n개의 각 열은 m개의 상호 독립적 관측값을 포함하는 독립 표본을 나타냅니다.
데이터형: single | double
그룹화 변수로, 숫자형 또는 논리형 벡터, 문자형 또는 string형 배열로 지정되거나 문자형 벡터로 구성된 셀형 배열로 지정됩니다.
x가 벡터이면,group의 각 요소는x에 있는 대응 요소가 속한 그룹을 식별해 주며,group은x와 동일한 길이의 벡터여야 합니다.group의 행에 빈 값이 있는 경우 해당 행과x에 있는 대응 관측값은 무시됩니다.x또는group의NaN값도 마찬가지로 무시됩니다.x가 행렬이면,x의 각 열은 서로 다른 그룹을 나타내며, 이러한 열의 레이블은group을 사용하여 지정할 수 있습니다.group의 요소 개수와x의 열 개수는 동일해야 합니다.
group에 포함된 레이블은 상자 플롯에 주석으로 표시됩니다.
예: {'red','blue','green','blue','red','blue','green','green','red'}
데이터형: single | double | logical | char | string | cell
표시 옵션으로, 'on' 또는 'off'로 지정됩니다. displayopt가 'on'인 경우 kruskalwallis는 다음과 같은 그림을 표시합니다.
x에 있는 데이터의 순위를 기반으로 계산된 제곱합, 자유도 및 기타 수량을 포함하는 분산분석표.데이터 행렬
x의 각 열에 있는 데이터에 대한 상자 플롯. 상자 플롯은 순위가 아닌 실제 데이터 값을 기반으로 합니다.
displayopt가 'off'인 경우 kruskalwallis는 이러한 그림을 표시하지 않습니다.
displayopt에 값을 지정하는 경우 group에도 값을 지정해야 합니다. 그룹화 변수가 없는 경우 group을 []로 지정하십시오.
예: 'off'
출력 인수
검정의 p-값으로, [0,1] 범위 내에 있는 스칼라 값으로 반환됩니다. p는 귀무가설 하의 관측값과 같거나 그보다 더 극단적인 검정 통계량이 관측될 확률입니다. p 값이 작으면 귀무가설이 유효하지 않을 수 있음을 나타냅니다.
검정 결과의 분산분석표(ANOVA table)로, 셀형 배열로 반환됩니다. tbl은 x의 데이터 순위를 기반으로 계산된 제곱합, 자유도 및 기타 수량과 열 및 행 레이블도 포함합니다.
검정 데이터로, 구조체로 반환됩니다. multcompare를 사용하고 stats를 입력값으로 사용하여 표본 중앙값 쌍에 대한 후속 다중 비교 검정을 수행할 수 있습니다.
세부 정보
크루스칼-왈리스 검정은 기존 일원분산분석의 비모수적 기법으로, 윌콕슨 순위합 검정을 두 개 이상의 그룹으로 확장한 것입니다. 크루스칼-왈리스 검정은 두 개 이상의 그룹이 있는 데이터에 유효합니다. 이 검정은 x의 데이터 그룹의 중앙값을 비교하여 표본이 동일한 모집단 또는 동일한 분포를 가진 서로 다른 모집단에서 나왔는지 확인합니다.
크루스칼-왈리스 검정은 숫자형 값이 아닌 데이터의 순위를 사용하여 검정 통계량을 계산합니다. 이 검정은 모든 그룹에서 가장 작은 값부터 가장 큰 값 순으로 데이터를 정렬하고 이 정렬의 숫자 인덱스를 사용하여 순위를 구합니다. 동점 관측값(tied observation)의 순위는 그와 동점인 모든 관측값의 평균 순위입니다. 기존 일원분산분석에서 사용하는 F-통계량은 카이제곱 통계량으로 대체되며 p-값은 카이제곱 통계량의 유의성을 측정합니다.
크루스칼-왈리스 검정은 그룹 효과로 인해 위치가 다를 수 있다는 점을 제외하고 동일한 연속 분포를 가진 모집단에서 모든 표본이 나왔으며 모든 관측값이 상호 독립적이라고 가정합니다. 반대로, 기존 일원분산분석은 첫 번째 가정을 모집단이 정규분포를 가진다는 더 강력한 가정으로 대체합니다.
버전 내역
R2006a 이전에 개발됨
MATLAB Command
You clicked a link that corresponds to this MATLAB command:
Run the command by entering it in the MATLAB Command Window. Web browsers do not support MATLAB commands.
웹사이트 선택
번역된 콘텐츠를 보고 지역별 이벤트와 혜택을 살펴보려면 웹사이트를 선택하십시오. 현재 계신 지역에 따라 다음 웹사이트를 권장합니다:
또한 다음 목록에서 웹사이트를 선택하실 수도 있습니다.
사이트 성능 최적화 방법
최고의 사이트 성능을 위해 중국 사이트(중국어 또는 영어)를 선택하십시오. 현재 계신 지역에서는 다른 국가의 MathWorks 사이트 방문이 최적화되지 않았습니다.
미주
- América Latina (Español)
- Canada (English)
- United States (English)
유럽
- Belgium (English)
- Denmark (English)
- Deutschland (Deutsch)
- España (Español)
- Finland (English)
- France (Français)
- Ireland (English)
- Italia (Italiano)
- Luxembourg (English)
- Netherlands (English)
- Norway (English)
- Österreich (Deutsch)
- Portugal (English)
- Sweden (English)
- Switzerland
- United Kingdom (English)