Main Content

이 페이지의 최신 내용은 아직 번역되지 않았습니다. 최신 내용은 영문으로 볼 수 있습니다.

ranksum

윌콕슨 순위합 검정(Wilcoxon rank sum test)

설명

예제

p = ranksum(x,y)는 양측 윌콕슨 순위합 검정의 p-값을 반환합니다. ranksum은 'xy의 데이터가 중앙값이 같은 연속 분포에서 추출된 표본이다'는 귀무가설을 '그렇지 않다'는 대립가설에 대해 검정합니다. 이 검정에서는 두 표본이 서로 독립적이라고 가정합니다. xy는 길이가 서로 다를 수 있습니다.

이 검정은 만-위트니 U 검정(Mann-Whitney U-test)과 일치합니다.

예제

[p,h] = ranksum(x,y)는 검정 결과를 나타내는 논리값도 반환합니다. 결과 h = 1은 귀무가설을 기각함을 나타내고, h = 0은 5% 유의수준에서 귀무가설을 기각하지 않음을 나타냅니다.

예제

[p,h,stats] = ranksum(x,y)는 검정 통계량에 대한 정보를 포함하는 구조체 stats도 반환합니다.

예제

[___] = ranksum(x,y,Name,Value)는 하나 이상의 Name,Value 쌍 인수를 추가 옵션으로 지정하여 순위합 검정에 대해 위에 열거된 구문에 나와 있는 출력 인수를 반환합니다.

예제

모두 축소

서로 독립적인 두 개의 크기가 다른 표본에 대한 중앙값이 동일하다는 가설을 검정합니다.

표본 데이터를 생성합니다.

rng('default') % for reproducibility
x = unifrnd(0,1,10,1);
y = unifrnd(0.25,1.25,15,1);

이들 표본은 해당 위치에서 0.25만큼 이동되는 것을 제외하고는 동일한 분포를 갖는 모집단에서 추출됩니다.

xy의 중앙값이 동일한지 여부를 검정합니다.

p = ranksum(x,y)
p = 0.0375

p-값이 0.0375이면 ranksum이 디폴트 5% 유의수준에서 중앙값이 동일하다는 귀무가설을 기각함을 나타냅니다.

두 모집단의 중앙값들이 동일한지에 대한 검정 통계량을 구합니다.

표본 데이터를 불러옵니다.

load mileage

첫 번째 유형의 자동차와 두 번째 유형의 자동차에 대해 주행거리(mpg)가 동일한지 여부를 검정합니다.

[p,h,stats] = ranksum(mileage(:,1),mileage(:,2))
p = 0.0043
h = logical
   1

stats = struct with fields:
    ranksum: 21.5000

p-값이 0.043이고 h = 1이므로 디폴트 5% 유의수준에서 중앙값이 동일하다는 귀무가설이 기각됨을 나타냅니다. 표본 크기가 작으므로(각각 6개) ranksum은 정확한(Exact) 방법을 사용하여 p-값을 계산합니다. 구조체 stats는 순위합 검정 통계량의 값만 포함합니다.

모집단 중앙값이 증가한다는 가설을 검정합니다.

표본 데이터를 불러옵니다.

load('weather.mat');

날씨 데이터는 2년 연속으로 같은 달에 측정한 일일 최고 기온을 보여줍니다.

1% 유의수준에서 중앙값이 증가하는지를 평가하는 왼쪽 검정을 수행합니다.

[p,h,stats] = ranksum(year1,year2,'alpha',0.01,...
'tail','left')
p = 0.1271
h = logical
   0

stats = struct with fields:
       zval: -1.1403
    ranksum: 837.5000

p-값 0.1271 및 h = 0은 귀무가설을 기각하기 위한 충분한 증거가 없음을 나타내며, 1% 유의수준에서 첫 해와 둘째 해의 같은 달에 관측된 최고 온도의 중앙값이 오른쪽으로 이동되었다는 결론을 내립니다. ranksum은 표본 크기가 크기 때문에 근사(Approximate) 방법을 사용하여 p-값을 계산합니다.

정확한(Exact) 방법을 사용하여 p-값을 계산합니다.

[p,h,stats] = ranksum(year1,year2,'alpha',0.01,...
'tail','left','method','exact')
p = 0.1273
h = logical
   0

stats = struct with fields:
    ranksum: 837.5000

근사 방법과 정확한 방법의 결과는 서로 일치합니다.

입력 인수

모두 축소

표본 데이터로, 벡터로 지정됩니다.

데이터형: single | double

표본 데이터로, 벡터로 지정됩니다. y의 길이는 x의 길이와 같지 않아도 됩니다.

데이터형: single | double

이름-값 쌍의 인수

선택적으로 Name,Value 인수가 쉼표로 구분되어 지정됩니다. 여기서 Name은 인수 이름이고 Value는 대응값입니다. Name은 따옴표 안에 표시해야 합니다. Name1,Value1,...,NameN,ValueN과 같이 여러 개의 이름-값 쌍의 인수를 어떤 순서로든 지정할 수 있습니다.

예: 'alpha',0.01,'method','approximate','tail','right'는 1% 유의수준에서 p-값 근삿값을 반환하는 오른쪽 꼬리 순위합 검정을 지정합니다.

가설검정의 결정에 대한 유의수준으로, 'alpha'와 함께 범위 0~1 사이의 스칼라 값이 쉼표로 구분되어 지정됩니다. h의 유의수준은 100 * alpha%입니다.

예: 'alpha', 0.01

데이터형: double | single

p-값 p를 계산하는 방법으로, 'method'와 함께 다음 중 하나가 쉼표로 구분되어 지정됩니다.

'exact'정확히 p-값 p를 계산합니다.
'approximate'정규 근사하여 p-값 p를 계산합니다.

'method'가 지정되지 않은 경우 디폴트 값은 다음과 같습니다.

  • min(nx,ny) < 10이고 nx + ny < 20인 경우 'exact'

  • 그렇지 않은 경우 'approximate'

nx 및 ny는 각각 xy에 포함된 표본 크기입니다.

예: 'method','exact'

검정 유형으로, 'tail'과 함께 다음 중 하나가 쉼표로 구분되어 지정됩니다.

'both'양측 가설검정. 대립 가설은 'xy의 중앙값이 서로 다르다'입니다. 'tail'이 지정되지 않은 경우 디폴트 검정 유형입니다.
'right'오른쪽 꼬리 가설검정. 대립가설은 'x의 중앙값이 y의 중앙값보다 크다'입니다.
'left'왼쪽 꼬리 가설검정. 대립가설은 'x의 중앙값이 y의 중앙값보다 작다'입니다.

예: 'tail','left'

출력 인수

모두 축소

검정의 p-값으로, 0에서 1 사이의 양의 스칼라로 반환됩니다. p는 귀무가설 하의 관측값과 같거나 그보다 큰 극단적인 검정 통계량이 관측될 확률입니다. ranksum은 가장 유의미한 단측 값에 두 배를 곱하여 양측 p-값을 계산합니다.

가설검정의 결과로, 논리값으로 반환됩니다.

  • h = 1이면 100 * alpha% 유의수준에서 귀무가설이 기각됨을 나타냅니다.

  • h = 0이면 100 * alpha% 유의수준에서 귀무가설이 기각되지 않음을 나타냅니다.

검정 통계량으로, 구조체로 반환됩니다. stats에 저장되는 검정 통계량은 다음과 같습니다.

  • ranksum : 순위합 검정 통계량의 값

  • zval: z-통계량의 값('method''approximate'인 경우 계산됨)

세부 정보

모두 축소

윌콕슨 순위합 검정

윌콕슨 순위합 검정(Wilcoxon rank sum test)은 표본이 서로 독립적인 경우 두 모집단에 대한 비모수적 검정입니다. XY가 표본 크기가 서로 다른 독립적인 표본인 경우 ranksum이 반환하는 검정 통계량은 첫 번째 표본의 순위합입니다.

윌콕슨 순위합 검정은 만-위트니 U 검정(Mann-Whitney U-test)과 일치합니다. 만-위트니 U 검정은 두 개의 독립 표본 XY의 모집단 중앙값이 동일한지 여부를 평가하는 비모수적 검정입니다.

만-위트니 U 검정 통계량 U는 두 개의 독립 표본 XY의 요소 정렬에서 y가 x 앞에 오는 횟수입니다. 이 값은 다음과 같이 윌콕슨 순위합 통계량과 관련이 있습니다. X가 크기가 nX인 표본이면 다음과 같습니다.

U=WnX(nX+1)2.

z-통계량

대규모 표본에 대해 ranksum은 z-통계량을 사용하여 검정에 대한 p-값의 근삿값을 계산합니다.

XY가 크기가 nX 및 nY인 두 개의 독립 표본인 경우 z-통계량은 다음과 같습니다(여기서 nX < nY임).

z=WE(W)V(W)=W[nXnY+nX(nX+1)2]0.5sign(WE(W))nXnY(nX+nY+1)tiescor12,

여기에는 연속성 수정과 동순위(Tie) 조정이 적용됩니다. tiescor은 다음으로 지정됩니다.

tiescor=2tieadj(nX+nY)(nX+nY1),

여기서 ranksum[ranks,tieadj] = tiedrank(x,y)를 사용하여 동순위 조정값을 구합니다. 표준 정규분포는 이 z-통계량에 대한 p-값을 제공합니다.

알고리즘

ranksumxy에 있는 NaN을 결측값으로 처리하여 무시합니다.

서로 다른 표본 크기를 갖는 중앙값에 대한 양측 검정의 경우, ranksum이 반환하는 검정 통계량은 첫 번째 표본의 순위합입니다.

참고 문헌

[1] Gibbons, J. D., and S. Chakraborti. Nonparametric Statistical Inference, 5th Ed., Boca Raton, FL: Chapman & Hall/CRC Press, Taylor & Francis Group, 2011.

[2] Hollander, M., and D. A. Wolfe. Nonparametric Statistical Methods. Hoboken, NJ: John Wiley & Sons, Inc., 1999.

R2006a 이전에 개발됨