Main Content

이 페이지의 최신 내용은 아직 번역되지 않았습니다. 최신 내용은 영문으로 볼 수 있습니다.

signrank

윌콕슨 부호 순위 검정

설명

예제

p = signrank(x)는 양측 윌콕슨 부호 순위 검정의 p-값을 반환합니다.

signrank는 5% 유의수준에서 '벡터 x의 데이터가 중앙값이 0인 분포에서 추출된다'는 귀무가설을 검정합니다. 이 검정은 x의 데이터가 중앙값을 중심으로 대칭인 연속 분포에서 추출된다고 가정합니다.

예제

p = signrank(x,y)는 'xy가 중앙값이 0인 분포에서 추출된다'는 귀무가설에 대한 대응표본 양측 검정의 p-값을 반환합니다.

p = signrank(x,y,Name,Value)는 하나 이상의 Name,Value 쌍 인수로 지정된 추가 옵션을 사용하여 부호 검정에 대한 p-값을 반환합니다.

[p,h] = signrank(___)는 검정 결과를 나타내는 논리값도 반환합니다. h = 1은 귀무가설을 기각함을 나타내고, h = 0은 5% 유의수준에서 귀무가설을 기각하지 않음을 나타냅니다. 위에 열거된 구문의 모든 입력 인수와 사용할 수 있습니다.

예제

[p,h,stats] = signrank(___)는 검정 통계량에 대한 정보를 포함하는 구조체 stats도 반환합니다.

예제

[___] = signrank(x,m)은 'x의 데이터가 중앙값이 m인 분포의 관측값이다'라는 귀무가설에 대해 위에 열거된 구문에 나와 있는 출력 인수를 반환합니다.

예제

[___] = signrank(x,m,Name,Value)는 하나 이상의 Name,Value 쌍 인수를 추가 옵션으로 지정하여 부호 순위 검정에 대해 위에 열거된 구문에 나와 있는 출력 인수를 반환합니다.

예제

모두 축소

중앙값이 0이라는 가설을 검정합니다.

표본 데이터를 생성합니다.

rng('default') % for reproducibility
x = randn(1,25) + 1.30;

'x의 데이터의 중앙값이 0이다'라는 가설을 검정합니다.

[p,h] = signrank(x)
p = 3.2229e-05
h = logical
   1

5% 유의수준에서, h = 1이면 검정이 '중앙값이 0이다'라는 귀무가설을 기각함을 나타냅니다.

'대응 표본의 차이의 중앙값이 0이다'라는 가설을 검정합니다.

표본 데이터를 생성합니다.

rng('default') % for reproducibility
x = lognrnd(2,.25,10,1);
y = x + trnd(2,10,1);

'xy의 중앙값이 0이다'라는 가설을 검정합니다.

[p,h] = signrank(x,y)
p = 0.3223
h = logical
   0

결과는 5% 유의수준에서 검정이 '차이의 중앙값이 0이다'라는 귀무가설을 기각하지 않음을 나타냅니다.

근사를 사용하여 대규모 표본에 대해 양측 검정을 수행합니다.

표본 데이터를 불러옵니다.

load('gradespaired.mat');

'보충 학습 프로그램에 참여하기 전과 참여한 후의 학생들의 성적 차이의 중앙값이 0이다'라는 귀무가설을 '중앙값이 0보다 작다'는 대립가설에 대해 검정합니다.

[p,h,stats] = signrank(gradespaired(:,1),...
		gradespaired(:,2),'tail','left')
p = 0.0047
h = logical
   1

stats = struct with fields:
          zval: -2.5982
    signedrank: 2.0175e+03

표본 크기가 15보다 크므로 signrank는 근사 방법을 사용하여 p-값을 계산하고 z-통계량의 값도 반환합니다. h = 1은 검정이 5% 유의수준에서 '성적 중앙값에 차이가 없다'는 귀무가설을 기각함을 나타냅니다. 학습 지도 프로그램 전의 성적 중앙값이 학습 지도 프로그램 후의 성적 중앙값보다 작다는 결론을 내리기에 충분한 통계적 증거가 존재합니다.

정확한 방법을 사용하여 검정을 반복합니다.

[p,h,stats] = signrank(gradespaired(:,1),gradespaired(:,2),...
		'tail','left','method','exact')
p = 0.0045
h = logical
   1

stats = struct with fields:
    signedrank: 2.0175e+03

근사 방법을 사용하여 얻은 결과와 정확한 방법을 사용하여 얻은 결과가 서로 일치합니다.

표본 데이터를 불러옵니다.

load mileage

데이터는 1~3열에 서로 다른 세 가지 유형의 차량에 대한 주행거리(mpg)를 포함합니다.

'2열에 있는 차량 유형에 대한 주행거리 중앙값이 33이 아니다'는 가설을 검정합니다.

[p,h,stats] = signrank(mileage(:,2),33)
p = 0.0313
h = logical
   1

stats = struct with fields:
    signedrank: 21

결과는 5% 유의수준에서 '두 번째 차량 유형의 주행거리 중앙값이 33이 아니다'를 나타냅니다. signrank는 소규모 표본에 대해 정확한 방법을 사용하여 p-값을 계산하고 z-통계량은 반환하지 않습니다.

signrank의 이름-값 쌍의 인수를 사용합니다.

표본 데이터를 불러옵니다.

load mileage

데이터는 1~3열에 서로 다른 세 가지 유형의 차량에 대한 주행거리(mpg)를 포함합니다.

'2행에 있는 차량 유형에 대한 주행거리 중앙값이 33보다 크다'는 가설을 검정합니다.

[p,h,stats] = signrank(mileage(:,2),33,'tail','right')
p = 0.0156
h = logical
   1

stats = struct with fields:
    signedrank: 21

근사 방법을 사용하여 1% 유의수준에서 동일한 검정을 반복합니다.

[p,h,stats] = signrank(mileage(:,2),33,'tail','right',...
'alpha',0.01,'method','approximate')
p = 0.0180
h = logical
   0

stats = struct with fields:
          zval: 2.0966
    signedrank: 21

결과 h = 0은 1% 유의수준에서 귀무가설을 기각할 수 없음을 나타냅니다.

입력 인수

모두 축소

표본 데이터로, 벡터로 지정됩니다.

데이터형: single | double

표본 데이터로, 벡터로 지정됩니다. yx와 길이가 동일해야 합니다.

데이터형: single | double

중앙값의 가정된 값으로, 스칼라로 지정됩니다.

예: signrank(x,10)

데이터형: single | double

이름-값 쌍의 인수

선택적으로 Name,Value 인수가 쉼표로 구분되어 지정됩니다. 여기서 Name은 인수 이름이고 Value는 대응값입니다. Name은 따옴표 안에 표시해야 합니다. Name1,Value1,...,NameN,ValueN과 같이 여러 개의 이름-값 쌍의 인수를 어떤 순서로든 지정할 수 있습니다.

예: 'alpha',0.01,'method','approximate','tail','right'는 1% 유의수준에서 p-값 근삿값을 반환하는 오른쪽 꼬리 부호 순위 검정을 지정합니다.

가설검정의 결정에 대한 유의수준으로, 'alpha'와 함께 범위 0~1 사이의 스칼라 값이 쉼표로 구분되어 지정됩니다. h의 유의수준은 100 * alpha%입니다.

예: 'alpha', 0.01

데이터형: double | single

p를 계산하는 방법으로, 'method'와 함께 다음 중 하나가 쉼표로 구분되어 지정됩니다.

'exact'정확히 p-값 p를 계산합니다. method를 지정하지 않았고 x, xm 또는 xy의 관측값이 15개 이하일 때는 이것이 디폴트 값입니다.
'approximate'정규 근사하여 p-값 p를 계산합니다. 'method'를 지정하지 않았고 x, xm 또는 xy의 관측값이 15개를 넘을 때는 이것이 디폴트 값입니다. 표본이 많은 경우 정확한 방법은 속도가 느릴 수 있기 때문입니다.

예: 'method','exact'

검정 유형으로, 'tail'과 함께 다음 중 하나가 쉼표로 구분되어 지정됩니다.

'both'

양측 가설검정으로, 디폴트 검정 유형입니다.

  • 1-표본 검정의 경우, 대립가설은 'x의 데이터가 중앙값이 0이 아닌(또는 m이 아닌) 연속 분포에서 추출된다'입니다.

  • 2-표본 검정의 경우, 대립가설은 'xy의 데이터가 중앙값이 0이 아닌 분포에서 추출된다'입니다.

'right'

오른쪽 꼬리 가설 검정.

  • 1-표본 검정의 경우, 대립가설은 'x의 데이터가 중앙값이 0보다 큰(또는 m보다 큰) 연속 분포에서 추출된다'입니다.

  • 2-표본 검정의 경우, 대립가설은 'xy의 데이터가 중앙값이 0보다 큰 분포에서 추출된다'입니다.

'left'

왼쪽 꼬리 가설 검정.

  • 1-표본 검정의 경우, 대립가설은 'x의 데이터가 중앙값이 0보다 작은(또는 m보다 작은) 연속 분포에서 추출된다'입니다.

  • 2-표본 검정의 경우, 대립가설은 'xy의 데이터가 중앙값이 0보다 작은 분포에서 추출된다'입니다.

예: 'tail','left'

출력 인수

모두 축소

검정의 p-값으로, 0에서 1 사이의 음이 아닌 스칼라로 반환됩니다. p는 귀무가설 하의 관측값과 같거나 그보다 큰 극단적인 검정 통계량이 관측될 확률입니다. signrank는 가장 유의미한 단측 값에 두 배를 곱하여 양측 p-값을 계산합니다.

가설검정의 결과로, 논리값으로 반환됩니다.

  • h = 1이면 100 * alpha% 유의수준에서 귀무가설이 기각됨을 나타냅니다.

  • h = 0이면 100 * alpha% 유의수준에서 귀무가설이 기각되지 않음을 나타냅니다.

검정 통계량으로, 구조체로 반환됩니다. stats에 저장되는 검정 통계량은 다음과 같습니다.

  • signrank: 부호 순위 검정 통계량의 값.

  • zval: z-통계량의 값('method''approximate'인 경우 계산됨).

세부 정보

모두 축소

윌콕슨 부호 순위 검정

윌콕슨 부호 순위 검정은 관측값이 쌍을 이루는 경우 두 모집단에 대한 비모수적 검정입니다. 이 경우 검정 통계량 W는 두 표본에 있는 관측값의 차이(xy)의 순위합입니다. 표본 1개에 대해 이 검정을 사용하는 경우, W는 관측값과 가정된 중앙값 M0(signrank(x)를 사용할 경우 0이고 signrank(x,m)을 사용할 경우 m) 간 차이의 순위합입니다.

z-통계량

표본의 규모가 크거나 methodapproximate인 경우, signrank 함수는 다음과 같이 지정되는 z-통계량을 사용하여 p-값을 계산합니다.

z=(Wn(n+1)/4)n(n+1)(2n+1)tieadj24,

여기서 n은 차이 x – y 또는 xm의 표본 크기입니다. 2-표본의 경우, signrank[tie_rank,tieadj] = tiedrank(abs(diffxy),0,0,epsdiff)를 사용하여 동순위 조정값 tieadj를 구합니다.

알고리즘

signrankxy에 있는 NaN을 결측값으로 처리하여 무시합니다.

2-표본의 경우, signrank는 값 epsdiff = eps(x) + eps(y)를 기반으로 하여 허용오차를 사용합니다. signrank는 차이의 절댓값을 계산하며(abs(d(i)), 여기서 d(i) = x(i) – y(i)) 이 값을 epsdiff와 비교합니다. 절댓값이 epsdiff보다 작은 값(abs(d(i)) < epsdiff(i))은 동순위로 취급됩니다.

참고 문헌

[1] Gibbons, J. D., and S. Chakraborti. Nonparametric Statistical Inference, 5th Ed., Boca Raton, FL: Chapman & Hall/CRC Press, Taylor & Francis Group, 2011.

[2] Hollander, M., and D. A. Wolfe. Nonparametric Statistical Methods. Hoboken, NJ: John Wiley & Sons, Inc., 1999.

참고 항목

| | |

R2006a 이전에 개발됨