Main Content

이 페이지의 최신 내용은 아직 번역되지 않았습니다. 최신 내용은 영문으로 볼 수 있습니다.

kstest2

2-표본 콜모고로프-스미르노프 검정

설명

예제

h = kstest2(x1,x2)2-표본 콜모고로프-스미르노프 검정을 사용하여 '벡터 x1x2의 데이터가 동일한 연속 분포에서 추출된다'는 귀무가설에 대한 검정 결과를 반환합니다. 대립가설은 'x1x2가 다른 연속 분포에서 추출된다'입니다. 검정이 5% 유의수준에서 귀무가설을 기각한 경우 결과 h1이고, 그렇지 않은 경우 0입니다.

예제

h = kstest2(x1,x2,Name,Value)는 하나 이상의 이름-값 쌍의 인수로 지정된 추가 옵션을 사용하여 2-표본 콜모고로프-스미르노프 검정에 대한 검정 결과를 반환합니다. 예를 들어, 유의수준을 변경하거나 단측 검정을 수행할 수 있습니다.

예제

[h,p] = kstest2(___)는 위에 열거된 구문의 입력 인수 중 하나를 사용하여 점근적 p-값 p도 반환합니다.

예제

[h,p,ks2stat] = kstest2(___)는 검정 통계량 ks2stat도 반환합니다.

예제

모두 축소

두 개의 다른 베이불(Weibull) 분포에서 표본 데이터를 생성합니다.

rng(1);     % For reproducibility
x1 = wblrnd(1,1,1,50);
x2 = wblrnd(1.2,2,1,50);

'벡터 x1x2의 데이터가 동일한 분포를 갖는 모집단에서 추출된다'는 귀무가설을 검정합니다.

h = kstest2(x1,x2)
h = logical
   1

반환된 값 h = 1kstest가 디폴트 5% 유의수준에서 귀무가설을 기각함을 나타냅니다.

두 개의 다른 베이불(Weibull) 분포에서 표본 데이터를 생성합니다.

rng(1);     % For reproducibility
x1 = wblrnd(1,1,1,50);
x2 = wblrnd(1.2,2,1,50);

'데이터 벡터 x1x2가 1% 유의수준에서 동일한 분포를 갖는 모집단에서 추출된다'는 귀무가설을 검정합니다.

[h,p] = kstest2(x1,x2,'Alpha',0.01)
h = logical
   0

p = 0.0317

반환된 값 h = 0kstest가 1% 유의수준에서 귀무가설을 기각하지 않음을 나타냅니다.

두 개의 다른 베이불(Weibull) 분포에서 표본 데이터를 생성합니다.

rng(1);     % For reproducibility
x1 = wblrnd(1,1,1,50);
x2 = wblrnd(1.2,2,1,50);

'x1의 분포에 대한 cdf가 x2의 분포에 대한 cdf보다 크다'는 대립가설에 대해 '벡터 x1x2의 데이터가 동일한 분포를 갖는 모집단에서 추출된다'는 귀무가설을 검정합니다.

[h,p,k] = kstest2(x1,x2,'Tail','larger')
h = logical
   1

p = 0.0158
k = 0.2800

반환된 값 h = 1은 디폴트 5% 유의수준에서 kstest가 귀무가설을 기각하고, 'x1의 분포에 대한 cdf가 x2의 분포에 대한 cdf보다 크다'는 대립가설을 채택함을 나타냅니다. k의 반환된 값은 2-표본 콜모고로프-스미르노프 검정에 대한 검정 통계량입니다.

입력 인수

모두 축소

첫 번째 표본의 표본 데이터로, 벡터로 지정됩니다. 데이터 벡터 x1x2는 크기가 같을 필요가 없습니다.

데이터형: single | double

두 번째 표본의 표본 데이터로, 벡터로 지정됩니다. 데이터 벡터 x1x2는 크기가 같을 필요가 없습니다.

데이터형: single | double

이름-값 쌍의 인수

선택적으로 Name,Value 인수가 쉼표로 구분되어 지정됩니다. 여기서 Name은 인수 이름이고 Value는 대응값입니다. Name은 따옴표 안에 표시해야 합니다. Name1,Value1,...,NameN,ValueN과 같이 여러 개의 이름-값 쌍의 인수를 어떤 순서로든 지정할 수 있습니다.

예: 'Tail','larger','Alpha',0.01은 'x1의 경험적 cdf가 x2의 경험적 cdf보다 크다'는 대립가설을 사용하여 1% 유의수준으로 수행되는 검정을 지정합니다.

가설검정의 유의수준으로, 'Alpha'와 함께 (0,1) 범위의 스칼라 값이 쉼표로 구분되어 지정됩니다.

예: 'Alpha',0.01

데이터형: single | double

평가할 대립가설 유형으로, 'Tail'과 함께 다음 중 하나가 쉼표로 구분되어 지정됩니다.

'unequal''x1의 경험적 cdf가 x2의 경험적 cdf와 같지 않다'는 대립가설을 검정합니다.
'larger''x1의 경험적 cdf가 x2의 경험적 cdf보다 크다'는 대립가설을 검정합니다.
'smaller''x1의 경험적 cdf가 x2의 경험적 cdf보다 작다'는 대립가설을 검정합니다.

x1의 데이터 값이 x2의 데이터 값보다 큰 경향이 있는 경우 x1의 경험적 분포 함수가 x2의 경험적 분포 함수보다 작아지는 경향이 있으며, 그 반대의 경우에는 커지는 경향이 있습니다.

예: 'Tail','larger'

출력 인수

모두 축소

가설검정 결과로, 논리값으로 반환됩니다.

  • h = 1이면 Alpha 유의수준에서 귀무가설이 기각됨을 나타냅니다.

  • h = 0이면 Alpha 유의수준에서 귀무가설이 기각되지 않음을 나타냅니다.

검정의 점근적 p-값으로, (0,1) 범위의 스칼라 값으로 반환됩니다. p는 귀무가설 하의 관측값과 같거나 그보다 큰 극단적인 검정 통계량이 관측될 확률입니다. 점근적 p-값은 표본 크기가 클 때 매우 정확해지고, 표본 크기 n1n2(n1*n2)/(n1 + n2)4를 충족하는 경우에 상당히 정확한 것으로 간주됩니다.

검정 통계량으로, 음이 아닌 스칼라 값으로 반환됩니다.

세부 정보

모두 축소

2-표본 콜모고로프-스미르노프 검정

2-표본 콜모고로프-스미르노프 검정은 각 데이터 세트에서 x의 범위에 대해 두 개의 표본 데이터 벡터 분포에 대한 cdf 간의 차이를 평가하는 비모수적 가설검정입니다.

양측 검정은 두 데이터 벡터 분포에 대한 cdf 간의 최대 절대 차이를 사용합니다. 검정 통계량은 다음과 같습니다.

D*=maxx(|F^1(x)F^2(x)|),

여기서 F^1(x)는 x보다 작거나 같은 x1 값의 비율이고, F^2(x)는 x보다 작거나 같은 x2 값의 비율입니다.

단측 검정은 두 데이터 벡터 분포에 대한 cdf 간 차이의 절댓값이 아니라 실제 값을 사용합니다. 검정 통계량은 다음과 같습니다.

D*=maxx(F^1(x)F^2(x)).

알고리즘

kstest2에서 귀무가설 기각 여부는 검정 통계량 ks2stat을 임계값과 비교하는 게 아니라 p-값 p를 유의수준 Alpha와 비교하는 방식으로 결정됩니다.

참고 문헌

[1] Massey, F. J. “The Kolmogorov-Smirnov Test for Goodness of Fit.” Journal of the American Statistical Association. Vol. 46, No. 253, 1951, pp. 68–78.

[2] Miller, L. H. “Table of Percentage Points of Kolmogorov Statistics.” Journal of the American Statistical Association. Vol. 51, No. 273, 1956, pp. 111–121.

[3] Marsaglia, G., W. Tsang, and J. Wang. “Evaluating Kolmogorov’s Distribution.” Journal of Statistical Software. Vol. 8, Issue 18, 2003.

참고 항목

| |

R2006a 이전에 개발됨