kstest2

2-표본 콜모고로프-스미르노프 검정

구문

h = kstest2(x1,x2)

h = kstest2(x1,x2,Name,Value)

[h,p] = kstest2(___)

[h,p,ks2stat] = kstest2(___)

설명

h = kstest2(x1,x2)는 2-표본 콜모고로프-스미르노프 검정을 사용하여 '벡터 x1 및 x2의 데이터가 동일한 연속 분포에서 추출된다'는 귀무가설에 대한 검정 결과를 반환합니다. 대립가설은 'x1 및 x2가 다른 연속 분포에서 추출된다'입니다. 검정이 5% 유의수준에서 귀무가설을 기각한 경우 결과 h는 1이고, 그렇지 않은 경우 0입니다.

예제

h = kstest2(x1,x2,Name,Value)는 하나 이상의 이름-값 쌍의 인수로 지정된 추가 옵션을 사용하여 2-표본 콜모고로프-스미르노프 검정에 대한 검정 결과를 반환합니다. 예를 들어, 유의수준을 변경하거나 단측 검정을 수행할 수 있습니다.

예제

[h,p] = kstest2(___)는 위에 열거된 구문의 입력 인수 중 하나를 사용하여 점근적 p-값 p도 반환합니다.

예제

[h,p,ks2stat] = kstest2(___)는 검정 통계량 ks2stat도 반환합니다.

예제

모두 축소

동일한 분포에 대한 두 표본 검정하기

라이브 스크립트 열기

두 개의 다른 베이불(Weibull) 분포에서 표본 데이터를 생성합니다.

rng(1);     % For reproducibility
x1 = wblrnd(1,1,1,50);
x2 = wblrnd(1.2,2,1,50);

'벡터 x1 및 x2의 데이터가 동일한 분포를 갖는 모집단에서 추출된다'는 귀무가설을 검정합니다.

h = kstest2(x1,x2)

h = logical
   1

반환된 값 h = 1은 kstest가 디폴트 5% 유의수준에서 귀무가설을 기각함을 나타냅니다.

다양한 유의수준에서 가설 검정하기

라이브 스크립트 열기

두 개의 다른 베이불(Weibull) 분포에서 표본 데이터를 생성합니다.

rng(1);     % For reproducibility
x1 = wblrnd(1,1,1,50);
x2 = wblrnd(1.2,2,1,50);

'데이터 벡터 x1 및 x2가 1% 유의수준에서 동일한 분포를 갖는 모집단에서 추출된다'는 귀무가설을 검정합니다.

[h,p] = kstest2(x1,x2,'Alpha',0.01)

h = logical
   0

p = 
0.0317

반환된 값 h = 0은 kstest가 1% 유의수준에서 귀무가설을 기각하지 않음을 나타냅니다.

단측 가설검정

라이브 스크립트 열기

두 개의 다른 베이불(Weibull) 분포에서 표본 데이터를 생성합니다.

rng(1);     % For reproducibility
x1 = wblrnd(1,1,1,50);
x2 = wblrnd(1.2,2,1,50);

'x1의 분포에 대한 cdf가 x2의 분포에 대한 cdf보다 크다'는 대립가설에 대해 '벡터 x1 및 x2의 데이터가 동일한 분포를 갖는 모집단에서 추출된다'는 귀무가설을 검정합니다.

[h,p,k] = kstest2(x1,x2,'Tail','larger')

h = logical
   1

p = 
0.0158

k = 
0.2800

반환된 값 h = 1은 디폴트 5% 유의수준에서 kstest가 귀무가설을 기각하고, 'x1의 분포에 대한 cdf가 x2의 분포에 대한 cdf보다 크다'는 대립가설을 채택함을 나타냅니다. k의 반환된 값은 2-표본 콜모고로프-스미르노프 검정에 대한 검정 통계량입니다.

입력 인수

모두 축소

`x1` — 표본 데이터
벡터

첫 번째 표본의 표본 데이터로, 벡터로 지정됩니다. 데이터 벡터 x1과 x2는 크기가 같을 필요가 없습니다.

데이터형: single | double

`x2` — 표본 데이터
벡터

두 번째 표본의 표본 데이터로, 벡터로 지정됩니다. 데이터 벡터 x1과 x2는 크기가 같을 필요가 없습니다.

데이터형: single | double

이름-값 인수

모두 축소

선택적 인수 쌍을 Name1=Value1,...,NameN=ValueN으로 지정합니다. 여기서 Name은 인수 이름이고 Value는 대응값입니다. 이름-값 인수는 다른 인수 뒤에 와야 하지만, 인수 쌍의 순서는 상관없습니다.

R2021a 이전 릴리스에서는 쉼표를 사용하여 각 이름과 값을 구분하고 Name을 따옴표로 묶으십시오.

예: 'Tail','larger','Alpha',0.01은 'x1의 cdf가 x2의 cdf보다 크다'는 대립가설을 사용하여 1% 유의수준으로 수행되는 검정을 지정합니다.

`Alpha` — 유의수준
`0.05` (디폴트 값) | (0,1) 범위의 스칼라 값

가설검정의 유의수준으로, 'Alpha'와 함께 (0,1) 범위의 스칼라 값이 쉼표로 구분되어 지정됩니다.

예: 'Alpha',0.01

데이터형: single | double

`Tail` — 대립가설 유형
`'unequal'` (디폴트 값) | `'larger'` | `'smaller'`

평가할 대립가설 유형으로, 'Tail'과 함께 다음 중 하나가 쉼표로 구분되어 지정됩니다.

`'unequal'`	'`x1`의 cdf가 `x2`의 cdf와 같지 않다'는 대립가설을 검정합니다.
`'larger'`	'`x1`의 cdf가 확률적으로 `x2`의 cdf보다 크다'는 대립가설을 검정합니다.
`'smaller'`	'`x1`의 cdf가 확률적으로 `x2`의 cdf보다 작다'는 대립가설을 검정합니다.

x1의 데이터 값이 x2의 데이터 값보다 큰 경향이 있는 경우 x1의 경험적 분포 함수가 x2의 경험적 분포 함수보다 작아지는 경향이 있으며, 그 반대의 경우에는 커지는 경향이 있습니다.

예: 'Tail','larger'

출력 인수

모두 축소

`h` — 가설검정 결과
`1` | `0`

가설검정 결과로, 논리값으로 반환됩니다.

h = 1이면 Alpha 유의수준에서 귀무가설이 기각됨을 나타냅니다.
h = 0이면 Alpha 유의수준에서 귀무가설이 기각되지 않음을 나타냅니다.

`p` — 점근적 p-값
(0,1) 범위의 스칼라 값

검정의 점근적 p-값으로, (0,1) 범위의 스칼라 값으로 반환됩니다. p는 귀무가설 하의 관측값과 같거나 그보다 큰 극단적인 검정 통계량이 관측될 확률입니다. 점근적 p-값은 표본 크기가 클 때 매우 정확해지고, 표본 크기 n1 및 n2가 (n1*n2)/(n1 + n2) ≥ 4를 충족하는 경우에 상당히 정확한 것으로 간주됩니다.

`ks2stat` — 검정 통계량
음이 아닌 스칼라 값

검정 통계량으로, 음이 아닌 스칼라 값으로 반환됩니다.

세부 정보

모두 축소

2-표본 콜모고로프-스미르노프 검정

2-표본 콜모고로프-스미르노프 검정은 각 데이터 세트에서 x의 범위에 대해 두 개의 표본 데이터 벡터 분포에 대한 cdf 간의 차이를 평가하는 비모수적 가설검정입니다.

양측 검정('Tail','unequal')은 두 데이터 벡터 분포에 대한 경험적 cdf 간의 최대절대차이를 사용합니다. 검정 통계량은 다음과 같습니다.

$D^{*} = \max_{x} (| {\hat{F}}_{1} (x) - {\hat{F}}_{2} (x) |),$

여기서 ${\hat{F}}_{1} (x)$ 는 x보다 작거나 같은 x1 값의 비율이고, ${\hat{F}}_{2} (x)$ 는 x보다 작거나 같은 x2 값의 비율입니다.

단측 검정은 두 데이터 벡터 분포에 대한 경험적 cdf 간 차이의 절댓값이 아니라 실제 값을 사용합니다. 'Tail','larger'를 지정하는 경우 검정 통계량은 다음과 같습니다.

$D^{*} = \max_{x} ({\hat{F}}_{1} (x) - {\hat{F}}_{2} (x)) .$

'Tail','smaller'를 지정하는 경우 검정 통계량은 다음과 같습니다.

$D^{*} = \max_{x} ({\hat{F}}_{2} (x) - {\hat{F}}_{1} (x)) .$

알고리즘

kstest2에서 귀무가설 기각 여부는 검정 통계량 ks2stat을 임계값과 비교하는 게 아니라 p-값 p를 유의수준 Alpha와 비교하는 방식으로 결정됩니다.

참고 문헌

[1] Massey, F. J. “The Kolmogorov-Smirnov Test for Goodness of Fit.” Journal of the American Statistical Association. Vol. 46, No. 253, 1951, pp. 68–78.

[2] Miller, L. H. “Table of Percentage Points of Kolmogorov Statistics.” Journal of the American Statistical Association. Vol. 51, No. 273, 1956, pp. 111–121.

[3] Marsaglia, G., W. Tsang, and J. Wang. “Evaluating Kolmogorov’s Distribution.” Journal of Statistical Software. Vol. 8, Issue 18, 2003.

버전 내역

R2006a 이전에 개발됨

참고 항목

kstest | lillietest | adtest

kstest2

구문

설명

예제

동일한 분포에 대한 두 표본 검정하기

다양한 유의수준에서 가설 검정하기

단측 가설검정

입력 인수

x1 — 표본 데이터 벡터

x2 — 표본 데이터 벡터

이름-값 인수

Alpha — 유의수준 0.05 (디폴트 값) | (0,1) 범위의 스칼라 값

Tail — 대립가설 유형 'unequal' (디폴트 값) | 'larger' | 'smaller'

출력 인수

h — 가설검정 결과 1 | 0

p — 점근적 p-값 (0,1) 범위의 스칼라 값

ks2stat — 검정 통계량 음이 아닌 스칼라 값

세부 정보

2-표본 콜모고로프-스미르노프 검정

알고리즘

참고 문헌

버전 내역

참고 항목

`x1` — 표본 데이터
벡터

`x2` — 표본 데이터
벡터

`Alpha` — 유의수준
`0.05` (디폴트 값) | (0,1) 범위의 스칼라 값

`Tail` — 대립가설 유형
`'unequal'` (디폴트 값) | `'larger'` | `'smaller'`

`h` — 가설검정 결과
`1` | `0`

`p` — 점근적 p-값
(0,1) 범위의 스칼라 값

`ks2stat` — 검정 통계량
음이 아닌 스칼라 값