Main Content

lillietest

릴리포스 검정

설명

예제

h = lillietest(x)는 릴리포스 검정을 사용하여 '정규분포군에서 벡터 x의 데이터가 추출되지 않는다'는 대립가설에 대해 '이러한 분포에서 데이터가 추출된다'는 귀무가설에 대한 검정 결과를 반환합니다. 검정이 5% 유의수준에서 귀무가설을 기각한 경우 결과 h1이고, 그렇지 않은 경우 0입니다.

예제

h = lillietest(x,Name,Value)는 하나 이상의 이름-값 쌍의 인수로 지정된 추가 옵션을 사용하여 검정 결과를 반환합니다. 예를 들어, 다른 분포군에 대해 데이터를 검정하거나, 유의수준을 변경하거나, 몬테카를로 근사를 사용하여 p-값을 계산할 수 있습니다.

예제

[h,p] = lillietest(___)는 위에 열거된 구문의 입력 인수 중 하나를 사용하여 p-값 p도 반환합니다.

예제

[h,p,kstat,critval] = lillietest(___)는 검정 통계량 kstat과 검정에 대한 임계값 critval도 반환합니다.

예제

모두 축소

표본 데이터를 불러옵니다. '여러 자동차 제조업체의 갤런당 마일(MPG) 자동차 주행거리가 정규분포를 따른다'는 귀무가설을 검정합니다.

load carbig
[h,p,k,c] = lillietest(MPG)
Warning: P is less than the smallest tabulated value, returning 0.001.
h = 1
p = 1.0000e-03
k = 0.0789
c = 0.0451

검정 통계량 k는 임계값 c보다 크며, 따라서 lillietest는 결과 h = 1을 반환하여 디폴트 5% 유의수준에서 귀무가설이 기각됨을 나타냅니다. 경고는 반환된 p-값이 미리 계산된 값으로 구성된 테이블의 가장 작은 값보다 작음을 나타냅니다. 더 정확한 p-값을 찾으려면 MCTol을 사용하여 몬테카를로 근사를 실행하십시오. 몬테카를로 근사를 사용하여 p-값 구하기 항목을 참조하십시오.

표본 데이터를 불러옵니다. 학생들의 시험 성적 데이터의 첫 번째 열을 포함하는 벡터를 만듭니다.

load examgrades
x = grades(:,1);

'표본 데이터가 1% 유의수준에서 정규분포에서 추출된다'는 귀무가설을 검정합니다.

[h,p] = lillietest(x,'Alpha',0.01)
h = 0
p = 0.0348

반환된 값 h = 0lillietest가 1% 유의수준에서 귀무가설을 기각하지 않음을 나타냅니다.

표본 데이터를 불러옵니다. '여러 자동차 제조업체의 갤런당 마일(MPG) 자동차 주행거리가 지수 분포를 따른다'는 귀무가설을 검정합니다.

load carbig
h = lillietest(MPG,'Distribution','exponential')
h = 1

반환된 값 h = 1lillietest가 디폴트 5% 유의수준에서 귀무가설을 기각함을 나타냅니다.

두 개의 표본 데이터 세트를 생성합니다(하나는 베이불 분포에서, 다른 하나는 로그정규분포에서 생성). 각 데이터 세트가 베이불 분포에서 추출되는지 여부를 평가하기 위해 릴리포스 검정을 수행합니다. 베이불 확률 플롯(wblplot)을 이용한 시각적인 비교를 통해 검정 결과를 확인합니다.

베이불 분포에서 표본을 생성합니다.

rng('default')
data1 = wblrnd(0.5,2,[500,1]);

lillietest를 사용하여 릴리포스 검정을 수행합니다. 베이불 분포에 대한 데이터를 검정하기 위해 데이터의 로그가 극값 분포를 가지고 있는지 여부를 검정합니다.

h1 = lillietest(log(data1),'Distribution','extreme value')
h1 = 0

반환된 값 h1 = 0lillietest가 디폴트 5% 유의수준에서 귀무가설을 기각하지 않음을 나타냅니다. 베이불 확률 플롯을 사용하여 검정 결과를 확인합니다.

wblplot(data1)

이 플롯은 데이터가 베이불 분포를 따름을 나타냅니다.

로그정규분포에서 표본을 생성합니다.

data2 =lognrnd(5,2,[500,1]);

릴리포스 검정을 수행합니다.

h2 = lillietest(log(data2),'Distribution','extreme value')
h2 = 1

반환된 값 h2 = 1lillietest가 디폴트 5% 유의수준에서 귀무가설을 기각함을 나타냅니다. 베이불 확률 플롯을 사용하여 검정 결과를 확인합니다.

wblplot(data2)

이 플롯은 데이터가 베이불 분포를 따르지 않음을 나타냅니다.

표본 데이터를 불러옵니다. '여러 자동차 제조업체의 갤런당 마일(MPG) 자동차 주행거리가 정규분포를 따른다'는 귀무가설을 검정합니다. 최대 몬테카를로 표준 오차가 1e-4인 몬테카를로 근사를 사용하여 p-값을 구합니다.

load carbig
[h,p] = lillietest(MPG,'MCTol',1e-4)
h = 1
p = 8.3333e-06

반환된 값 h = 1lillietest가 5% 유의수준에서 데이터가 정규분포에서 추출된다는 귀무가설을 기각함을 나타냅니다.

입력 인수

모두 축소

표본 데이터로, 벡터로 지정됩니다.

데이터형: single | double

이름-값 인수

선택적 인수 쌍을 Name1=Value1,...,NameN=ValueN으로 지정합니다. 여기서 Name은 인수 이름이고 Value는 대응값입니다. 이름-값 인수는 다른 인수 뒤에 와야 하지만, 인수 쌍의 순서는 상관없습니다.

R2021a 이전 릴리스에서는 쉼표를 사용하여 각 이름과 값을 구분하고 Name을 따옴표로 묶으십시오.

예: 'Distribution','exponential','Alpha',0.01은 '모집단 분포가 1% 유의수준에서 지수 분포군에 속한다'는 귀무가설을 검정합니다.

가설검정의 유의수준으로, 'Alpha'와 함께 (0,1) 범위의 스칼라 값이 쉼표로 구분되어 지정됩니다.

  • MCTol이 사용되지 않는 경우 Alpha는 범위 [0.001,0.50] 내에 있어야 합니다.

  • MCTol이 사용되는 경우 Alpha는 범위 (0,1) 내에 있어야 합니다.

예: 'Alpha',0.01

데이터형: single | double

가설검정을 위한 분포군으로, 'Distr'과 함께 다음 중 하나가 쉼표로 구분되어 지정됩니다.

'normal'정규분포
'exponential'지수 분포
'extreme value'극값 분포

  • 로그정규분포에 대해 x를 검정하려면 log(x)가 정규분포를 갖는지 여부를 검정하십시오.

  • 베이불 분포에 대해 x를 검정하려면 log(x)가 극값 분포를 갖는지 여부를 검정하십시오.

예: 'Distribution','exponential'

검정의 p-값인 p에 대한 최대 몬테카를로 표준 오차로, 'MCTol'과 함께 (0,1) 범위의 스칼라 값이 쉼표로 구분되어 지정됩니다.

예: 'MCTol',0.001

데이터형: single | double

출력 인수

모두 축소

가설검정 결과로, 1 또는 0으로 반환됩니다.

  • h = 1이면 Alpha 유의수준에서 귀무가설이 기각됨을 나타냅니다.

  • h = 0이면 Alpha 유의수준에서 귀무가설이 기각되지 않음을 나타냅니다.

검정의 p-값으로, (0,1) 범위의 스칼라 값으로 반환됩니다. p는 귀무가설 하의 관측값과 같거나 그보다 더 극단적인 검정 통계량이 관측될 확률입니다. p의 값이 작을 경우 귀무가설의 타당성에 의문이 제기됩니다.

  • MCTol이 사용되지 않는 경우, p는 임계값 테이블에 맞춰 역보간을 사용하여 계산되며, [0.001,0.50] 범위의 스칼라 값으로 반환됩니다. lillietest는 테이블 범위 내에서 p를 찾을 수 없으면 경고하고, 가장 작은 테이블 값이나 가장 큰 테이블 값을 반환합니다.

  • MCTol이 사용되는 경우, lillietest는 몬테카를로 시뮬레이션을 수행하여 더 정확한 p-값을 계산하고, p는 (0,1) 범위의 스칼라 값으로 반환됩니다.

검정 통계량으로, 음이 아닌 스칼라 값으로 반환됩니다.

가설검정에 대한 임계값으로, 음이 아닌 스칼라 값으로 반환됩니다.

세부 정보

모두 축소

릴리포스 검정

릴리포스 검정은 양측 적합도 검정으로, 귀무 분포의 모수를 알 수 없고 그 모수를 추정해야 하는 경우에 적합합니다. 이는 귀무 분포를 완전히 지정해야 하는 1-표본 콜모고로프-스미르노프 검정과 대조적입니다.

릴리포스 검정 통계량은 다음과 같습니다.

D*=maxx|F^(x)G(x)|,

여기서 F^(x)는 표본 데이터의 경험적 cdf이고 G(x)는 표본 모수와 같은 추정 모수를 갖는 가정된 분포의 cdf입니다.

lillietest는 데이터 벡터에 변환을 적용하고 다음과 같이 적절한 릴리포스 검정을 실행하여 데이터 벡터 x가 로그정규분포와 베이불 분포 중 무엇을 갖는지 여부를 검정하는 데 사용할 수 있습니다.

  • 로그정규분포에 대해 x를 검정하려면 log(x)가 정규분포를 갖는지 여부를 검정하십시오.

  • 베이불 분포에 대해 x를 검정하려면 log(x)가 극값 분포를 갖는지 여부를 검정하십시오.

귀무가설이 위치-척도 분포군이 아닌 경우에는 릴리포스 검정을 사용할 수 없습니다.

몬테카를로 표준 오차

몬테카를로 표준 오차는 p-값 시뮬레이션으로 인한 오차입니다.

몬테카를로 표준 오차는 다음과 같이 계산됩니다.

SE=(p^)(1p^)mcreps,

여기서 p^은 가설검정의 추정된 p-값이고 mcreps는 수행된 몬테카를로 반복 실험 횟수입니다.

몬테카를로 반복 실험 횟수인 mcrepsp^에 대한 몬테카를로 표준 오차가 MCTol에 지정된 값보다 작아지는 값으로 결정됩니다.

알고리즘

가설검정을 위한 임계값을 계산하기 위해 lillietest는 표본 크기가 1000개 미만이고 유의수준이 0.001~0.50인 경우 몬테카를로 시뮬레이션을 사용하여 미리 계산된 임계값 테이블에 맞춰 보간합니다. lillietest가 사용하는 테이블은 릴리포스가 원래 도입했던 테이블보다 더 크고 정확합니다. 더 정확한 p-값을 원하거나 원하는 유의수준이 0.001보다 작거나 0.50보다 큰 경우, MCTol 입력 인수를 사용해 몬테카를로 시뮬레이션을 실행하여 p-값을 더 정확하게 계산할 수 있습니다.

계산된 검정 통계량 값이 임계값보다 크면 lillietest는 유의수준 Alpha에서 귀무가설을 기각합니다.

lillietestx에 있는 NaN 값을 누락값으로 처리하여 무시합니다.

참고 문헌

[1] Conover, W. J. Practical Nonparametric Statistics. Hoboken, NJ: John Wiley & Sons, Inc., 1980.

[2] Lilliefors, H. W. “On the Kolmogorov-Smirnov test for the exponential distribution with mean unknown.” Journal of the American Statistical Association. Vol. 64, 1969, pp. 387–389.

[3] Lilliefors, H. W. “On the Kolmogorov-Smirnov test for normality with mean and variance unknown.” Journal of the American Statistical Association. Vol. 62, 1967, pp. 399–402.

버전 내역

R2006a 이전에 개발됨

참고 항목

| | | |