Main Content

이 번역 페이지는 최신 내용을 담고 있지 않습니다. 최신 내용을 영문으로 보려면 여기를 클릭하십시오.

ttest2

설명

h = ttest2(x,y)2-표본 t-검정을 사용하여 '벡터 xy의 데이터가 평균이 같고 분산이 같지만 알 수 없는 정규분포의 독립적인 임의 표본에서 추출된다'는 귀무가설에 대한 검정 결과를 반환합니다. 대립가설은 'xy의 데이터가 평균이 같지 않은 모집단에서 추출된다'입니다. 검정이 5% 유의수준에서 귀무가설을 기각한 경우 결과 h1이고, 그렇지 않은 경우 0입니다.

예제

h = ttest2(x,y,Name,Value)는 하나 이상의 이름-값 쌍의 인수로 지정된 추가 옵션을 사용하여 2-표본 t-검정에 대한 검정 결과를 반환합니다. 예를 들어, 유의수준을 변경하거나, 또는 분산이 같다고 가정하지 않고 검정을 수행할 수 있습니다.

예제

[h,p] = ttest2(___)는 위에 열거된 구문에 나와 있는 입력 인수를 사용하여 검정에 대한 p-값 p도 반환합니다.

예제

[h,p,ci,stats] = ttest2(___)는 모집단 평균의 차에 대한 신뢰구간 ci와 검정 통계량에 대한 정보를 포함하는 구조체 stats도 반환합니다.

예제

예제

모두 축소

데이터 세트를 불러옵니다. 데이터 행렬의 첫 번째 열과 두 번째 열을 포함하는 벡터를 생성하여 두 시험에 대한 학생들의 성적을 나타냅니다.

load examgrades
x = grades(:,1);
y = grades(:,2);

'두 데이터 표본이 평균이 같은 모집단에서 추출된다'는 귀무가설을 검정합니다.

[h,p,ci,stats] = ttest2(x,y)
h = 0
p = 0.9867
ci = 2×1

   -1.9438
    1.9771

stats = struct with fields:
    tstat: 0.0167
       df: 238
       sd: 7.7084

반환된 값 h = 0ttest2가 디폴트 5% 유의수준에서 귀무가설을 기각하지 않음을 나타냅니다.

데이터 세트를 불러옵니다. 데이터 행렬의 첫 번째 열과 두 번째 열을 포함하는 벡터를 생성하여 두 시험에 대한 학생들의 성적을 나타냅니다.

load examgrades
x = grades(:,1);
y = grades(:,2);

'두 데이터 벡터가 평균이 같은 모집단에서 추출된다'는 귀무가설을 검정합니다. 이때 모집단의 분산은 같다고 가정하지 않습니다.

[h,p] = ttest2(x,y,'Vartype','unequal')
h = 0
p = 0.9867

반환된 값 h = 0ttest2가 분산이 같다고 가정하지 않는 경우에도 디폴트 5% 유의수준에서 귀무가설을 기각하지 않음을 나타냅니다.

표본 데이터를 불러옵니다. 차량 연도에 따라 차량 주행 거리 데이터에 레이블을 지정하는 categorical형 벡터를 만듭니다.

load carbig.mat;

decade = categorical(Model_Year < 80,[true,false],["70s","80s"]);

매 10년마다 마일리지 데이터의 상자 플롯을 만듭니다.

boxchart(decade,MPG)
xlabel("Decade")
ylabel("Mileage")

Figure contains an axes object. The axes object with xlabel Decade, ylabel Mileage contains an object of type boxchart.

매 10년마다 마일리지 데이터에서 벡터를 만듭니다. 왼쪽 꼬리, 2-표본 t-검정을 사용하여 '데이터가 평균이 같은 모집단에서 추출된다'는 귀무가설을 검정합니다. '1970년대에 만들어진 자동차의 마일리지에 대한 모집단 평균이 1980년대에 만들어진 자동차의 마일리지에 대한 모집단 평균보다 작다'는 대립가설을 사용합니다.

MPG70s = MPG(decade == "70s");
MPG80s = MPG(decade == "80s");

[h,~,~,stats] = ttest2(MPG70s,MPG80s,"Tail","left")
h = 1
stats = struct with fields:
    tstat: -14.0630
       df: 396
       sd: 6.3910

반환된 값 h = 1ttest2가 디폴트 유의수준 5%에서 귀무가설을 기각하고 '1970년대에 만들어진 자동차의 마일리지에 대한 모집단 평균이 1980년대에 만들어진 자동차의 마일리지에 대한 모집단 평균보다 작다'는 대립가설을 채택함을 나타냅니다.

해당 스튜던트 t-분포, 반환된 t-통계량, 임계 t-값을 플로팅합니다. tinv를 사용하여 디폴트 신뢰수준 95%에서 임계 t-값을 계산합니다.

nu = stats.df;
k = linspace(-15,15,300);
tdistpdf = tpdf(k,nu);
tval = stats.tstat
tval = -14.0630
tvalpdf = tpdf(tval,nu);
tcrit = -tinv(0.95,nu)
tcrit = -1.6487
plot(k,tdistpdf)
hold on
scatter(tval,tvalpdf,"filled")
xline(tcrit,"--")
legend(["Student's t pdf","t-statistic", ...
    "Critical Cutoff"])

Figure contains an axes object. The axes object contains 3 objects of type line, scatter, constantline. These objects represent Student's t pdf, t-statistic, Critical Cutoff.

주황색 점은 t-통계량을 나타내며 임계 t-값을 나타내는 검은색 파선의 왼쪽에 위치합니다.

입력 인수

모두 축소

표본 데이터로, 벡터, 행렬 또는 다차원 배열로 지정됩니다. ttest2NaN 값을 누락 데이터로 처리하여 무시합니다.

  • xy가 벡터로 지정되는 경우 길이는 같지 않아도 됩니다.

  • xy가 행렬로 지정되는 경우 열의 개수가 같아야 합니다. ttest2는 각 열을 따라 개별적인 t-검정을 수행하고 결과값으로 구성된 벡터를 반환합니다.

  • xy다차원 배열로 지정되는 경우 첫 번째 비한원소 차원을 제외한 모든 차원을 따라 크기가 같아야 합니다.

데이터형: single | double

표본 데이터로, 벡터, 행렬 또는 다차원 배열로 지정됩니다. ttest2NaN 값을 누락 데이터로 처리하여 무시합니다.

  • xy가 벡터로 지정되는 경우 길이는 같지 않아도 됩니다.

  • xy가 행렬로 지정되는 경우 열의 개수가 같아야 합니다. ttest2는 각 열을 따라 개별적인 t-검정을 수행하고 결과값으로 구성된 벡터를 반환합니다.

  • xy다차원 배열로 지정되는 경우 첫 번째 비한원소 차원을 제외한 모든 차원을 따라 크기가 같아야 합니다. ttest2는 첫 번째 비한원소 차원을 따라 동작을 수행합니다.

데이터형: single | double

이름-값 인수

선택적 인수 쌍을 Name1=Value1,...,NameN=ValueN으로 지정합니다. 여기서 Name은 인수 이름이고 Value는 대응값입니다. 이름-값 인수는 다른 인수 뒤에 와야 하지만, 인수 쌍의 순서는 상관없습니다.

R2021a 이전 릴리스에서는 쉼표를 사용하여 각 이름과 값을 구분하고 Name을 따옴표로 묶으십시오.

예: 'Tail','right','Alpha',0.01,'Vartype','unequal'은 1% 유의수준에서 오른쪽 꼬리 검정을 지정하고 xy가 동일한 모집단 분산을 가진다고 가정하지 않습니다.

가설검정의 유의수준으로, 'Alpha'와 함께 (0,1) 범위의 스칼라 값이 쉼표로 구분되어 지정됩니다.

예: 'Alpha',0.01

데이터형: single | double

평균을 검정할 때 따를 입력 행렬의 차원으로, 'Dim'과 함께 양의 정수 값이 쉼표로 구분되어 지정됩니다. 예를 들어, 'Dim',1을 지정하는 경우 열 평균을 검정하며, 'Dim',2를 지정하는 경우 행 평균을 검정합니다.

예: 'Dim',2

데이터형: single | double

평가할 대립가설 유형으로, 'Tail'과 함께 다음 중 하나가 쉼표로 구분되어 지정됩니다.

  • 'both' — '모집단 평균이 같지 않다'는 대립가설과 비교해 검정합니다.

  • 'right' — 'x의 모집단 평균이 y의 모집단 평균보다 크다'는 대립가설과 비교해 검정합니다.

  • 'left' — 'x의 모집단 평균이 y의 모집단 평균보다 작다'는 대립가설과 비교해 검정합니다.

ttest2 함수는 지정된 대립가설과 반대로 '모집단 평균이 같다'는 귀무가설을 검정합니다.

예: 'Tail','right'

분산 유형으로, 'Vartype'과 함께 다음 중 하나가 쉼표로 구분되어 지정됩니다.

'equal'xy가 알 수 없지만 서로 같은 분산을 갖는 정규분포에서 추출된다는 가정을 사용하여 검정을 수행합니다.
'unequal'xy가 알 수 없으며 서로 다른 분산을 갖는 정규분포에서 추출된다는 가정을 사용하여 검정을 수행합니다. 이는 베렌스-피셔(Behrens-Fisher) 문제라고 합니다. ttest2는 유효 자유도를 얻기 위해 새터스웨이트(Satterthwaite)의 근삿값을 사용합니다.

Vartype의 분산 유형은 x가 행렬 또는 다차원 배열인 경우에도 하나여야 합니다.

예: 'Vartype','unequal'

출력 인수

모두 축소

가설검정 결과로, 1 또는 0으로 반환됩니다.

  • h = 1이면 Alpha 유의수준에서 귀무가설이 기각됨을 나타냅니다.

  • h = 0이면 Alpha 유의수준에서 귀무가설이 기각되지 않음을 나타냅니다.

검정의 p-값으로, [0,1] 범위의 스칼라 값으로 반환됩니다. p는 귀무가설 하의 관측값과 같거나 그보다 더 극단적인 검정 통계량이 관측될 확률입니다. p의 값이 작을 경우 귀무가설의 타당성에 의문이 제기됩니다.

xy의 모집단 평균의 차에 대한 신뢰구간으로, 100 × (1 – Alpha)% 신뢰구간의 하한과 상한을 포함하는, 요소를 2개 가진 벡터로 반환됩니다.

2-표본 t-검정에 대한 검정 통계량으로, 다음을 포함하는 구조체로 반환됩니다.

  • tstat — 검정 통계량의 값입니다.

  • df — 검정의 자유도입니다.

  • sd — 모집단 표준편차에 대한 합동 추정값(분산이 같은 경우)이거나 모집단 표준편차에 대한 비합동 추정값으로 구성된 벡터(분산이 같지 않은 경우)입니다.

세부 정보

모두 축소

2-표본 t-검정

2-표본 t-검정(Two-sample t-test)은 두 개의 독립적인 데이터 표본의 위치 모수를 비교하는 모수적 검정입니다.

검정 통계량은 다음과 같습니다.

t=x¯y¯sx2n+sy2m,

여기서 x¯y¯는 표본평균이고, sxsy는 표본 표준편차이며, nm은 표본 크기입니다.

두 데이터 표본이 분산이 같은 모집단에서 추출된다고 가정하는 경우, 귀무가설 하의 검정 통계량은 n + m – 2 자유도를 갖는 스튜던트 t 분포를 가지며, 표본 표준편차는 다음과 같은 합동 표준편차로 대체됩니다.

s=(n1)sx2+(m1)sy2n+m2.

두 데이터 표본이 분산이 같은 모집단에서 추출된다고 가정하지 않는 경우, 귀무가설 하의 검정 통계량은 새터스웨이트(Satterthwaite)의 근삿값으로 제공된 여러 자유도를 갖는 스튜던트 t 분포 근삿값을 가집니다. 이 검정은 Welch t-검정이라고도 합니다.

다차원 배열

다차원 배열은 3차원 이상을 갖습니다. 예를 들어, x가 1×3×4 배열이면 x는 3차원 배열입니다.

첫 번째 비한원소 차원

첫 번째 비한원소 차원은 배열에서 크기가 1이 아닌 첫 번째 차원입니다. 예를 들어, x가 1×2×3×4 배열이면 두 번째 차원이 x의 첫 번째 비한원소 차원입니다.

  • 다음을 계산하려면 sampsizepwr을 사용하십시오.

    • 지정된 검정력과 모수 값에 대응되는 표본 크기,

    • 실제 모수 값이 주어진 경우 특정 표본 크기에 대해 달성한 검정력,

    • 지정된 표본 크기와 검정력으로 검색 가능한 모수 값.

확장 기능

버전 내역

R2006a 이전에 개발됨

참고 항목

| |