ttest2

2-표본 t-검정

페이지 내 모두 축소

구문

h = ttest2(x,y)

h = ttest2(x,y,Name,Value)

[h,p] = ttest2(___)

[h,p,ci,stats] = ttest2(___)

설명

예제

h = ttest2(x,y)는 2-표본 t-검정을 사용하여 '벡터 x 및 y의 데이터가 평균이 같고 분산이 같지만 알 수 없는 정규분포의 독립적인 임의 표본에서 추출된다'는 귀무가설에 대한 검정 결과를 반환합니다. 대립가설은 'x 및 y의 데이터가 평균이 같지 않은 모집단에서 추출된다'입니다. 검정이 5% 유의수준에서 귀무가설을 기각한 경우 결과 h는 1이고, 그렇지 않은 경우 0입니다.

예제

h = ttest2(x,y,Name,Value)는 하나 이상의 이름-값 쌍의 인수로 지정된 추가 옵션을 사용하여 2-표본 t-검정에 대한 검정 결과를 반환합니다. 예를 들어, 유의수준을 변경하거나, 또는 분산이 같다고 가정하지 않고 검정을 수행할 수 있습니다.

예제

[h,p] = ttest2(___)는 위에 열거된 구문에 나와 있는 입력 인수를 사용하여 검정에 대한 p-값 p도 반환합니다.

예제

[h,p,ci,stats] = ttest2(___)는 모집단 평균의 차에 대한 신뢰구간 ci와 검정 통계량에 대한 정보를 포함하는 구조체 stats도 반환합니다.

예제

모두 축소

2-표본 t-검정을 수행하여 평균이 같은지 검정하기

라이브 스크립트 열기

데이터 세트를 불러옵니다. 데이터 행렬의 첫 번째 열과 두 번째 열을 포함하는 벡터를 생성하여 두 시험에 대한 학생들의 성적을 나타냅니다.

load examgrades
x = grades(:,1);
y = grades(:,2);

'두 데이터 표본이 평균이 같은 모집단에서 추출된다'는 귀무가설을 검정합니다.

[h,p,ci,stats] = ttest2(x,y)

h = 0

p = 0.9867

ci = 2×1

   -1.9438
    1.9771

stats = struct with fields:
    tstat: 0.0167
       df: 238
       sd: 7.7084

반환된 값 h = 0은 ttest2가 디폴트 5% 유의수준에서 귀무가설을 기각하지 않음을 나타냅니다.

분산이 같다고 가정하지 않고 평균이 같은지 평가하는 t-검정

라이브 스크립트 열기

데이터 세트를 불러옵니다. 데이터 행렬의 첫 번째 열과 두 번째 열을 포함하는 벡터를 생성하여 두 시험에 대한 학생들의 성적을 나타냅니다.

load examgrades
x = grades(:,1);
y = grades(:,2);

'두 데이터 벡터가 평균이 같은 모집단에서 추출된다'는 귀무가설을 검정합니다. 이때 모집단의 분산은 같다고 가정하지 않습니다.

[h,p] = ttest2(x,y,'Vartype','unequal')

h = 0

p = 0.9867

반환된 값 h = 0은 ttest2가 분산이 같다고 가정하지 않는 경우에도 디폴트 5% 유의수준에서 귀무가설을 기각하지 않음을 나타냅니다.

단측, 2-표본 t-검정

라이브 스크립트 열기

표본 데이터를 불러옵니다. 차량 연도에 따라 차량 주행 거리 데이터에 레이블을 지정하는 categorical형 벡터를 만듭니다.

load carbig.mat;

decade = categorical(Model_Year < 80,[true,false],["70s","80s"]);

매 10년마다 마일리지 데이터의 상자 플롯을 만듭니다.

boxchart(decade,MPG)
xlabel("Decade")
ylabel("Mileage")

Figure contains an axes object. The axes object with xlabel Decade, ylabel Mileage contains an object of type boxchart.

매 10년마다 마일리지 데이터에서 벡터를 만듭니다. 왼쪽 꼬리, 2-표본 t-검정을 사용하여 '데이터가 평균이 같은 모집단에서 추출된다'는 귀무가설을 검정합니다. '1970년대에 만들어진 자동차의 마일리지에 대한 모집단 평균이 1980년대에 만들어진 자동차의 마일리지에 대한 모집단 평균보다 작다'는 대립가설을 사용합니다.

MPG70s = MPG(decade == "70s");
MPG80s = MPG(decade == "80s");

[h,~,~,stats] = ttest2(MPG70s,MPG80s,"Tail","left")

h = 1

stats = struct with fields:
    tstat: -14.0630
       df: 396
       sd: 6.3910

반환된 값 h = 1은 ttest2가 디폴트 유의수준 5%에서 귀무가설을 기각하고 '1970년대에 만들어진 자동차의 마일리지에 대한 모집단 평균이 1980년대에 만들어진 자동차의 마일리지에 대한 모집단 평균보다 작다'는 대립가설을 채택함을 나타냅니다.

해당 스튜던트 t-분포, 반환된 t-통계량, 임계 t-값을 플로팅합니다. tinv를 사용하여 디폴트 신뢰수준 95%에서 임계 t-값을 계산합니다.

nu = stats.df;
k = linspace(-15,15,300);
tdistpdf = tpdf(k,nu);
tval = stats.tstat

tval = -14.0630

tvalpdf = tpdf(tval,nu);
tcrit = -tinv(0.95,nu)

tcrit = -1.6487

plot(k,tdistpdf)
hold on
scatter(tval,tvalpdf,"filled")
xline(tcrit,"--")
legend(["Student's t pdf","t-statistic", ...
    "Critical Cutoff"])

Figure contains an axes object. The axes object contains 3 objects of type line, scatter, constantline. These objects represent Student's t pdf, t-statistic, Critical Cutoff.

주황색 점은 t-통계량을 나타내며 임계 t-값을 나타내는 검은색 파선의 왼쪽에 위치합니다.

입력 인수

모두 축소

`x` — 표본 데이터
벡터 | 행렬 | 다차원 배열

표본 데이터로, 벡터, 행렬 또는 다차원 배열로 지정됩니다. ttest2는 NaN 값을 누락 데이터로 처리하여 무시합니다.

x와 y가 벡터로 지정되는 경우 길이는 같지 않아도 됩니다.
x와 y가 행렬로 지정되는 경우 열의 개수가 같아야 합니다. ttest2는 각 열을 따라 개별적인 t-검정을 수행하고 결과값으로 구성된 벡터를 반환합니다.
x와 y가 다차원 배열로 지정되는 경우 첫 번째 비한원소 차원을 제외한 모든 차원을 따라 크기가 같아야 합니다.

데이터형: single | double

`y` — 표본 데이터
벡터 | 행렬 | 다차원 배열

표본 데이터로, 벡터, 행렬 또는 다차원 배열로 지정됩니다. ttest2는 NaN 값을 누락 데이터로 처리하여 무시합니다.

x와 y가 벡터로 지정되는 경우 길이는 같지 않아도 됩니다.
x와 y가 행렬로 지정되는 경우 열의 개수가 같아야 합니다. ttest2는 각 열을 따라 개별적인 t-검정을 수행하고 결과값으로 구성된 벡터를 반환합니다.
x와 y가 다차원 배열로 지정되는 경우 첫 번째 비한원소 차원을 제외한 모든 차원을 따라 크기가 같아야 합니다. ttest2는 첫 번째 비한원소 차원을 따라 동작을 수행합니다.

데이터형: single | double

이름-값 인수

선택적 인수 쌍을 Name1=Value1,...,NameN=ValueN으로 지정합니다. 여기서 Name은 인수 이름이고 Value는 대응값입니다. 이름-값 인수는 다른 인수 뒤에 와야 하지만, 인수 쌍의 순서는 상관없습니다.

R2021a 이전 릴리스에서는 쉼표를 사용하여 각 이름과 값을 구분하고 Name을 따옴표로 묶으십시오.

예: 'Tail','right','Alpha',0.01,'Vartype','unequal'은 1% 유의수준에서 오른쪽 꼬리 검정을 지정하고 x와 y가 동일한 모집단 분산을 가진다고 가정하지 않습니다.

`Alpha` — 유의수준
`0.05` (디폴트 값) | (0,1) 범위의 스칼라 값

가설검정의 유의수준으로, 'Alpha'와 함께 (0,1) 범위의 스칼라 값이 쉼표로 구분되어 지정됩니다.

예: 'Alpha',0.01

데이터형: single | double

`Dim` — 차원
첫 번째 비한원소 차원 (디폴트 값) | 양의 정수 값

평균을 검정할 때 따를 입력 행렬의 차원으로, 'Dim'과 함께 양의 정수 값이 쉼표로 구분되어 지정됩니다. 예를 들어, 'Dim',1을 지정하는 경우 열 평균을 검정하며, 'Dim',2를 지정하는 경우 행 평균을 검정합니다.

예: 'Dim',2

데이터형: single | double

`Tail` — 대립가설 유형
`'both'` (디폴트 값) | `'right'` | `'left'`

평가할 대립가설 유형으로, 'Tail'과 함께 다음 중 하나가 쉼표로 구분되어 지정됩니다.

'both' — '모집단 평균이 같지 않다'는 대립가설과 비교해 검정합니다.
'right' — 'x의 모집단 평균이 y의 모집단 평균보다 크다'는 대립가설과 비교해 검정합니다.
'left' — 'x의 모집단 평균이 y의 모집단 평균보다 작다'는 대립가설과 비교해 검정합니다.

ttest2 함수는 지정된 대립가설과 반대로 '모집단 평균이 같다'는 귀무가설을 검정합니다.

예: 'Tail','right'

`Vartype` — 분산 유형
`'equal'` (디폴트 값) | `'unequal'`

분산 유형으로, 'Vartype'과 함께 다음 중 하나가 쉼표로 구분되어 지정됩니다.

`'equal'`	`x`와 `y`가 알 수 없지만 서로 같은 분산을 갖는 정규분포에서 추출된다는 가정을 사용하여 검정을 수행합니다.
`'unequal'`	`x`와 `y`가 알 수 없으며 서로 다른 분산을 갖는 정규분포에서 추출된다는 가정을 사용하여 검정을 수행합니다. 이는 베렌스-피셔(Behrens-Fisher) 문제라고 합니다. `ttest2`는 유효 자유도를 얻기 위해 새터스웨이트(Satterthwaite)의 근삿값을 사용합니다.

Vartype의 분산 유형은 x가 행렬 또는 다차원 배열인 경우에도 하나여야 합니다.

예: 'Vartype','unequal'

출력 인수

모두 축소

`h` — 가설검정 결과
`1` | `0`

가설검정 결과로, 1 또는 0으로 반환됩니다.

h = 1이면 Alpha 유의수준에서 귀무가설이 기각됨을 나타냅니다.
h = 0이면 Alpha 유의수준에서 귀무가설이 기각되지 않음을 나타냅니다.

`p` — p-값
[0,1] 범위의 스칼라 값

검정의 p-값으로, [0,1] 범위의 스칼라 값으로 반환됩니다. p는 귀무가설 하의 관측값과 같거나 그보다 더 극단적인 검정 통계량이 관측될 확률입니다. p의 값이 작을 경우 귀무가설의 타당성에 의문이 제기됩니다.

`ci` — 신뢰구간
벡터

x와 y의 모집단 평균의 차에 대한 신뢰구간으로, 100 × (1 – Alpha)% 신뢰구간의 하한과 상한을 포함하는, 요소를 2개 가진 벡터로 반환됩니다.

`stats` — 검정 통계량
구조체

2-표본 t-검정에 대한 검정 통계량으로, 다음을 포함하는 구조체로 반환됩니다.

tstat — 검정 통계량의 값입니다.
df — 검정의 자유도입니다.
sd — 모집단 표준편차에 대한 합동 추정값(분산이 같은 경우)이거나 모집단 표준편차에 대한 비합동 추정값으로 구성된 벡터(분산이 같지 않은 경우)입니다.

세부 정보

모두 축소

2-표본 t-검정

2-표본 t-검정(Two-sample t-test)은 두 개의 독립적인 데이터 표본의 위치 모수를 비교하는 모수적 검정입니다.

검정 통계량은 다음과 같습니다.

$t = \frac{\bar{x} - \bar{y}}{\sqrt{\frac{s_{x}^{2}}{n} + \frac{s_{y}^{2}}{m}}},$

여기서 $\bar{x}$ 와 $\bar{y}$ 는 표본평균이고, s_x와 s_y는 표본 표준편차이며, n과 m은 표본 크기입니다.

두 데이터 표본이 분산이 같은 모집단에서 추출된다고 가정하는 경우, 귀무가설 하의 검정 통계량은 n + m – 2 자유도를 갖는 스튜던트 t 분포를 가지며, 표본 표준편차는 다음과 같은 합동 표준편차로 대체됩니다.

$s = \sqrt{\frac{(n - 1) s_{x}^{2} + (m - 1) s_{y}^{2}}{n + m - 2} .}$

두 데이터 표본이 분산이 같은 모집단에서 추출된다고 가정하지 않는 경우, 귀무가설 하의 검정 통계량은 새터스웨이트(Satterthwaite)의 근삿값으로 제공된 여러 자유도를 갖는 스튜던트 t 분포 근삿값을 가집니다. 이 검정은 Welch t-검정이라고도 합니다.

다차원 배열

다차원 배열은 3차원 이상을 갖습니다. 예를 들어, x가 1×3×4 배열이면 x는 3차원 배열입니다.

첫 번째 비한원소 차원

첫 번째 비한원소 차원은 배열에서 크기가 1이 아닌 첫 번째 차원입니다. 예를 들어, x가 1×2×3×4 배열이면 두 번째 차원이 x의 첫 번째 비한원소 차원입니다.

팁

다음을 계산하려면 sampsizepwr을 사용하십시오.
- 지정된 검정력과 모수 값에 대응되는 표본 크기,
- 실제 모수 값이 주어진 경우 특정 표본 크기에 대해 달성한 검정력,
- 지정된 표본 크기와 검정력으로 검색 가능한 모수 값.

확장 기능

GPU 배열
Parallel Computing Toolbox™를 사용해 GPU(그래픽스 처리 장치)에서 실행하여 코드 실행 속도를 높일 수 있습니다.

이 함수는 GPU 배열을 완전히 지원합니다. 자세한 내용은 GPU에서 MATLAB 함수 실행하기 (Parallel Computing Toolbox) 항목을 참조하십시오.

버전 내역

R2006a 이전에 개발됨

참고 항목

ttest | ztest | sampsizepwr

ttest2

구문

설명

예제

2-표본 t-검정을 수행하여 평균이 같은지 검정하기

분산이 같다고 가정하지 않고 평균이 같은지 평가하는 t-검정

단측, 2-표본 t-검정

입력 인수

x — 표본 데이터 벡터 | 행렬 | 다차원 배열

y — 표본 데이터 벡터 | 행렬 | 다차원 배열

이름-값 인수

Alpha — 유의수준 0.05 (디폴트 값) | (0,1) 범위의 스칼라 값

Dim — 차원 첫 번째 비한원소 차원 (디폴트 값) | 양의 정수 값

Tail — 대립가설 유형 'both' (디폴트 값) | 'right' | 'left'

Vartype — 분산 유형 'equal' (디폴트 값) | 'unequal'

출력 인수

h — 가설검정 결과 1 | 0

p — p-값 [0,1] 범위의 스칼라 값

ci — 신뢰구간 벡터

stats — 검정 통계량 구조체

세부 정보

2-표본 t-검정

다차원 배열

첫 번째 비한원소 차원

팁

확장 기능

GPU 배열 Parallel Computing Toolbox™를 사용해 GPU(그래픽스 처리 장치)에서 실행하여 코드 실행 속도를 높일 수 있습니다.

버전 내역

참고 항목

`x` — 표본 데이터
벡터 | 행렬 | 다차원 배열

`y` — 표본 데이터
벡터 | 행렬 | 다차원 배열

`Alpha` — 유의수준
`0.05` (디폴트 값) | (0,1) 범위의 스칼라 값

`Dim` — 차원
첫 번째 비한원소 차원 (디폴트 값) | 양의 정수 값

`Tail` — 대립가설 유형
`'both'` (디폴트 값) | `'right'` | `'left'`

`Vartype` — 분산 유형
`'equal'` (디폴트 값) | `'unequal'`

`h` — 가설검정 결과
`1` | `0`

`p` — p-값
[0,1] 범위의 스칼라 값

`ci` — 신뢰구간
벡터

`stats` — 검정 통계량
구조체

GPU 배열
Parallel Computing Toolbox™를 사용해 GPU(그래픽스 처리 장치)에서 실행하여 코드 실행 속도를 높일 수 있습니다.