주요 콘텐츠

베타 분포

개요

베타 분포는 구간 [0,1]에서만 0이 아닌 곡선족을 설명합니다. 더 일반적인 버전의 함수는 모수를 구간의 끝점에 할당합니다.

Statistics and Machine Learning Toolbox™는 베타 분포를 사용하는 여러 방법을 제공합니다. 다음과 같은 접근법을 사용하여 표본 데이터에서 모수를 추정하고, pdf, cdf, icdf를 계산하고, 난수를 생성하는 등의 작업을 수행할 수 있습니다.

  • 확률 분포 객체를 표본 데이터에 피팅하거나 지정된 모수 값으로 확률 분포 객체를 만듭니다. 자세한 내용은 UsingBetaDistributionObjects 항목을 참조하십시오.

  • 확률 분포 함수를 사용하여 행렬, 테이블, dataset형 배열의 데이터 입력값으로 작업합니다. 베타 분포 함수 목록은 지원되는 분포 항목을 참조하십시오.

  • 앱 또는 사용자 인터페이스를 사용하여 분포에서 대화형 방식으로 피팅하고, 탐색하고, 난수를 생성합니다.

이러한 옵션 각각에 대한 자세한 내용은 확률 분포 사용하기 항목을 참조하십시오.

모수

베타 분포는 다음 모수를 사용합니다.

모수설명지원
a첫 번째 형태 모수a>0
b두 번째 형태 모수b>0

확률 밀도 함수

베타 분포에 대한 확률 밀도 함수(pdf)는 다음과 같습니다.

y=f(x|a,b)=1B(a,b)xa1(1x)b1I[0,1](x)

여기서 B( · )는 베타 함수입니다. 표시 함수 I[0,1](x)는 범위 [0,1] 내에 있는 x의 값만 0이 아닌 확률을 갖도록 합니다.

예제는 베타 분포 pdf 플로팅하기 항목을 참조하십시오.

누적 분포 함수

주어진 값 x와 주어진 모수 쌍 ab에 대한 베타 cdf는 다음과 같습니다.

p=F(x|a,b)=1B(a,b)0xta1(1t)b1dt

여기서 B( · )는 베타 함수입니다. 베타 cdf는 불완전 베타 함수와 동일합니다.

예제

베타 분포 pdf 플로팅하기

베타 분포 모수의 값을 변경하여 확률 분포 함수(pdf)의 형태를 바꿉니다.

3개의 베타 분포, 즉 형태 모수 ab가 0.75인 베타 분포, 1인 베타 분포, 4인 베타 분포의 pdf를 계산합니다.

x = 0:0.01:1;
y1 = betapdf(x,0.75,0.75);
y2 = betapdf(x,1,1);
y3 = betapdf(x,4,4);

3개의 pdf를 플로팅합니다.

plot(x,y1)
hold on
plot(x,y2)
plot(x,y3)
legend(["a = b = 0.75","a = b = 1","a = b = 4"]);
hold off

Figure contains an axes object. The axes object contains 3 objects of type line. These objects represent a = b = 0.75, a = b = 1, a = b = 4.

균일한 pdf(평평한 선)는 표준 균등분포가 베타 분포의 특수한 사례임을 보여줍니다. 이는 모수 ab가 1일 때 발생합니다.

베타 분포 모수 추정하기

베타 분포의 모수에 대한 최대가능도 추정값(MLE)을 계산합니다.

가능도 함수 최대화는 모수를 추정하는 데 널리 사용되는 기법입니다. 가능도 함수의 형식은 베타 확률 분포 함수(pdf)와 동일합니다. 그러나, pdf의 경우 모수는 알려진 상수이며 변수는 x입니다. 가능도 함수는 변수의 역할을 뒤바꿉니다. 즉, 표본 값(x의 값)은 이미 관측되어 있고 고정된 상수이며, 변수는 알 수 없는 모수입니다. 특정 데이터 세트가 주어진 경우 최대가능도 추정에는 가장 높은 가능도를 생성하는 모수의 값을 계산하는 과정이 포함됩니다.

a가 5이고 b가 0.2인 베타 분포에서 100개의 난수를 생성합니다. 함수 betafit은 베타 분포의 모수에 대한 MLE와 신뢰구간을 반환합니다.

rng("default") % For reproducibility
r = betarnd(5,0.2,100,1);
[phat, pci] = betafit(r)
phat = 1×2

    7.4911    0.2135

pci = 2×2

    5.0861    0.1744
   11.0334    0.2614

모수 a에 대한 MLE는 7.4911입니다. a에 대한 95% 신뢰구간은 5.0861에서 11.0334 사이이며 참값인 5를 포함하지 않습니다. 가능성은 낮지만 분포 모수를 추정할 때 이러한 결과가 발생할 수 있습니다.

모수 b에 대한 MLE는 0.2135입니다. b에 대한 95% 신뢰구간은 0.1744에서 0.2614 사이이며 참값인 0.2를 포함합니다.

관련 분포

베타 분포는 t 분포와 함수적 관계가 있습니다. Yν 자유도를 갖는 스튜던트 t 분포의 관측값이면 다음 변환은 X를 생성하며, 이는 베타 분포입니다.

X=12+12Yν+Y2

Y~t(v)이면 Xβ(ν2,ν2)입니다.

이 관계는 t cdf와 역함수의 값을 계산하는 데 사용되며 t 분포의 난수를 생성하는 데에도 사용됩니다.

참고 항목

도움말 항목