이항분포

개요

이항분포는 2-모수 곡선족입니다. 이항분포는 공정한 동전을 10회 던질 때 앞면이 주어진 횟수만큼 나올 확률을 모델링하는 것과 같이, 성공 확률이 동일한 고정된 횟수의 독립 시행에서 총 성공 횟수를 모델링하는 데 사용됩니다.

Statistics and Machine Learning Toolbox™에서는 다음과 같이 이항분포를 사용하는 여러 방법을 제공합니다.

확률 분포를 표본 데이터에 피팅하거나(fitdist) 모수 값을 지정하여(makedist) 확률 분포 객체 BinomialDistribution을 생성합니다. 그런 다음 객체 함수를 사용하여 분포를 실행하고, 난수를 생성하는 등의 작업을 수행합니다.
분포 피팅기 앱을 사용하여 대화형 방식으로 이항분포를 사용합니다. 앱에서 객체를 내보내고 객체 함수를 사용할 수 있습니다.
지정된 분포 모수를 이용해 분포 전용 함수(binocdf, binopdf, binoinv, binostat, binofit, binornd)를 사용합니다. 분포 전용 함수는 여러 이항분포의 모수를 받을 수 있습니다.
일반 분포 함수(cdf, icdf, pdf, random)를 지정된 분포 이름('Binomial') 및 모수와 함께 사용합니다.

모수

이항분포는 다음 모수를 사용합니다.

모수	설명	지원
N	시행 횟수	양의 정수
p	단일 시행에서 성공할 확률	$0 \leq p \leq 1$

둘 다 동일한 모수 p를 갖는 두 이항 확률 변수의 합은 N이 이들 시행 횟수의 합과 같은 하나의 이항 확률 변수이기도 합니다.

확률 밀도 함수

이항분포의 확률 밀도 함수(pdf)는 다음과 같습니다.

$f (x | N, p) = (\begin{matrix} N \\ x \end{matrix}) p^{x} {(1 - p)}^{N - x}; x = 0, 1, 2, ..., N,$

여기서 x는 성공 확률이 p인 베르누이 과정의 N회 시행에서 성공 횟수입니다. 그 결과는 N회의 시행에서 정확히 x회의 성공 확률입니다. 이산 분포의 경우, pdf는 확률 질량 함수(pmf)로도 알려져 있습니다.

예제는 이항분포 pdf 계산하기 항목을 참조하십시오.

누적 분포 함수

이항분포의 누적 분포 함수(cdf)는 다음과 같습니다.

$F (x | N, p) = \sum_{i = 0}^{x} (\begin{matrix} N \\ i \end{matrix}) p^{i} {(1 - p)}^{N - i}; x = 0, 1, 2, ..., N,$

여기서 x는 성공 확률이 p인 베르누이 과정의 N회 시행에서 성공 횟수입니다. 그 결과는 N회의 시행에서 최대 x회의 성공 확률입니다.

예제는 이항분포 cdf 계산하기 항목을 참조하십시오.

기술 통계량

이항분포의 평균은 Np입니다.

이항분포의 분산은 Np(1 – p)입니다.

예

이항분포를 데이터에 피팅하기

라이브 스크립트 열기

각 시행에서 성공 확률 0.9로 100회 시행의 성공 횟수를 세는 이항 난수를 생성합니다.

x = binornd(100,0.9)

x = 
85

fitdist를 사용하여 이항분포를 데이터에 피팅합니다.

pd = fitdist(x,'Binomial','NTrials',100)

pd = 
  BinomialDistribution

  Binomial distribution
    N =  100
    p = 0.85   [0.764692, 0.913546]

fitdist는 BinomialDistribution 객체를 반환합니다. p 옆의 구간은 p를 추정하는 95% 신뢰구간입니다.

분포 함수를 사용하여 모수 p를 추정합니다.

[phat,pci] = binofit(x,100) % Distribution-specific function

phat = 
0.8500

pci = 1×2

    0.7647    0.9135

[phat2,pci2] = mle(x,'distribution','Binomial',"NTrials",100) % Generic distribution function

phat2 = 
0.8500

pci2 = 2×1

    0.7647
    0.9135

이항분포 pdf 계산하기

라이브 스크립트 열기

시행 횟수가 10이고 성공 확률이 0.5인 이항분포의 pdf를 계산합니다.

x = 0:10;
y = binopdf(x,10,0.5);

너비가 1인 막대로 pdf를 플로팅합니다.

figure
bar(x,y,1)
xlabel('Observation')
ylabel('Probability')

Figure contains an axes object. The axes object with xlabel Observation, ylabel Probability contains an object of type bar.

이항분포 cdf 계산하기

라이브 스크립트 열기

시행 횟수가 10이고 성공 확률이 0.5인 이항분포의 cdf를 계산합니다.

x = 0:10;
y = binocdf(x,10,0.5);

cdf를 플로팅합니다.

figure
stairs(x,y)
xlabel('Observation')
ylabel('Cumulative Probability')

Figure contains an axes object. The axes object with xlabel Observation, ylabel Cumulative Probability contains an object of type stair.

이항분포 pdf와 정규분포 pdf 비교하기

라이브 스크립트 열기

N이 크면 모수가 N과 p인 이항분포는 p가 너무 크거나 너무 작지 않을 경우 평균 N*p와 분산 N*p*(1–p)를 갖는 정규분포로 근사할 수 있습니다.

단일 시행에서 0.6의 확률로 50회 시행 시 성공 횟수를 세는 이항분포의 pdf를 계산합니다.

N = 50;
p = 0.6;
x1 = 0:N;
y1 = binopdf(x1,N,p);

대응되는 정규분포의 pdf를 계산합니다.

mu = N*p;
sigma = sqrt(N*p*(1-p));
x2 = 0:0.1:N;
y2 = normpdf(x2,mu,sigma);

동일한 축에 pdf를 플로팅합니다.

figure
bar(x1,y1,1)
hold on
plot(x2,y2,'LineWidth',2)
xlabel('Observation')
ylabel('Probability')
title('Binomial and Normal pdfs')
legend('Binomial Distribution','Normal Distribution','location','northwest')
hold off

Figure contains an axes object. The axes object with title Binomial and Normal pdfs, xlabel Observation, ylabel Probability contains 2 objects of type bar, line. These objects represent Binomial Distribution, Normal Distribution.

정규분포의 pdf가 이항분포의 pdf에 가깝습니다.

이항분포 pdf와 푸아송 분포 pdf 비교하기

라이브 스크립트 열기

p가 작으면 모수가 N과 p인 이항분포는 N*p도 작을 경우 평균 N*p를 갖는 푸아송 분포로 근사할 수 있습니다.

단일 시행에서 0.05의 성공 확률로 20회 시행 시 성공 횟수를 세는 이항분포의 pdf를 계산합니다.

N = 20;
p = 0.05;
x = 0:N;
y1 = binopdf(x,N,p);

대응되는 푸아송 분포의 pdf를 계산합니다.

mu = N*p;
y2 = poisspdf(x,mu);

동일한 축에 pdf를 플로팅합니다.

figure
bar(x,[y1; y2])
xlabel('Observation')
ylabel('Probability')
title('Binomial and Poisson pdfs')
legend('Binomial Distribution','Poisson Distribution','location','northeast')

Figure contains an axes object. The axes object with title Binomial and Poisson pdfs, xlabel Observation, ylabel Probability contains 2 objects of type bar. These objects represent Binomial Distribution, Poisson Distribution.

푸아송 분포의 pdf가 이항분포의 pdf에 가깝습니다.

참고 문헌

[1] Abramowitz, Milton, and Irene A. Stegun, eds. Handbook of Mathematical Functions: With Formulas, Graphs, and Mathematical Tables. 9. Dover print.; [Nachdr. der Ausg. von 1972]. Dover Books on Mathematics. New York, NY: Dover Publ, 2013.

[2] Evans, Merran, Nicholas Hastings, and Brian Peacock. Statistical Distributions. 2nd ed. New York: J. Wiley, 1993.

[3] Loader, Catherine. Fast and Accurate Computation of Binomial Probabilities. July 9, 2000.

참고 항목

이항분포

개요

모수

확률 밀도 함수

누적 분포 함수

기술 통계량

예

이항분포를 데이터에 피팅하기

이항분포 pdf 계산하기

이항분포 cdf 계산하기

이항분포 pdf와 정규분포 pdf 비교하기

이항분포 pdf와 푸아송 분포 pdf 비교하기

관련 분포

참고 문헌

참고 항목

도움말 항목