확률분포
"이항 모형"은 여기로 리디렉션됩니다. 옵션 가격 결정의 이항 모형에 대해서는 이항 옵션 가격 결정 모형을 참조하십시오. 이항 분포 확률질량함수
누적분포함수
표기법 B ( n , p ) {\displaystyle B(n,p)} 매개변수 n ∈ {0 , 1 , 2 , …} {\displaystyle n\in \{0, 1, 2,\ldots \} – 시행 횟수 p ∈ [0 , 1 ] {\displaystyle p\in[0,1]} – 각 시행에 대한 성공 확률 q = 1 − p {\displaystyle q=1-p} 지지하다 k ∈ { 0 , 1 , …, n } {\displaystyle k\in \{0,1,\ldots,n\} – 성공 횟수PMF ( n k ) p k q n − k {\displaystyle {\binom {n}{k}}p^{k}q^{n-k}} CDF Iq (n - k , 1 + k ) {\displaystyle I_{q}(n-k, 1 + k)} (정규화된 불완전 베타 함수 )의미하다 n p {\displaystyle np} 중앙값 ⌊ n p ⌋ {\displaystyle \lfloor np\rfoor} 또는 ⌈ np ⌉ {\displaystyle \lceil np\rceil} 모드 ⌊ ( n + 1 ) p ⌋ {\displaystyle \lfloor (n+1)p\rfoor} 또는 ⌈ (n + 1 ) p ⌉ - 1 {\displaystyle \lceil (n+1)p\rceil -1} 분산 n p q {\displaystyle npq} 왜도 q − p n p q {\displaystyle {\frac {q-p}{\sqrt {npq}}}} 절두술 1 − 6 p q n p q {\displaystyle {\frac {1-6pq}{npq}} 엔트로피 1 2 로그. 2 ( 2 π e n p q ) + O ( 1 n ) {\displaystyle {\frac {1}{2}}\log _{2}(2\pienpq)+ O\left({\frac {1}{n}}\right)} 샤논으로 nats 의 경우 로그의 자연로그를 사용합니다. MGF ( q + p e t ) n {\displaystyle(q+pe^{t})^{n} CF ( q + p e i t ) n {\displaystyle(q+pe^{it})^{n} PGF G ( z ) = [ q + p z ] n {\displaystyle G(z)=[q+pz]^ {n}} 피셔 정보 g n ( p ) = n p q {\displaystyle g_{n}(p)={\frac {n}{pq}}} (고정 n 의 경우 {\displaystyle n })
p = 0.5 {\displaystyle p=0.5} 에 대한 이항 분포파스칼의 삼각형 에서 n 과 k로 8층(n = 8)으로 된 Galton 박스 의 공이 중앙 빈(k = 4)에 들어갈 확률은 70 / 256 {\displaystyle 70/256} 입니다. 확률 이론 과 통계학 에서, 모수 n 과 p 를 갖는 이항 분포 는 n개 의 독립적 인 실험 에서 성공 횟수의 이산 확률 분포이며, 각각은 예-아니오 질문 을 합니다. 성공 (확률 p ) 또는 실패 (확률 q = 1 - p {\displaystyle q = 1 - p}) 라는 각각의 부울 값 결과를 가지고 있습니다 .단일 성공/failure 실험은 Bernouli 실험 또는 Bernouli 실험이라고도 하며, 일련의 결과를 Bernouli 과정 이라고 합니다. 즉, n = 1인 단일 실험의 경우 이항 분포는 Bernouli 분포 입니다. 이항 분포는 통계적 유의성 에 대한 대중적 이항 검정 의 기초가 됩니다.[1]
이항 분포는 크기가 N 인 모집단에서 대체 하여 추출한 크기 n 인 표본의 성공 횟수를 모형화하는 데 자주 사용됩니다. 표본 추출이 대체 없이 수행되는 경우, 추출은 독립적이지 않으므로 결과적인 분포는 이항 분포가 아닌 기하학적 분포입니다. 그러나 n 보다 훨씬 큰 N 의 경우 이항 분포가 양호한 근사치를 유지하며 널리 사용됩니다.
정의들 확률질량함수 일반적으로 랜덤 변수 X 가 매개 변수 n ∈ N {\displaystyle \mathbb {N}} 과 p ∈ [0,1]인 이항 분포를 따를 경우 X ~ B(n , p)로 적습니다. n개 의 독립적인 베르누이 실험에서 정확히 k개 의 성공을 얻을 확률은 확률 질량 함수 에 의해 주어집니다.
f ( k , n , p ) = Pr ( k ; n , p ) = Pr ( X = k ) = ( n k ) p k ( 1 − p ) n − k {\displaystyle f(k,n,p)=\pr(k;n,p)=\pr(X=k)={\binom {n}{k}}p^{k}(1-p)^{n-k}} 포크 = 0, 1, 2, ..., n , 여기서
( n k ) = n ! k ! ( n − k ) ! {\displaystyle {\binom {n}{k}}={\frac {n! }{k!(n-k)!}}} 는 이항 계수 이므로 분포의 이름입니다. 수식은 다음과 같이 이해할 수 있습니다: k개 의 성공은 확률 p 에서k 발생 하고 n - k개 의 실패는 확률 (1 - p ) n - k {\ displaystyle ( 1 - p)^{n - k}. 그러나 k개 의 성공은 n개 의 시행 중 어디에서나 발생할 수 있습니다. n개 의 시행으로 k개 의 성공을 분배하는 방법은 (n k) {\ displaystyle {\tbinom {n}{k}} 가지입니다 .
이항 분포 확률에 대한 참조표를 작성할 때 일반적으로 표는 최대 n/2개의 값으로 채워집니다. 왜냐하면 k > n /2의 경우, 확률은 다음과 같이 보어에 의해 계산될 수 있기 때문입니다.
f ( k , n , p ) = f ( n − k , n , 1 − p ) . {\displaystyle f(k,n,p)=f(n-k,n,1-p).} 식 f (k , n , p )를 k 의 함수로 보면, 이를 극대화 하는 k 값이 있습니다. 이 k 값은 다음을 계산하여 알 수 있습니다.
f ( k + 1 , n , p ) f ( k , n , p ) = ( n − k ) p ( k + 1 ) ( 1 − p ) {\displaystyle {\frac {f(k+1,n,p)}{f(k,n,p)}={\frac {(n-k)p}{(k+1)(1-p)}} 1과 비교해 보겠습니다. 다음을[2] 만족시키는 정수 M 이 항상 존재합니다.
( n + 1 ) p − 1 ≤ M < ( n + 1 ) p . {\displaystyle (n+1)p-1\leq M<(n+1)p.} (n + 1)p 가 정수 인 경우 를 제외하고 f(k , n, p)는 k < M일 때 단조 증가하고 k > M일 때 단조 감소합니다. 이 경우 f 가 최대가 되는 값은 (n + 1)p 와 (n + 1)p - 1 두 가지입니다. M 은 베르누이 시행에서 가장 가능성 이 높은 (즉, 가장 가능성이 높은) 결과이며 모드 라고 불립니다.
예 편향된 동전 을 던졌을 때 0.3의 확률로 앞면이 나온다고 가정합니다.6번의 던지기에서 정확히 4번의 머리를 볼 확률은
f ( 4 , 6 , 0.3 ) = ( 6 4 ) 0.3 4 ( 1 − 0.3 ) 6 − 4 = 0.059535. {\displaystyle f(4,6,0.3)={\binom {6}{4}}0.3^{4}(1-0.3)^{6-4}=0.059535.} 누적분포함수 누적 분포 함수 는 다음과 같이 나타낼 수 있습니다.
F ( k ; n , p ) = Pr ( X ≤ k ) = ∑ i = 0 ⌊ k ⌋ ( n i ) p i ( 1 − p ) n − i , {\displaystyle F(k;n,p)=\Pr(X\leq k)=\sum _{i=0}^{\lfloor k\rfloor }{n \choose i}p^{i}(1-p)^{n-i}} 여기서 ⌊ k ⌋ {\displaystyle \lfloor k\rfluor} 는 k 아래 의 "바닥", 즉 k 보다 작거나 같은 최대 정수 입니다.
다음과 같이 정규화 된 불완전 베타 함수 로 나타낼 수도 있습니다.[3]
F ( k ; n , p ) = Pr ( X ≤ k ) = I 1 − p ( n − k , k + 1 ) = ( n − k ) ( n k ) ∫ 0 1 − p t n − k − 1 ( 1 − t ) k d t . {\displaystyle {\begin{aligned}F(k;n,p)&=\Pr(X\leq k)\&=I_{1-p}(n-k,k+1)\&=(n-k){n \choose k}\int _{0}^{1-p}^{n-k-1}\,dt. \end{aligned}} F-분포 의 누적분포함수와 동일 한 값:[4]
F ( k ; n , p ) = F F -distrib 분배 ( x = 1 − p p k + 1 n − k ; d 1 = 2 ( n − k ) , d 2 = 2 ( k + 1 ) ) . {\displaystyle F(k;n,p)= F_{F{\text{-distribution}}}\left(x={\frac {1-p}{p}}{\frac {k+1}{n-k}};d_{1}=2(n-k),d_{2}=2(k+1)\right).} 누적 분포 함수에 대한 몇 가지 폐쇄형 경계가 아래 에 나와 있습니다.
특성. 기댓값 및 분산 X ~ B (n , p ), 즉 X 가 이항 분포된 랜덤 변수이며 n이 실험 의 총 개수이고 p가 각 실험에서 성공적인 결과를 얻을 확률은 다음 과 같습니다.[5]
E [ X ] = n p . {\displaystyle \operatorname {E} [X]=np.} 이는 기대 값의 선형성과 함께 X 가 기대 값 이 p 인 n개의 동일한 베르누이 확률 변수의 합이라는 사실에서 따옵니다. 즉, 만약 X 1 , …, X n {\displaystyle X_{1},\ldots,X_{n}} 이 매개변수 p 를 갖는 동일한(그리고 독립적인) 베르누이 확률변수라면, X = X 1 + ⋯ + X n {\displaystyle X=X_{1 } +\cdots +X_{n}, 그리고
E [ X ] = E [ X 1 + ⋯ + X n ] = E [ X 1 ] + ⋯ + E [ X n ] = p + ⋯ + p = n p . {\displaystyle \operatorname {E} [X]=\operatorname {E} [X_{1}+\cdots +X_{n}]=\operatorname {E} [X_{1}]+\cdots +\operatorname {E} [X_{n}]=p+\cdots +p=np.} 분산 은 다음과 같습니다.
Var ( X ) = n p