이산형 확률분포
1) 정의
- discrete 확률 함수의 확률 값들의 분포
베르누이 분포 (Bernoulli Distribution)
1) 정의
- 확률변수는 0 또는 1 의 실수값만을 가진다.
- 베르누이 확률함수로부터 생성되는 확률들의 패턴이다.
fx(x;p)=px(1−p)1−x,x=0or1
2) 기대값
- x는 0 또는 1만 가능
E[X]=∑x⋅px(1−p)1−x=0+p=p
3) 분산
V[X]=E[x2]−(E(x))2=p−p2=p(1−p)
이항분포(Binomial distribution)
1) 정의
- n 번의 독립적인 베르누이 시행
- n 번의 시행 중 성공한 회수
- x = 0, 1, 2, ---, n
- 분포는 parameters n 과 p 에 의해 모양이 결정된다.
p(x) = \binom{n}{x} p^{x}(1 - p)^{n-x}

2) 기대값
E[X] = \sum_{i = 0}^{n} \frac {i n!} {(n-i)! i!} p^{i} (1-p)^{n-i}
= np \sum_{i=1}^{n} \frac {i (n-1)!}{(n-i)!i!} p^{i-1} (1-p)^{n-i}
= np \sum_{i=1}^{n} \frac {(n-1)!}{(n-i)!(i-1)!} p^{i-1} (1-p)^{n-i}, let i -1 = k
= np \sum_{k=0}^{n} \frac {(n-1)!}{(n-k-1)!k!} p^{k} (1-p)^{n-1-k}
=np(p+(1-p)^{n-1})^{n-1}
=np
3) 분산
E[X^{2}]= np[(n-1)p+1]
V[X]= np(1-p)
4) proposition
- X는 이항 확률 변수이고 n, p (0<p<1) 일 때, k는 0 ~ n, P{X= k}가 상승했다가 하강할때
가장 큰 값일 때의 k 값은 (n+1)p 보다 작거나 같다.
\frac {P(X=k)}{P(X=k-1)} = \frac {(n-k+1)p}{k(1-p)}
k <= (n+1)p
Posisson Distribution (포아송 분포)
1) 정의
- 단위 시간 안에 특정 사건이 몇번 발생할 것인지를 표현
- 희박한 값에 대해 사용한다.
- parameter = lambda
P(X=i) = \frac {e^{-\lambda}\lambda ^{i}}{i!}, i = 0, 1, 2, ...
\sum_{i=0}^{\infty} P(X=i)=e^{-\lambda}\sum_{i=0}^{\infty} \frac{\lambda^{i}}{i!} = e^{-\lambda}e^{\lambda} = 1
2) binomial과의 연관성
- n이 독립이고 크며 p가 작을 때,프아송 분포가 근사한다.
\lambda = np
3) 예시
- 어떤 집단에서 100세 이상 사는 사람의 수
- 한 페이지에서 오타의 갯수
- 하루에 전화를 잘못걸 횟수
4) 기대값
E[X] = \sum_{i=0}^{\infty} \frac {i e^{-\lambda}\lambda^{i}}{i!}
= \lambda \sum_{i=0}^{\infty}\frac{e^{-\lambda}\lambda^{i-1}}{(i-1)!}, let\: k = i - 1
= \lambda \sum_{k=0}^{\infty} \frac{e^{-\lambda}\lambda^{k}}{k!} = \lambda e^{-\lambda}\sum_{k=0}^{\infty}\frac{\lambda^{k}}{k!}
= \lambda e^{-\lambda} e^{\lambda} = \lambda
5) 분산
E[X^{2}] = \lambda (\lambda + 1)
V[X] = \lambda ^{2} + \lambda - \lambda^{2} = \lambda
Geometric Distribution (기하분포)
1) 정의
- 베르누이 정의에서 시행하는 실험으로 첫번째 성공이 일어날 때까지 시행 횟수
- Parameter : p
P(X=n) = (1-p)^{n-1}p \;\;\; n = 1, 2, ...
\sum_{n=1}^{\infty}P(X=n) = p\sum_{n=1}^{\infty} (1-p)^{n-1} = \frac {p}{1-(1-p)} = 1
2) 기대값
P(X = i) = \sum_{i=1}^{\infty} i(1-p)^{i-1}p = p \sum_{i=1}^{\infty} i(1-p)^{i-1}, \;\;\; let 1-p = k
=p\sum_{i=1}^{\infty}i\cdot k^{i-1} = p\sum_{i=1}^{\infty}\frac {d}{dk}k^{i} = p\frac{d}{dk}\sum_{i=1}^{\infty}k^{i}
=p\frac{d}{dk}(\frac{k}{1-k} = p \frac{1-k+k}{(1-k)^{2}}
=p \frac{1}{p^{2}} = \frac{1}{p}
3) 분산
E[X^{2}] = \frac{2-p}{p^{2}}
V[X] = \frac{1-p}{p^{2}}
Negative Binomial Distribution (음이항분포)
1) 정의
- 베르누이 정의에서 시행하는 실험으로 k 번째 성공을 위한 시행 횟수
- 총 r 번째 성공을 위한 n 번째 시행확률
- Parameter : r, p
P(X=n) = \binom{n-1}{r-1}p^{r}(1-p)^{n-r} \;\;\;\;\; n= r, r+1, ...
\sum_{n=r}^{\infty} P(X=n) = \sum_{n=r}^{\infty} \binom {n-1}{r-1}p^{r}(1-p)^{n-r} = 1
2) 기대값과 분산
E[X] = \frac {r}{p}
E[X^{2}] = \frac {r}{p}(\frac{r+1}{p} - 1)
Var(X) = \frac{r(1-p)}{p^{2}}
Hypergeometric Distribution (초기하 분포)
1) 정의
- 제조업 분야에서 불량품의 발생 확률을 찾는데 종종 사용된다.
- 총 N 개의 모집단에서 m과 N-m개가 존재할 때, without replacement (비복원)으로 n 개를 뽑는다.
- Parameter : N, m, n
P(X=i) = \frac{\binom{m}{i}\binom{N-m}{n-i}}{\binom{N}{n}} \;\;\;\; i=0, 1, ..., n
2) 기대값과 분산
E[X] = \frac {nm}{N}
E[X^{2}]=\frac {nm}{N}E[Y+1]
Var(X)= \frac{N-n}{N-1}n\frac{m}{N}(1-\frac{m}{N})
고려대 김성범 교수님의 유튜브를 정리하였습니다. www.youtube.com/channel/UCueLU1pCvFlM8Y8sth7a6RQ