이산형 확률분포
1) 정의
- discrete 확률 함수의 확률 값들의 분포
베르누이 분포 (Bernoulli Distribution)
1) 정의
- 확률변수는 0 또는 1 의 실수값만을 가진다.
- 베르누이 확률함수로부터 생성되는 확률들의 패턴이다.
$$f_{x}(x; p) = p^{x}(1-p)^{1-x}, x = 0\;\; or\;\; 1$$
2) 기대값
- x는 0 또는 1만 가능
$$E[X]= \sum x \cdot p^{x}(1-p)^{1-x} = 0 + p = p$$
3) 분산
$$V[X]= E[x^{2}] - (E(x))^{2} = p - p^{2} = p(1-p)$$
이항분포(Binomial distribution)
1) 정의
- n 번의 독립적인 베르누이 시행
- n 번의 시행 중 성공한 회수
- x = 0, 1, 2, ---, n
- 분포는 parameters n 과 p 에 의해 모양이 결정된다.
$$p(x) = \binom{n}{x} p^{x}(1 - p)^{n-x}$$
2) 기대값
$$E[X] = \sum_{i = 0}^{n} \frac {i n!} {(n-i)! i!} p^{i} (1-p)^{n-i}$$
$$= np \sum_{i=1}^{n} \frac {i (n-1)!}{(n-i)!i!} p^{i-1} (1-p)^{n-i}$$
$$= np \sum_{i=1}^{n} \frac {(n-1)!}{(n-i)!(i-1)!} p^{i-1} (1-p)^{n-i}, let i -1 = k$$
$$= np \sum_{k=0}^{n} \frac {(n-1)!}{(n-k-1)!k!} p^{k} (1-p)^{n-1-k}$$
$$=np(p+(1-p)^{n-1})^{n-1}$$
$$=np$$
3) 분산
$$E[X^{2}]= np[(n-1)p+1]$$
$$V[X]= np(1-p)$$
4) proposition
- X는 이항 확률 변수이고 n, p (0<p<1) 일 때, k는 0 ~ n, P{X= k}가 상승했다가 하강할때
가장 큰 값일 때의 k 값은 (n+1)p 보다 작거나 같다.
$$\frac {P(X=k)}{P(X=k-1)} = \frac {(n-k+1)p}{k(1-p)}$$
$$k <= (n+1)p$$
Posisson Distribution (포아송 분포)
1) 정의
- 단위 시간 안에 특정 사건이 몇번 발생할 것인지를 표현
- 희박한 값에 대해 사용한다.
- parameter = lambda
$$P(X=i) = \frac {e^{-\lambda}\lambda ^{i}}{i!}, i = 0, 1, 2, ...$$
$$\sum_{i=0}^{\infty} P(X=i)=e^{-\lambda}\sum_{i=0}^{\infty} \frac{\lambda^{i}}{i!} = e^{-\lambda}e^{\lambda} = 1$$
2) binomial과의 연관성
- n이 독립이고 크며 p가 작을 때,프아송 분포가 근사한다.
$$\lambda = np$$
3) 예시
- 어떤 집단에서 100세 이상 사는 사람의 수
- 한 페이지에서 오타의 갯수
- 하루에 전화를 잘못걸 횟수
4) 기대값
$$E[X] = \sum_{i=0}^{\infty} \frac {i e^{-\lambda}\lambda^{i}}{i!}$$
$$ = \lambda \sum_{i=0}^{\infty}\frac{e^{-\lambda}\lambda^{i-1}}{(i-1)!}, let\: k = i - 1$$
$$= \lambda \sum_{k=0}^{\infty} \frac{e^{-\lambda}\lambda^{k}}{k!} = \lambda e^{-\lambda}\sum_{k=0}^{\infty}\frac{\lambda^{k}}{k!}$$
$$= \lambda e^{-\lambda} e^{\lambda} = \lambda$$
5) 분산
$$E[X^{2}] = \lambda (\lambda + 1)$$
$$V[X] = \lambda ^{2} + \lambda - \lambda^{2} = \lambda$$
Geometric Distribution (기하분포)
1) 정의
- 베르누이 정의에서 시행하는 실험으로 첫번째 성공이 일어날 때까지 시행 횟수
- Parameter : p
$$P(X=n) = (1-p)^{n-1}p \;\;\; n = 1, 2, ...$$
$$\sum_{n=1}^{\infty}P(X=n) = p\sum_{n=1}^{\infty} (1-p)^{n-1} = \frac {p}{1-(1-p)} = 1$$
2) 기대값
$$P(X = i) = \sum_{i=1}^{\infty} i(1-p)^{i-1}p = p \sum_{i=1}^{\infty} i(1-p)^{i-1}, \;\;\; let 1-p = k$$
$$=p\sum_{i=1}^{\infty}i\cdot k^{i-1} = p\sum_{i=1}^{\infty}\frac {d}{dk}k^{i} = p\frac{d}{dk}\sum_{i=1}^{\infty}k^{i}$$
$$=p\frac{d}{dk}(\frac{k}{1-k} = p \frac{1-k+k}{(1-k)^{2}}$$
$$=p \frac{1}{p^{2}} = \frac{1}{p}$$
3) 분산
$$E[X^{2}] = \frac{2-p}{p^{2}}$$
$$V[X] = \frac{1-p}{p^{2}}$$
Negative Binomial Distribution (음이항분포)
1) 정의
- 베르누이 정의에서 시행하는 실험으로 k 번째 성공을 위한 시행 횟수
- 총 r 번째 성공을 위한 n 번째 시행확률
- Parameter : r, p
$$P(X=n) = \binom{n-1}{r-1}p^{r}(1-p)^{n-r} \;\;\;\;\; n= r, r+1, ...$$
$$\sum_{n=r}^{\infty} P(X=n) = \sum_{n=r}^{\infty} \binom {n-1}{r-1}p^{r}(1-p)^{n-r} = 1$$
2) 기대값과 분산
$$E[X] = \frac {r}{p}$$
$$E[X^{2}] = \frac {r}{p}(\frac{r+1}{p} - 1)$$
$$Var(X) = \frac{r(1-p)}{p^{2}}$$
Hypergeometric Distribution (초기하 분포)
1) 정의
- 제조업 분야에서 불량품의 발생 확률을 찾는데 종종 사용된다.
- 총 N 개의 모집단에서 m과 N-m개가 존재할 때, without replacement (비복원)으로 n 개를 뽑는다.
- Parameter : N, m, n
$$P(X=i) = \frac{\binom{m}{i}\binom{N-m}{n-i}}{\binom{N}{n}} \;\;\;\; i=0, 1, ..., n$$
2) 기대값과 분산
$$E[X] = \frac {nm}{N}$$
$$E[X^{2}]=\frac {nm}{N}E[Y+1]$$
$$Var(X)= \frac{N-n}{N-1}n\frac{m}{N}(1-\frac{m}{N})$$
고려대 김성범 교수님의 유튜브를 정리하였습니다. www.youtube.com/channel/UCueLU1pCvFlM8Y8sth7a6RQ
'Math > Probability & Statistics' 카테고리의 다른 글
Sampling Distributions, Central Limit Theorem (0) | 2021.02.17 |
---|---|
분산, 공분산, 상관관계, 기대값의 특성 (0) | 2021.02.17 |
Joint Probability Distribution (결합확률분포), Convolution (0) | 2021.02.17 |
연속형 확률 변수 (0) | 2021.02.16 |
확률 변수 (Random Variable) (0) | 2021.02.15 |