본문으로 바로가기

이산형 확률분포

category Math/Probability & Statistics 2021. 2. 15. 20:18

이산형 확률분포

1) 정의

    - discrete 확률 함수의 확률 값들의 분포

 

베르누이 분포 (Bernoulli Distribution)

1) 정의

    - 확률변수는 0 또는 1 의 실수값만을 가진다.

    - 베르누이 확률함수로부터 생성되는 확률들의 패턴이다.

$$f_{x}(x; p) = p^{x}(1-p)^{1-x}, x = 0\;\; or\;\; 1$$

 

2) 기대값

    - x는 0 또는 1만 가능

$$E[X]= \sum x \cdot p^{x}(1-p)^{1-x} = 0 + p = p$$

 

3) 분산

$$V[X]= E[x^{2}] - (E(x))^{2} = p - p^{2} = p(1-p)$$

 

이항분포(Binomial distribution)

1) 정의

    - n 번의 독립적인 베르누이 시행

    - n 번의 시행 중 성공한 회수

    - x = 0, 1, 2, ---, n

    - 분포는 parameters n 과 p 에 의해 모양이 결정된다.

$$p(x) = \binom{n}{x} p^{x}(1 - p)^{n-x}$$

교수님 슬라이드

2) 기대값

$$E[X] = \sum_{i = 0}^{n} \frac {i n!} {(n-i)! i!} p^{i} (1-p)^{n-i}$$

$$= np \sum_{i=1}^{n} \frac {i (n-1)!}{(n-i)!i!} p^{i-1} (1-p)^{n-i}$$

$$= np \sum_{i=1}^{n} \frac {(n-1)!}{(n-i)!(i-1)!} p^{i-1} (1-p)^{n-i}, let i -1 = k$$

$$= np \sum_{k=0}^{n} \frac {(n-1)!}{(n-k-1)!k!} p^{k} (1-p)^{n-1-k}$$

$$=np(p+(1-p)^{n-1})^{n-1}$$

$$=np$$

 

3) 분산

$$E[X^{2}]= np[(n-1)p+1]$$

$$V[X]= np(1-p)$$

 

4) proposition

    - X는 이항 확률 변수이고 n, p (0<p<1) 일 때, k는 0 ~ n, P{X= k}가 상승했다가 하강할때

      가장 큰 값일 때의 k 값은 (n+1)p 보다 작거나 같다.

$$\frac {P(X=k)}{P(X=k-1)} = \frac {(n-k+1)p}{k(1-p)}$$

$$k <= (n+1)p$$

 

Posisson Distribution (포아송 분포)

1) 정의

    - 단위 시간 안에 특정 사건이 몇번 발생할 것인지를 표현

    - 희박한 값에 대해 사용한다.

    - parameter = lambda

$$P(X=i) = \frac {e^{-\lambda}\lambda ^{i}}{i!}, i = 0, 1, 2, ...$$

$$\sum_{i=0}^{\infty} P(X=i)=e^{-\lambda}\sum_{i=0}^{\infty} \frac{\lambda^{i}}{i!} = e^{-\lambda}e^{\lambda} = 1$$

2) binomial과의 연관성

    - n이 독립이고 크며 p가 작을 때,프아송 분포가 근사한다.

$$\lambda = np$$

 

3) 예시

    - 어떤 집단에서 100세 이상 사는 사람의 수

    - 한 페이지에서 오타의 갯수

    - 하루에 전화를 잘못걸 횟수

 

4) 기대값

$$E[X] = \sum_{i=0}^{\infty} \frac {i e^{-\lambda}\lambda^{i}}{i!}$$

$$ = \lambda \sum_{i=0}^{\infty}\frac{e^{-\lambda}\lambda^{i-1}}{(i-1)!}, let\: k = i - 1$$

$$= \lambda \sum_{k=0}^{\infty} \frac{e^{-\lambda}\lambda^{k}}{k!} = \lambda e^{-\lambda}\sum_{k=0}^{\infty}\frac{\lambda^{k}}{k!}$$

$$= \lambda e^{-\lambda} e^{\lambda} = \lambda$$

 

5) 분산

$$E[X^{2}] = \lambda (\lambda + 1)$$

$$V[X] = \lambda ^{2} + \lambda - \lambda^{2} = \lambda$$

 

Geometric Distribution (기하분포)

1) 정의

    - 베르누이 정의에서 시행하는 실험으로 첫번째 성공이 일어날 때까지 시행 횟수

    - Parameter : p

$$P(X=n) = (1-p)^{n-1}p \;\;\; n = 1, 2, ...$$

$$\sum_{n=1}^{\infty}P(X=n) = p\sum_{n=1}^{\infty} (1-p)^{n-1} = \frac {p}{1-(1-p)} = 1$$

 

2) 기대값

$$P(X = i) = \sum_{i=1}^{\infty} i(1-p)^{i-1}p = p \sum_{i=1}^{\infty} i(1-p)^{i-1}, \;\;\; let 1-p = k$$

$$=p\sum_{i=1}^{\infty}i\cdot k^{i-1} = p\sum_{i=1}^{\infty}\frac {d}{dk}k^{i} = p\frac{d}{dk}\sum_{i=1}^{\infty}k^{i}$$

$$=p\frac{d}{dk}(\frac{k}{1-k} = p \frac{1-k+k}{(1-k)^{2}}$$

$$=p \frac{1}{p^{2}} = \frac{1}{p}$$

 

3) 분산

$$E[X^{2}] = \frac{2-p}{p^{2}}$$

$$V[X] = \frac{1-p}{p^{2}}$$

 

Negative Binomial Distribution (음이항분포)

1) 정의

    - 베르누이 정의에서 시행하는 실험으로 k 번째 성공을 위한 시행 횟수

    - 총 r 번째 성공을 위한 n 번째 시행확률

    - Parameter : r, p

$$P(X=n) = \binom{n-1}{r-1}p^{r}(1-p)^{n-r} \;\;\;\;\; n= r, r+1, ...$$

$$\sum_{n=r}^{\infty} P(X=n) = \sum_{n=r}^{\infty} \binom {n-1}{r-1}p^{r}(1-p)^{n-r} = 1$$

 

2) 기대값과 분산

$$E[X] = \frac {r}{p}$$

$$E[X^{2}] = \frac {r}{p}(\frac{r+1}{p} - 1)$$

$$Var(X) = \frac{r(1-p)}{p^{2}}$$

 

Hypergeometric Distribution (초기하 분포)

1) 정의

    - 제조업 분야에서 불량품의 발생 확률을 찾는데 종종 사용된다.

    - 총 N 개의 모집단에서 m과 N-m개가 존재할 때, without replacement (비복원)으로 n 개를 뽑는다.

    - Parameter : N, m, n

$$P(X=i) = \frac{\binom{m}{i}\binom{N-m}{n-i}}{\binom{N}{n}} \;\;\;\; i=0, 1, ..., n$$

 

2) 기대값과 분산

$$E[X] = \frac {nm}{N}$$

$$E[X^{2}]=\frac {nm}{N}E[Y+1]$$

$$Var(X)= \frac{N-n}{N-1}n\frac{m}{N}(1-\frac{m}{N})$$


고려대 김성범 교수님의 유튜브를 정리하였습니다. www.youtube.com/channel/UCueLU1pCvFlM8Y8sth7a6RQ