Processing math: 100%
본문으로 바로가기

이산형 확률분포

category MathProbability & Statistics 4년 전

이산형 확률분포

1) 정의

    - discrete 확률 함수의 확률 값들의 분포

 

베르누이 분포 (Bernoulli Distribution)

1) 정의

    - 확률변수는 0 또는 1 의 실수값만을 가진다.

    - 베르누이 확률함수로부터 생성되는 확률들의 패턴이다.

fx(x;p)=px(1p)1x,x=0or1

 

2) 기대값

    - x는 0 또는 1만 가능

E[X]=xpx(1p)1x=0+p=p

 

3) 분산

V[X]=E[x2](E(x))2=pp2=p(1p)

 

이항분포(Binomial distribution)

1) 정의

    - n 번의 독립적인 베르누이 시행

    - n 번의 시행 중 성공한 회수

    - x = 0, 1, 2, ---, n

    - 분포는 parameters n 과 p 에 의해 모양이 결정된다.

p(x)=(nx)px(1p)nx

교수님 슬라이드

2) 기대값

E[X]=ni=0in!(ni)!i!pi(1p)ni

=npni=1i(n1)!(ni)!i!pi1(1p)ni

=npni=1(n1)!(ni)!(i1)!pi1(1p)ni,leti1=k

=npnk=0(n1)!(nk1)!k!pk(1p)n1k

=np(p+(1p)n1)n1

=np

 

3) 분산

E[X2]=np[(n1)p+1]

V[X]=np(1p)

 

4) proposition

    - X는 이항 확률 변수이고 n, p (0<p<1) 일 때, k는 0 ~ n, P{X= k}가 상승했다가 하강할때

      가장 큰 값일 때의 k 값은 (n+1)p 보다 작거나 같다.

P(X=k)P(X=k1)=(nk+1)pk(1p)

k<=(n+1)p

 

Posisson Distribution (포아송 분포)

1) 정의

    - 단위 시간 안에 특정 사건이 몇번 발생할 것인지를 표현

    - 희박한 값에 대해 사용한다.

    - parameter = lambda

P(X=i)=eλλii!,i=0,1,2,...

i=0P(X=i)=eλi=0λii!=eλeλ=1

2) binomial과의 연관성

    - n이 독립이고 크며 p가 작을 때,프아송 분포가 근사한다.

λ=np

 

3) 예시

    - 어떤 집단에서 100세 이상 사는 사람의 수

    - 한 페이지에서 오타의 갯수

    - 하루에 전화를 잘못걸 횟수

 

4) 기대값

E[X]=i=0ieλλii!

=λi=0eλλi1(i1)!,letk=i1

=λk=0eλλkk!=λeλk=0λkk!

=λeλeλ=λ

 

5) 분산

E[X2]=λ(λ+1)

V[X]=λ2+λλ2=λ

 

Geometric Distribution (기하분포)

1) 정의

    - 베르누이 정의에서 시행하는 실험으로 첫번째 성공이 일어날 때까지 시행 횟수

    - Parameter : p

P(X=n)=(1p)n1pn=1,2,...

n=1P(X=n)=pn=1(1p)n1=p1(1p)=1

 

2) 기대값

P(X=i)=i=1i(1p)i1p=pi=1i(1p)i1,let1p=k

=pi=1iki1=pi=1ddkki=pddki=1ki

=pddk(k1k=p1k+k(1k)2

=p1p2=1p

 

3) 분산

E[X2]=2pp2

V[X]=1pp2

 

Negative Binomial Distribution (음이항분포)

1) 정의

    - 베르누이 정의에서 시행하는 실험으로 k 번째 성공을 위한 시행 횟수

    - 총 r 번째 성공을 위한 n 번째 시행확률

    - Parameter : r, p

P(X=n)=(n1r1)pr(1p)nrn=r,r+1,...

n=rP(X=n)=n=r(n1r1)pr(1p)nr=1

 

2) 기대값과 분산

E[X]=rp

E[X2]=rp(r+1p1)

Var(X)=r(1p)p2

 

Hypergeometric Distribution (초기하 분포)

1) 정의

    - 제조업 분야에서 불량품의 발생 확률을 찾는데 종종 사용된다.

    - 총 N 개의 모집단에서 m과 N-m개가 존재할 때, without replacement (비복원)으로 n 개를 뽑는다.

    - Parameter : N, m, n

P(X=i)=(mi)(Nmni)(Nn)i=0,1,...,n

 

2) 기대값과 분산

E[X]=nmN

E[X2]=nmNE[Y+1]

Var(X)=NnN1nmN(1mN)


고려대 김성범 교수님의 유튜브를 정리하였습니다. www.youtube.com/channel/UCueLU1pCvFlM8Y8sth7a6RQ