본문으로 바로가기

연속형 확률 변수

category Math/Probability & Statistics 2021. 2. 16. 15:14

Uniform distribution (일양 분포)

1) 정의 - pdf

    - interval 내에서 확률변수의 값이 일정하다.

    - 그 외에는 0이다.

$$f(x) = \frac{1}{\beta - \alpha}\;\;\;\;\; if \alpha < x < \beta$$

 

2) 정의 - cdf

$$F(a) = \int_{-\infty}^{a} f(x)dx$$

교수님 슬라이드

3) 기대값, 분산

$$E[X] = \frac{\beta + \alpha}{2}$$

$$E[X^{2}] = \frac {\beta^{2}+\alpha\beta+\alpha^{2}}{3}$$

$$V[X] = E[X^{2}]-(E[X])^{2} = \frac {(\beta - \alpha)^{2}}{12}$$

 

Normal distribution (정규 분포)

1) 정의

    - 정규 확률 변수 또는 정규 분포는 모든 실수를 가지고 있다.

    - Parameter : mu, sigma^2

$$f(x; \mu, \sigma) = \frac {1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}(\frac{x-\mu}{\sigma})^{2}},\;\;\; -\infty < x<\infty$$

출처 : https://analystprep.com/cfa-level-1-exam/quantitative-methods/key-properties-normal-distribution/

2) 특성

    - 정규 확률 변수 (x)가 평균(mu)일 때, 확률이 가장 크다.

    - 평균을 중심으로 좌우대칭

    - sigma가 달라지면 퍼짐의 정도가 달라진다.

 

3) 기대값과 분산

$$E[X] = \int_{-\infty}^{\infty}xf(x)dx =\int_{-\infty}^{\infty}x \frac {1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}(\frac{x-\mu}{\sigma})^{2}}dx  =  \mu$$

$$V[X] = \sigma^{2}$$

$$Std[X] = \sigma$$

 

4) 이산형 확률 분포의 근사

    - 이항 분포의 cdf를 구할 때, 정규분포로 근사하여 간편하게 구하는데 사용한다.

    - 이항 분포 파라미터 n의 값이 충분히 크고 p의 값이 0 또는 1에 가깝지 않다면 정규분포와 비슷하다.

$$X ~ Binomial (n, p) \approx Y ~ Normal (np, np(1-p))$$

출처 : https://blogs.sas.com/content/iml/2012/03/14/the-normal-approximation-to-the-binomial-distribution-how-the-quantiles-compare.html

$$\frac{X-np}{\sqrt{np(1-p)}}$$

    - 이항분포를 정규분포로 보다 정확하게 근사하기 위해 P{X=i} -> P{i-0.5 < X < i+0.5} 해준다.

 

Standard normal distribution (표준정규분포)

1) 정의

    - 정규분포를 따르면서 평균이 0이고 표준편차가 1인 경우이다.

    - Parameter : Z

$$Z = \frac {X- \mu}{\sigma}$$

$$pdf\;:\; let \mu=0,\;\sigma=1, \varphi (z) = \frac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}z^{2}}$$

$$cdf\;:\;\Phi (z) = P[Z\leq z]$$

2) 특성

    - 0에 대칭이다.

 

3) X가 특정 구간 안에 있을 확률

    - 표준정규분포로 변환하여 계산하면 간단하다.

$$N(\mu, \sigma^{2})$$

$$P[a\leq X \leq b] = P[\frac{a-\mu}{\sigma}\leq\frac{X-\mu}{\sigma}\leq\frac{b-\mu}{\sigma}] = P[\frac{a-\mu}{\sigma}\leq Z\leq\frac{b-\mu}{\sigma}]$$

$$=P[Z\leq\frac{b-\mu}{\sigma}]-P[Z\leq\frac{a-\mu}{\sigma}]$$

$$=\Phi(\frac{f-\mu}{\sigma})-\Phi(\frac{a-\mu}{\sigma})$$

 

Exponential distribution (지수 분포)

1) 정의

    - 연속형 확률 변수로 pdf와 cdf가 있다.

    - 시간과 관련 있기 때문에 항상 0 보다 크다.

$$pdf\;:\;f(x)= \lambda e^{-\lambda x}\; if \; x\geq 0, 0 \;if \; x < 0$$

$$cdf\;:\;F(x) = 0 \; if \; x < 0, \; 1-e^{-\lambda x},\; if \; x \geq 0$$

    - 프아송 분포에서 발생된 이벤트 간 시간을 나타낸다.

    - 람다 : 단위 시간 당 event 발생 평균 수

교수님 슬라이드

2) 기대값과 분산

$$E[X] = \frac {1}{\lambda}$$

$$E[X^{2}]=\frac {2}{\lambda^{2}}$$

$$V[X] = \frac {1}{\lambda^{2}}$$

 

3) Memoryless property (기억상실 특성)

    - X가 t시간 이상 진행했다는 가정하에 s시간 더 갈 확률은 s시간 갈 확률과 같다.

    - 과거는 중요하지 않다는 의미이다.

$$P[X \geq + t|X\geq t] = P[X \geq s]\;\;\;\;\; for \forall s, t \geq 0$$

 

4) Poisson vs Exponential

    - 프아송 : 특정 시간 또는 장소에서 사건이 몇번 일어날지에 대한 확률을 계산한다.

    - 지수 : 프아송 분포로부터 발생하는 사건 간의 시간

 

Gamma distribution (감마 분포)

1) 정의

    - 지수분포의 일반화된 형태 (더 큰 개념)

    - k 개의 이벤트가 발생할 때까지의 시간

    - Parameter : alpha, lambda

    - alpha : shape parameter (형상모수)

    - lambda : rate (scale) parameter (척도모수)

$$f(x) = \frac {\lambda^{\alpha}}{\Gamma(\alpha)}x^{\alpha - 1}e^{-\lambda x}\;\;\; for \; x > 0$$

$$Gamma function\;:\; \Gamma(a) = \int_{0}^{\infty} x^{\alpha - 1}e^{-x}$$

 

2) 특성

    - 지수분포는 감마분포에서 alpha가 1인 경우에 해당한다.

$$Gamma(1, \lambda) = Exponential(\lambda)$$

$$f_{x}(x) = \frac {\lambda}{\Gamma(1)}x^{1-1}e^{-\lambda x} = \lambda e^{-\lambda x}$$

 

3) 기대값과 분산

$$E[X] = \frac {\alpha}{\lambda}$$

$$V[X] = \frac {\alpha}{\lambda ^{2}}$$

 

Beta distribution (베타 분포)

1) 정의

    - 비율을 묘사하는 분포 (불순률, 작동률, 불량률)

    - Paramter : alpha, beta

$$f(x) = \frac {1}{\beta(\alpha, \beta)}x^{\alpha - 1}(1-x)^{\beta - 1}\;\; for \;0\leq x \leq 1$$

$$Beta fucntion\;:\; B(\alpha, \beta) = \frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha+\beta)}=\int_{0}^{1}x^{\alpha - 1}(1-x)^{\beta - 1}dx$$

$$B(\alpha, \beta) = B(\beta, \alpha),\;\;B(1,\beta)=\frac {1}{\beta},\;\; B(\alpha+1,\beta)=\frac{\alpha}{\alpha+\beta}B(\alpha,\beta)$$

 

2) 기대값과 분산

$$E[X]=\frac{\alpha}{\alpha + \beta}$$

$$Var(X) = \frac{\alpha \beta}{(\alpha+\beta)^{2}(\alpha+\beta+1}$$

 

3) 특성

    - alpha와 beta가 같으면 대칭한다.


고려대학교 김성범 교수님의 유튜브를 정리하였습니다.

www.youtube.com/channel/UCueLU1pCvFlM8Y8sth7a6RQ/videos