Uniform distribution (일양 분포)
1) 정의 - pdf
- interval 내에서 확률변수의 값이 일정하다.
- 그 외에는 0이다.
$$f(x) = \frac{1}{\beta - \alpha}\;\;\;\;\; if \alpha < x < \beta$$
2) 정의 - cdf
$$F(a) = \int_{-\infty}^{a} f(x)dx$$
3) 기대값, 분산
$$E[X] = \frac{\beta + \alpha}{2}$$
$$E[X^{2}] = \frac {\beta^{2}+\alpha\beta+\alpha^{2}}{3}$$
$$V[X] = E[X^{2}]-(E[X])^{2} = \frac {(\beta - \alpha)^{2}}{12}$$
Normal distribution (정규 분포)
1) 정의
- 정규 확률 변수 또는 정규 분포는 모든 실수를 가지고 있다.
- Parameter : mu, sigma^2
$$f(x; \mu, \sigma) = \frac {1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}(\frac{x-\mu}{\sigma})^{2}},\;\;\; -\infty < x<\infty$$
2) 특성
- 정규 확률 변수 (x)가 평균(mu)일 때, 확률이 가장 크다.
- 평균을 중심으로 좌우대칭
- sigma가 달라지면 퍼짐의 정도가 달라진다.
3) 기대값과 분산
$$E[X] = \int_{-\infty}^{\infty}xf(x)dx =\int_{-\infty}^{\infty}x \frac {1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}(\frac{x-\mu}{\sigma})^{2}}dx = \mu$$
$$V[X] = \sigma^{2}$$
$$Std[X] = \sigma$$
4) 이산형 확률 분포의 근사
- 이항 분포의 cdf를 구할 때, 정규분포로 근사하여 간편하게 구하는데 사용한다.
- 이항 분포 파라미터 n의 값이 충분히 크고 p의 값이 0 또는 1에 가깝지 않다면 정규분포와 비슷하다.
$$X ~ Binomial (n, p) \approx Y ~ Normal (np, np(1-p))$$
$$\frac{X-np}{\sqrt{np(1-p)}}$$
- 이항분포를 정규분포로 보다 정확하게 근사하기 위해 P{X=i} -> P{i-0.5 < X < i+0.5} 해준다.
Standard normal distribution (표준정규분포)
1) 정의
- 정규분포를 따르면서 평균이 0이고 표준편차가 1인 경우이다.
- Parameter : Z
$$Z = \frac {X- \mu}{\sigma}$$
$$pdf\;:\; let \mu=0,\;\sigma=1, \varphi (z) = \frac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}z^{2}}$$
$$cdf\;:\;\Phi (z) = P[Z\leq z]$$
2) 특성
- 0에 대칭이다.
3) X가 특정 구간 안에 있을 확률
- 표준정규분포로 변환하여 계산하면 간단하다.
$$N(\mu, \sigma^{2})$$
$$P[a\leq X \leq b] = P[\frac{a-\mu}{\sigma}\leq\frac{X-\mu}{\sigma}\leq\frac{b-\mu}{\sigma}] = P[\frac{a-\mu}{\sigma}\leq Z\leq\frac{b-\mu}{\sigma}]$$
$$=P[Z\leq\frac{b-\mu}{\sigma}]-P[Z\leq\frac{a-\mu}{\sigma}]$$
$$=\Phi(\frac{f-\mu}{\sigma})-\Phi(\frac{a-\mu}{\sigma})$$
Exponential distribution (지수 분포)
1) 정의
- 연속형 확률 변수로 pdf와 cdf가 있다.
- 시간과 관련 있기 때문에 항상 0 보다 크다.
$$pdf\;:\;f(x)= \lambda e^{-\lambda x}\; if \; x\geq 0, 0 \;if \; x < 0$$
$$cdf\;:\;F(x) = 0 \; if \; x < 0, \; 1-e^{-\lambda x},\; if \; x \geq 0$$
- 프아송 분포에서 발생된 이벤트 간 시간을 나타낸다.
- 람다 : 단위 시간 당 event 발생 평균 수
2) 기대값과 분산
$$E[X] = \frac {1}{\lambda}$$
$$E[X^{2}]=\frac {2}{\lambda^{2}}$$
$$V[X] = \frac {1}{\lambda^{2}}$$
3) Memoryless property (기억상실 특성)
- X가 t시간 이상 진행했다는 가정하에 s시간 더 갈 확률은 s시간 갈 확률과 같다.
- 과거는 중요하지 않다는 의미이다.
$$P[X \geq + t|X\geq t] = P[X \geq s]\;\;\;\;\; for \forall s, t \geq 0$$
4) Poisson vs Exponential
- 프아송 : 특정 시간 또는 장소에서 사건이 몇번 일어날지에 대한 확률을 계산한다.
- 지수 : 프아송 분포로부터 발생하는 사건 간의 시간
Gamma distribution (감마 분포)
1) 정의
- 지수분포의 일반화된 형태 (더 큰 개념)
- k 개의 이벤트가 발생할 때까지의 시간
- Parameter : alpha, lambda
- alpha : shape parameter (형상모수)
- lambda : rate (scale) parameter (척도모수)
$$f(x) = \frac {\lambda^{\alpha}}{\Gamma(\alpha)}x^{\alpha - 1}e^{-\lambda x}\;\;\; for \; x > 0$$
$$Gamma function\;:\; \Gamma(a) = \int_{0}^{\infty} x^{\alpha - 1}e^{-x}$$
2) 특성
- 지수분포는 감마분포에서 alpha가 1인 경우에 해당한다.
$$Gamma(1, \lambda) = Exponential(\lambda)$$
$$f_{x}(x) = \frac {\lambda}{\Gamma(1)}x^{1-1}e^{-\lambda x} = \lambda e^{-\lambda x}$$
3) 기대값과 분산
$$E[X] = \frac {\alpha}{\lambda}$$
$$V[X] = \frac {\alpha}{\lambda ^{2}}$$
Beta distribution (베타 분포)
1) 정의
- 비율을 묘사하는 분포 (불순률, 작동률, 불량률)
- Paramter : alpha, beta
$$f(x) = \frac {1}{\beta(\alpha, \beta)}x^{\alpha - 1}(1-x)^{\beta - 1}\;\; for \;0\leq x \leq 1$$
$$Beta fucntion\;:\; B(\alpha, \beta) = \frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha+\beta)}=\int_{0}^{1}x^{\alpha - 1}(1-x)^{\beta - 1}dx$$
$$B(\alpha, \beta) = B(\beta, \alpha),\;\;B(1,\beta)=\frac {1}{\beta},\;\; B(\alpha+1,\beta)=\frac{\alpha}{\alpha+\beta}B(\alpha,\beta)$$
2) 기대값과 분산
$$E[X]=\frac{\alpha}{\alpha + \beta}$$
$$Var(X) = \frac{\alpha \beta}{(\alpha+\beta)^{2}(\alpha+\beta+1}$$
3) 특성
- alpha와 beta가 같으면 대칭한다.
고려대학교 김성범 교수님의 유튜브를 정리하였습니다.
'Math > Probability & Statistics' 카테고리의 다른 글
Sampling Distributions, Central Limit Theorem (0) | 2021.02.17 |
---|---|
분산, 공분산, 상관관계, 기대값의 특성 (0) | 2021.02.17 |
Joint Probability Distribution (결합확률분포), Convolution (0) | 2021.02.17 |
이산형 확률분포 (0) | 2021.02.15 |
확률 변수 (Random Variable) (0) | 2021.02.15 |