Bishop PRML - Ch2. Probability Distributions (1)
Posted on
Binary Variables
-
Bernoulli distribution
-
- 일 때의 분포
-
mean
-
variance
-
likelihood
-
log likelihood
-
MLE
- log likelihood을 미분하여, extrema를 구함으로서 구할 수 있음
- sample mean과 동일함에 유의
-
-
binomial distribution
-
- N회의 Bernoulli 독십시행결과 m번의 성공을 할 확률
-
mean
-
variance
-
-
beta function / gamma function
-
Euler integral
-
Euler integral of first kind (beta function)
-
Euler integral of second kind (gamma function)
-
-
gamma function
- factorial의 실수에 대한 일반화
-
증명
- (L’Hospital’s Rule)
-
beta function
-
-
beta distribution
-
- Binomial distribution의 conjugate prior
-
잘 보면 binomial distribution식의 실수판임, 이를 염두에 두고 보면 좀 더 연관성이 보일 것
- 이를 고려할 때, 두 모수를 각각 시행횟수로 볼 수 있음
- 본문에서 a와 b를 유효 관찰수로 해석할 수 있다는 소리는 바로 이런 의미
-
mean
-
variance
-
-
posterior of binomial likelihood & beta prior
- 이를 최대화하는 방식이 바로 MAP
- posterior값을 다음 MAP에서의 prior로 이용하는 방식을 통하여 커버 샘플수를 점점 키워가며 학습하는 순차적 접근법을 쓸 수 있음 (small batch로 나누어 학습할 수 있음)
-
prediction with likelihood & prior
- 일 경우, 이 되어, MLE의 결과와 동일해짐
-
beta distribution의로 표현된 prior은 관측값의 수가 증가할 수록(a, b의 값이 클 수록) 의 그래프가 뾰족해짐
- 데이터가 많을 수록 평균적으로 posterior의 불확실성 감소 (posterior가 나타내는 분포 자체는 stochastic하나, 분포의 모수가 deterministic해짐)
-
- posterior평균의 데이터 분포에 대한 기대값은 prior평균과 동일
-
- posterior분산의 데이터 분포에 대한 기대값은 prior분산보다 작음
- 데이터 분포에 대한 기대값임에 유의, 데이터 분포 내의 subset에 대해서는 다를 수 있음