베이지안 파라미터 추정 (Bayesian parameter estimation) 및 샘플링 방법
1. 베이지안 파라미터 추정 1-1. 베이즈 규칙 관점 고찰 - 가설 H에 대한 사후확률은 아래와 같이 베이즈규칙에 의해 표현되며, $$$P(D)$$$ 는 전체 확률의 법칙으로 다시 쓸 수 있다. $$$P(H|D) = \dfrac{P(D|H)P(H)}{P(D)}$$$ $$$= \dfrac{P(D|H)P(H)} {P(D|H)P(H)+P(D|\sim{H})P(\sim{H})}$$$ H : 가설 D : 데이터 - 가설 H가 여러개라면, 아래와 같이 표현 할 수 있다. $$$P(H_i|D) = \dfrac{P(D|H_i)P(H_i)}{P(D)}$$$, $$$i=1,2,3$$$ $$$= \dfrac{P(D|H_i)P(H_i)} {P(D|H_1)P(H_1)+P(D|H_2)P(H_2)+P(D|H_3)P(H_3)}$$$, $$$i=1,2,3$$$ $$$=\dfrac{P(D|H_i)P(H_i)}{\sum_{i=1}^{3}P(D|H_i)P(H_i)}$$$ - 가설 H의 개수가 연속형으로 아주 많다면, 아래 처럼 쓸 수 있다. $$$P(H_i|D) = \dfrac{P(D|H_i)P(H_i)}{\int_i P(D|H_i)P(H_i)}$$$ 1-2. 베이지안 파라미터 추정 관점 고찰 - 베이지안 파라미터 추정 관점에서 생각해 보기 위해, 두개의 파라미터를 가지는 선형모형을 가정한다. 예측값 $$$\hat{y}$$$ 는 데이터가 주어졌을 때, 파라미터 $$$\theta_1, \theta_2$$$ 의 결합 사후 분포를 따른다. $$$\hat{y} = \hat{\theta}_1 x + \hat{\theta}_2$$$ $$$\hat{y} \sim P(\hat{\theta}_1,\hat{\theta}_2|D)$$$ - 관측 데이터와 가정한 위의 파라미터의 분포를 가지고, MAP 를 시행해서 최적의 파라미터 (사후분포)를 찾아야한다. 각 파라미터의 사후분포는 아래와 같이 쓸 수 있다. $$$P(\theta_2|D) = \dfrac{P(D|\theta_2)P(\t...