東京ではPRML読書会の最終回があっていたらしいですが、こちらはすごく初歩的な話。
LDAのinferenceをGibbs samplingでやる話とかを紹介したので、こちらは変分ベイズでやるほう(というか元論文)を読んでいた。変分ベイズはいいんだけど、途中で出てくる
(つまりはパラメータのエントロピー)がよく分からんくなっていた。ディガンマ関数はガンマ関数の対数を取ったものの一階微分で
だけど、「期待値取る操作のところに何で微分のoperationが入ってくるねん!」と小一時間悩んでいたのでメモ。
指数型分布族
そういえば昔のPRML読書会で指数型分布族の発表担当でレジメを作っていたようだ。www.yasuhisay.info
PRMLで出てくるような基本的な確率分布はほとんど指数型分布族に属していると考えていい(例外は混合分布くらい)。ベルヌーイもガウスも今回のディリクレも指数型分布族の一つである。上の指数型分布族は
をパラメータとして以下のように書き表わされることが知られている(はてなのTeX記法は
とかベクトルで書けないのかなぁ)。
ここで、は分布の十分統計量と呼ばれ、指数型分布族の最尤推定をする際にはデータ全体を保持しておく必要はなく、十分統計量のみを保持しておけばよい*1。例えばガウスだったら、データの和と二乗和を保持しておけばよい。データの数を無限に持っていくと
だけど、
と書けることが知られている(PRMLの(2.226)式付近)。
ディリクレ分布の場合
今回取り扱いたいディリクレ分布を指数分布族の形式で書くととできる。ここで上の
である(つまりはディリクレの規格化項)。
となり、ディガンマ関数が出てくる。指数型分布族を経由しなくても積率母関数とかでどうにかなりそうである。変分ベイズのほうは実装もなかなか大変そうなので、自分で作るかはちょっと不明。
関連

- 作者: 中島伸一
- 出版社/メーカー: 講談社
- 発売日: 2016/04/20
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
*1:場合によっては十分統計量がデータ全体になっている場合もあるが...順序統計量とか。気になる人は最小十分統計量とか勉強すればいいんじゃないかな