現時点でなんとなく分かってきたようなことを書いてみる。たぶん嘘が入っているけど。プロセス大事だよプロセス。
似たようなことを言っているんだけど、前提条件とか言っていることに関する違いとかをしっかり把握しておくことが必要。
Rao-Blackwell
数理統計学のP18より。を確率密度関数からの標本とし、をに対する十分統計量であるとする。をの不偏推定量とし、とする。すると
である。
Introduction to the Theory of Statisticsとか理論統計のレジメとかには2つじゃなくて3つ書いてあったりする。抜けて(?)いるところは、
も統計量であって、それは十分統計量Tの関数である
というところか。これだけだとよく分からないんだけど、Introduction to the Theory of StatisticsのP322にあるExample 31が分かりやすいと思った。
Example 31
どういう例かっていうと、ベルヌーイ試行の例。
はの不偏推定量になっている。っていきなり何やねんと思うんだけど、P321とかを見ると、
(ii) ; that is, is an unbiased estimator of .
と書いてある。つまり、は真のパラメータを引数として持つ関数ということか。って、そのままだなw。で、Example 31に戻ってくると、はの不偏推定量ということらしいんだが、本当だろうか?と思ったが、なんてことはなくて、と計算すればいいだけの話だった。で、は十分統計量であるらしい。この辺は分解定理を使えば、すぐに示せるかな。ここで、を十分統計量の集合とする。ここで、Rao-Blackwellの定理によると、はの不偏推定量となっていて、かつ、の分散よりも小さくなっている、ということが言える。おお、これだと大分言っていることが分かりやすくなっている。講義では、分散が改善されているとか、そういう言葉が使われていたような気がする。
で、ごりごりと計算がしてあるわけだけど、本当に改善されているかがやってあるという感じ。の分散はベルヌーイの分散なので、なんだけど、十分統計量で条件付けた統計量、すなわちの分散はとなっていて、改善されている!!
とこういうわけで、Rao-Blackwellの定理がどういうことを言っているかについては大分つかめてきた気がする。
Rao-Blackwellの定理のまとめ
まず、前提条件として
- は不偏推定量であること
- 何かしらの十分統計量を見つけてくること
が必要とされている。この時、十分統計量で条件付けられたの期待値というのは()、もとのの分散以下である、ということが言える。すなわちが成立するということである。
簡単に言うと何か不偏推定量があって、どっかから十分統計量を持ってきて、その条件付き期待値を取ると、元の分散より小さくなっているよということを言っている。
しかし、Rao-Blackwellの定理というのは、それほど強いことを言えるわけではない。条件付き期待値を持ってくると、元の分散より改善される、ということが言えているだけである。どういうことかと言うと、とは異なる不偏推定量を持ってきて、で条件付けると、の分散は改善できるということは言えるんだけど、とのどっちがよい(=不偏推定量であることは同じなので、分散が小さいということ)については何も言えない、ということである。イメージとしてはこんな感じ。
横軸がの不偏推定量の集合とか考えておくとして、縦軸はその分散と考える。すると、条件付けた分散というのは矢印のように分散が小さくなる方向に動いていく。これが改善されると言うこと。ただ、これがglobalに最適(最小分散)であるかについては、Rao-Blackwellの定理は何も言ってない。しつこいけど、Rao-Blackwellの定義は条件付けると分散が改善されるということしか言ってない。
じゃあ、不偏推定量の中で分散を最小にするようなものを探したいよねーと考えるのが自然な流れ。そこで、Lehmann-Scheffeですよ。
あ、ちなみに「不偏推定量の中で分散を最小にするようなもの」っていうのは一様最小分散不偏推定量(uniformly minimum variance unbiased estimator)、いわゆるUMVUEのことですね。Lehmann-Scheffeを使うとUMVUEがうまーな感じで探せるということです。
Lehmann-Scheffe
UMVUEを探せちゃう、うまーなLehmann-Scheffeの定理ということですが、世の中そんなに甘くはない。UMVUEを探してくれる代償として、一つ条件が必要になってくる。それは、さっきの十分統計量が完備十分統計量である必要がある、ということだ。そもそも統計量が完備である、とは?
数理統計学のP20より。
を確率密度関数からの無作為標本とする。このとき、統計量の分布をとする。もし、すべてのに大してとなるとき、上でを満たせば、統計量は完備(complete)であると言う。確率関数の時は、上記積分は和に起き換える。関数には、が含まれていないことに注意すること。
わーん、分けがわからないよーという感じだが、意味するところはとりあえず置いておくか。これが示せれば、とりあえず完備であるらしい。すべてのとか、恒等的に、という付近が大変重要である。
Lehmann-Scheffeの定義
Introduction to the Theory of StatisticsのP326のTheorem 10より。
Let be a random sample from a density . If is complete sufficient statistic and if , a function of S, is an unbiased estimator of , then is an UMVUE of .
色んな意味で日本語でおkという感じなので、日本語にしていこう。が完備十分統計量であって、かつ、がその完備十分統計量の関数である()時、はの不偏推定量となっている。そして、それはのUMVUEでもある、ということが書いてある。理論統計学のレジメにも書いてあるけど、どこまでがRao-Blackwellの定理を内包しているのかを確認していきながらやることが重要になってくる。Rao-Blackwellの定理の
- 十分統計量Tの関数である
- 条件付き期待値を取ったものも、不偏推定量になる
のところはLehmann-Scheffeでも同じ。つまり、違いは分散のところについて言っていることが違うということだ。理論統計学の資料(Parametric Point Estimation)p290にこんなことが書いてある。
It remains to show that does not depend on which unbiased estimator of we start with.
示す必要があるってことは、that以下が証明されて言えるということで。Rao-Blackwellの定理では、スタートする位置によって、分散が最小となるものが違ってしまったんだけど、Lehmann-Scheffeではそんなことはない。Lehmann-Scheffeでは他のどんなものと比較してもよい統計量がある、どういうTからスタートしても、ということである。またまた超適当なイメージで書いてみるとこんな感じである。
適当すぎてあれなんだけど(笑)、どっからスタートしても最小となる分散に辿りつけるということを表わしています。で、Lehmann-Scheffeでは異なる2つの不偏推定量とがあったとき、完備十分統計量を与えてやるととならなければならない、ということを言っています。
まとめ
長々と書いてきたので、表形式でまとめてみます。Rao-Blackwellの定理 | Lehmann-Scheffeの定理 | |
---|---|---|
必要とされているもの | 不偏推定量、十分統計量 | 不偏推定量、完備十分統計量 |
言えること | 十分統計量を与えることで、よりよい(分散が小さいという意味で)不偏推定量を得ることができる | UMVUEを見つけることができる |
デメリット | よりよいものは見つけることができるけど、一番よいもの(UMVUE)がどれかは分からない | 完備であることを示さないといけない |
完備でないからと言って、UMVUEがないとは限らないので*1、Lehmann-Scheffeの定理があればおkというわけにはいかないんですが、Lehmann-Scheffeの定理があると大分簡単にUMVUEを見つけることができて、ハッピーになれます。
- 作者: 長尾壽夫,栗木進二
- 出版社/メーカー: 共立出版
- 発売日: 2006/03
- メディア: 単行本
- この商品を含むブログ (1件) を見る
*1:反例がある。理論統計学のレジメにあったはず。