判別分析がようやく分かってきた

前までは分かったと思っていて、それが勘違いだったということが分かってきたのですが。ようやく分かんないところが分かってきた。線形判別関数を使うほうではなくて、マハラノビスの汎距離を使うほうです。共分散行列のところでS1とS2をプールするとかいう話がよく出てくる。そのやり方自体は簡単なので別にいいわけだが。今まで分からなかったのはなんでそのプールとかっていう処理をしないといけないのかっていうところ。何でやるのかとか分からんもの使う気になれないし*1

で、さっき多変量解析の本を読んでたらようやく分かった。S1とS2は標本分散共分散行列で使うSは母分散共分散行列。なので、Sは何ものか分からない。なので、推定をしてあげる必要がある。推定の方法とかはこの辺とかに載っている。ウィッシャート分布とかが何者かはまだよく分からないけど、プールする必要性がようやく分かったので、書いてみた次第であります。

*1:自分の専門じゃないところは気にせず使うわけですが。PCとかプログラミング言語とか。