F検定が必要な理由とかが全然分かってなかったっぽい

検定はなんかいまいち好きになれないんですが、F検定とかもその一つとかでした。分散分析とかではまあ使うにしろ、品質管理とか好きじゃなかったし。

「係数が同時に0となる」っていうのが分かるんだけど、それが必要になる状況がよく分かっていなった。いや、分散分析(ry。少なくとも回帰分析ではどう必要なのかが分かっていなかった。 $y = b_0 + b_1 x_1 + b_2 x_2$ として、帰無仮説が $b_1=0,b_2=0$ というのを考えれば、F検定が必要になるというのは理解できる。T検定を2回やって、どっちも棄却するというアプローチは棄却されやすくなるというのがあるからだ。

ただ、「実際にモデルを作成していく上では、一つ一つがモデルに含まれるかを確認しながら、構築していくから二つ同時に比較するということはあるのか?」という疑問があった。データ解析とかでやった調整済み散布図を書いて、残差間のplotをして…というアプローチでは一つ一つ見ていくから実際に必要ない。

で、今日の授業のところで、「帰無仮説が $b_1=0,b_2=0$ 」というような形ではなくて、「帰無仮説が $b_1+b_2=1$ 」というようなのを見た。最初は分けが分からなかったんだけど、例を教えてもらったら理解できた。例えば、生産関数がコブダグラス型 $y=x_1^a x_2^b$ の形のようなものを考え、線形回帰モデルを適用するために対数を取る操作を考える。すると線形回帰モデルが出てくるんだけど、コブダグラス型の性質から係数の関係に制約が出てくる。これはT検定で一つ一つ調べるわけにはいかないので、F検定が必要となる!!!

こういう感じで、回帰分析においてF検定が必要不可欠となる場合が分かった。僕が頭が悪いとか、そういう問題ではなく文化の違いのようなところのようだ。データ解析のような授業では「車の価格を、車の特性値によって回帰する」という感じだったが、計量経済学とかでは「経済学とかでは、こういうモデルがある。現実のデータをそのモデルに適用して、それがどれくらいあてはまっているか見てみよう」というようなものだ。データ解析では、経済学のモデルのようなものは仮定していない(もちろん、線形モデルで説明できるんじゃないかなみたいな仮定はあるけど、どの変数が…というような仮定ではない)。

計量経済学とかでは、「一から変数選択をして…」という感じじゃないということかな。今は手元に本がないから確認できないけど。