研究計画書を先生、ドクターの先輩、院試勉強会に来ていた友達、gebの人々という感じで10人くらいの人にチェックをしてもらいました。人によって全然違うところを指摘されるので(いい意味で)、非常にためになりました。あとは、既存研究とか面接で聞かれた時にある程度ちゃんと答えれるように準備しておけば、たぶん推薦受かるんじゃないかなーとか思ってます。
概要
やろうと思っていること*1は「重回帰モデルにおける、説明変数選択の効率的な探し方」みたいなやつです。変数選択問題は結構古くからあるらしいんですが、よく使われるやり方としてはAICを基準としたステップワイズ法とかがあるようです。でも、- その方法で出てきたモデルが色んなモデルの仮定を満しているか、とかの保証はない
- 多重共線性とか、符号条件とか
- かといって、調整済み散布図とかを書いていくと2^n個書いたりしないと行けなくなるので、説明変数の候補が増えると明かに面倒
- しかも、その選択は機械的にやればいいというようなものではなく、異常値、高影響点などを含むgraphicな感じで見ないといけないものである
ということで「正確さ」と「効率性」を兼そなえた変数選択の方法、というのについて、研究したいと思います。
*1:とりあえずやりたいと言っているだけで、本当にできるかは不明なんだが...