2007-07-02から1日間の記事一覧

第二章

欠損値の扱いについて 欠損値とは値が入っていないデータのこと。 生産工程の実験で方法に依存しない原因で結果の一部が欠損した。 所得に関する質問で回答を拒むなど。(分散が小さくなるなどの問題点がある。) 極端な考えを持っている人は自分の意見を隠…

第一章

探索的データ解析とは 探索的データ解析とは計量経済学でのモデルをが正しいかを確かめるのとは違う。与えられたデータからどのような規則性などが見出せるかを探すのが探索的データ解析である。 ls()を入力するとアサインメントされているものを示す。 (こ…

データ解析まとめ

今学期は期末の間全然アウトプット出来ていなかったので、まとめてどっかんとやりたいと思います。例によって、ここに書いてあることをそのまま使って、何かが起こったとしても責任を持ちません。御注意ください。

データ解析のプレゼン&最終レポート終わったよ!!

いろんな意味で終わったよw、とかそういうオチではなく、無事に終わりました。いやー、よかたよかた。Twinsでの成績はまだ出ませんが、プレゼンの途中で先生に「A++」と言われたので成績はAくるでしょ。先生に握手求められちゃったぜ。一学期はこれだけで僕…

調整済み散布図

調整済み散布図では、まず、一つの説明変数がモデルに入ると仮定する。そして、横軸に新たにモデルに加えたい説明変数と既に入っている説明変数との残差を横軸に、価格とすでにモデルに組み込まれている説明変数との残差を縦軸に取り、散布図を描く。描いた…

一般化ドラフツマン表示

書き方は簡単。 pairs(cbind(log.mid.price,mid.displacement,mhw,mid.mpg))

データハンドリング

データ解析をするときに、何が一番困るってデータハンドリングだと思う*1。欠損があったときにどう処理しようかとか、行を追加したとか、そういうときの細々したところがさくさくできると、本題の解析に時間をかけるようになれていいかなと思ったので、書い…

重回帰分析のやり方

いろいろな方法があるが、それぞれ見ていくことにする。ここではlog.mid.priceをmhw(mid rangeのhorse.power)とmid rangeのdisplacementで回帰することとする。授業で習ったやり方授業で習ったやり方はこんな感じ。cbindはベクトルを束ねて、行列にするよう…

プレゼン&最終レポートの流れ

これでやればいいってわけでもないとは思うけど、一つの例として。データハンドリング 従属変数の正規性 線形回帰モデルの仮定として、従属変数は正規分布をしているという仮定を置いているので、従属変数が正規分布に従っているかを見てみる必要性がある。…