Good point for using R
データ解析に適した環境
- Excel、p値、信頼区間
- それでOK?
泥(笑)
- そんな簡単にはいかない
データとの「対話」
- 統計解析は計算過程ではなく、データと「対話」
- その中で仮説を検証
データとの「対話」
- さまざまな形式のグラフに何度もプロット
- その分布に対して適切な分析方法を考える
効率的に行なうには
- 同じデータからいくつものサブグループをつくったり
- それぞれに対して同種のグラフを作成
- 行と列を転置しながら並び変えたりといった「データの操作」
これができるのがR
- これらを思考を中断することなくスムーズに行なっていくためのソフトウェアが必要
- Rはデータとの対話を行なうためのソフトウェア
関数とサンプルデータ
- プログラム作ったけどデータがない
- Rのほんどの関数にはサンプルデータが付いているよ
ソースコードがまるみえ
ソースを読む→プログラミング上達にかかせない
- R関数の多くはRで書かれている
- 関数名を打つとコードが表示
グラフが簡単に書ける
- ディフォルトの環境でプロットできる
- グラフィックスのライブラリのインストールで泣かないですむ
- データ構造が違っても同じ名前の関数で良い具合のグラフを出してくれるよ
- 総称的関数のおかげだね
CRANの存在
- ライブラリがすごく豊富
- 画像解析、SOAPのライブラリ
- インストールが失敗することが少ない
- 統計科学の最先端の研究成果ががんがんCRANに登録されている
> install.packages("hogehoge")
日本語リソースがやばいよ
[あとで話す]
プログラミング言語としても充実
- Lispを父にSを母に持つ統計解析言語
- 総称的関数
- オブジェクト指向プログラミング
- ユニットテスト
- データ構造も豊富
- ガベコレ
- 無名関数
- 例外処理
- 遅延評価
- 関数クロージャ
- 再帰
- apply