読者です 読者をやめる 読者になる 読者になる

第六章

R データ解析

多次元データをプロットする仕方について。

離散的な散布図について

乱数を足し引きしていって分布を分かりやすくするようにする。
(乱数を足し引きするときに離散データが交わらないように注意すること。)

三次元を一度にプロットする仕方について。

散布図を3つ同時に並べて見ることができるようにするやり方がある。

シンボリック散布図

三次元のデータのプロットの仕方のひとつ。
データを点ではなく、データの名前でプロットしていくことにより、データの傾向を見ていくために使う。
プレゼンテーションクオリティが低いので顧客には見せないようにする。
顧客に見せるには「○」、「×」等の分かりやすいようにしていく。
(○などで一括に表して丸の半径の大きさを変えていくのも手の一つ。)

ケースメント表示

データが離散的に分布している場合などに使える。
離散地の値によって表示していく散布図を並べてたり、その散布図自体を並べていくことできる。

4次元以上のデータをプロットする。

説明変数の相関関係を見てみるために使用する。
非説明変数と説明変数の相関関係を見る前に説明変数同士の相関関係を見ることが重要!!

相関関係が高い同士の説明変数はできるだけ使わないようにする。

(確か統計学のところで説明変数が一次独立なもの以外を使うと誤差項が大きくなってしまうってのがあったからだと思われる。)