分位点プロット

一組のデータセットを扱うための手段である分位点プロットについて記述する。

定義

ある一組のデータセットが与えられたときに、そのデータを小さい順に並べて順序統計量を作る。そして、fraction of dataをx軸に、順序統計量をy軸に持っていったものが分位点プロットである。

fraction of dataとは何か?

あるデータが自ら属するデータセットのなかで、どのような相対的位置を示すかを見る相対的尺度のこと。

コマンド

実際に分位点プロットを作るときには以下のようなコマンドを打つ。

plot(ppoints(stmf.ozone),sort(stmf.ozone))

ppointsはデータを与えるとfraction of dataを返す関数。これと順序統計量をplotすればよい、という考え方。

特徴

  • 必ず右あがりになる。
  • 傾きが小さければ、小さいほど、点の密度は大きい。
  • 誰が作っても同じになる。
  • 全てのデータを表している。
  • プレゼンに使うにはあまり好ましくはない(作業中に使うにはふさわしい)。