読者です 読者をやめる 読者になる 読者になる

データの対称性

R データ解析

社会工学で扱うようなデータは「中間くらいまでは対称性を持っていると言えそうだが、大きな値になると対称性を持っているとは言えない」というようなデータによく遭遇する(所得など)。このようなデータはよく右にテールが長いと言われる。これらの分布などを調べるときにも、対称性があれば調査がしやすくなる。右にテールが長い分布を対称な分布に変換したとえ考えると

  • 小さい値はあまり変えない
  • 大きな値はぐんと小さ区する必要

ということが分かる。このような変換を施すものとして以下のようなものがあげられる。

  • logを取る
  • 累乗根を取る

この手法は[2007-05-19-87]などでよく使われるので覚えておくとよい。