データの図示

Last modified: "2005/09/06 10:44:31 +0900"logo

データを図示することはデータの様子を把握するのに非常に有用です。統計的な操作の前の段階でぜひともやっておくといいでしょう。詳しいグラフィックスに関しての説明はRでグラフィックスの方でするとして、簡単な図示の方法を書いておきます。中澤先生の教科書では第3章の3.6のところです。

今回からはちょっとコマンドがごちゃごちゃとしてしまうので、少し引いてしまうかもしれない。しかし、まずはRに説明のとおりに入力してみましょう。ちゃんと結果が出るはずです。それを確認した後で、以下の説明を読むと良いでしょう。

コンテンツ
離散変数の図示
連続変数の図示 new!
統計ページへ
R on Windowsへ

離散変数の図示

具体的に操作しながらのほうが良いでしょうから、中澤先生の本と同じような例を挙げながらやっていきます。これで、中澤先生の本とこのページの二つの例で試すことができるので、覚えるのも早くなるでしょう。

あるテニスサークルのメンバー10人について、ラケット所有本数が1,1,3,1,4,1,1,2,1,2だった場合を考えるとする。

以下の手順でデータの入力と頻度の分布を知ることができる。

『Rによる統計解析の基礎』の3章後半部分がお手本です。

1行目はnum.racという変数にデータを入力するコマンドで、2行目はnum.racに入ったデータをtableコマンドを使って表にまとめているところである。per.racから始まる行はfrec.racを割合に変換するものである。sum(frec.rac)は結果として全数を返すので試してみれば判ると思うが10である。

以上のようにまとめたデータを図示する方法は下のようになる。

度数分布図
> barplot(freq.rac)
R1.9.0ではうまく表示できません。理由は現在調査中です。(2004/04/14)
積み上げ棒グラフ
> barplot(matrix(freq.rac, nrow(freq.rac)), beside=F)
帯グラフ
> barplot(matrix(per.rac, nrow(per.rac)), horiz=T, beside=F)
円グラフ
> pie(freq.rac)

barplotというのが縦棒を横に並べた図を作る命令である。度数分布図は単純にbarplotに表の形になっているデータを読ませればよい。積み上げ棒グラフや帯グラフで使われているmatrixというコマンドは行列を作成するコマンドである。詳細な意味は"?matrix"等として各自調べてみると良い。今は上のようなコマンドで積み上げ棒グラフや、帯グラフが書けるようになるということが重要である。円グラフはpie()関数を使う。これもtableで変換したデータを読ませるだけである。

▲目次へ/▲統計目次へ

連続変数の図示

毎朝やっているA君の数学のテストの点数は68,70,55,78,84,95,66,72,92,74と変化している。これを図示してみよう。

入力
> point <- c(68,70,55,78,84,95,66,72,92,74)
ヒストグラム
> hist(point, main="Histgram")
正規確率プロット
> qqnorm(point, main="Normal QQplot")
幹葉表示
> stem(point, scale=2)
注意: 表示はテキストとなる。scaleでプロットの長さを決める。自分で数字を変えてみて試してみると良いでしょう。中澤先生の本を見る限り『scale=』という表記は省略できるのだろう。
箱ひげ図
> boxplot(point, main="Box and whisker plot")

お気づきだろうが、hist()やqqnorm()の中の『main=""』という部分は図のタイトルとなる。日本語はデフォルトでは扱えないので注意して欲しい。

今回は一つの連続変数のみを見たのでレーダーチャートや散布図は扱っていない。ちなみにレーダーチャートは"stars()"、散布図は"plot()"コマンドを使うのだが、自分でデータを作って試すのもありだろう。面倒なときはRでexample(stars)とexample(plot)としてみるとよい。

▲目次へ/▲統計目次へ

Shouhei Takeuchi

TOP/Study/Diary/Profile/Soft/Tennis/Gallery/Antenna/Research/xyzzy/R