Last modified: "2005/09/06 10:44:31 +0900"
データを図示することはデータの様子を把握するのに非常に有用です。統計的な操作の前の段階でぜひともやっておくといいでしょう。詳しいグラフィックスに関しての説明はRでグラフィックスの方でするとして、簡単な図示の方法を書いておきます。中澤先生の教科書では第3章の3.6のところです。
今回からはちょっとコマンドがごちゃごちゃとしてしまうので、少し引いてしまうかもしれない。しかし、まずはRに説明のとおりに入力してみましょう。ちゃんと結果が出るはずです。それを確認した後で、以下の説明を読むと良いでしょう。
具体的に操作しながらのほうが良いでしょうから、中澤先生の本と同じような例を挙げながらやっていきます。これで、中澤先生の本とこのページの二つの例で試すことができるので、覚えるのも早くなるでしょう。
あるテニスサークルのメンバー10人について、ラケット所有本数が1,1,3,1,4,1,1,2,1,2だった場合を考えるとする。
以下の手順でデータの入力と頻度の分布を知ることができる。
『Rによる統計解析の基礎』の3章後半部分がお手本です。
1行目はnum.racという変数にデータを入力するコマンドで、2行目はnum.racに入ったデータをtableコマンドを使って表にまとめているところである。per.racから始まる行はfrec.racを割合に変換するものである。sum(frec.rac)は結果として全数を返すので試してみれば判ると思うが10である。
以上のようにまとめたデータを図示する方法は下のようになる。
barplotというのが縦棒を横に並べた図を作る命令である。度数分布図は単純にbarplotに表の形になっているデータを読ませればよい。積み上げ棒グラフや帯グラフで使われているmatrixというコマンドは行列を作成するコマンドである。詳細な意味は"?matrix"等として各自調べてみると良い。今は上のようなコマンドで積み上げ棒グラフや、帯グラフが書けるようになるということが重要である。円グラフはpie()関数を使う。これもtableで変換したデータを読ませるだけである。
毎朝やっているA君の数学のテストの点数は68,70,55,78,84,95,66,72,92,74と変化している。これを図示してみよう。
お気づきだろうが、hist()やqqnorm()の中の『main=""』という部分は図のタイトルとなる。日本語はデフォルトでは扱えないので注意して欲しい。
今回は一つの連続変数のみを見たのでレーダーチャートや散布図は扱っていない。ちなみにレーダーチャートは"stars()"、散布図は"plot()"コマンドを使うのだが、自分でデータを作って試すのもありだろう。面倒なときはRでexample(stars)とexample(plot)としてみるとよい。
TOP/Study/Diary/Profile/Soft/Tennis/Gallery/Antenna/Research/xyzzy/R