第6章:パラメトリック検定とノンパラメトリック検定

ナレーション原稿

 ここまでが検定の原理というか、基本的な考え方で、ここからは個々、変数と変数の関連を見ていくときの検定、変数の種類によっていろいろな検定があるんですが、それを紹介していくんですが、基本的な考え方は今説明したものと一緒です。つまり帰無仮説というのを設定して、帰無仮説が正しいと仮定したもとで取ってきたデータ、観察データが得られる確率を計算してあげて、その確率が一定水準を下回ったら帰無仮説が間違っていると判断しようという考え方です。
 検定についても同じです。関連性の調べ方、変数の種類が違えば違うという話がありましたが、検定も変数の種類が違うと使う検定の種類が違ってきます。さらに検定するときの変数の分布に仮定を置くか置かないかでパラメトリック検定というのとノンパラメトリック検定というのがあります。パラメトリック検定は母集団における分布を正規分布ですね。さらに広い意味でいえばパラメトリックは何かしらの分布を仮定できるのは正規分布とは限らないんですが、パラメトリック検定では分布を仮定して、平均なり分散なり、そういうパラメータを推定してあげます。推定したパラメータから検定統計量を計算して、帰無仮説のもとで検定統計量を得られる確率を見ていく。
 これは使われるのが従属変数が量的変数の時に使われるものです。
 パラメトリック検定の例としてはこれから紹介しますが、対応のないt検定と質的変数と連続変数の関係を見るときに出てきたりとか、対応のあるt検定です。何か経時的なデータ、同じ人に何回も取るようなデータに違いがあるか。個人の中で変化があるかとか、そういうのを検討するときに使うのが対応のあるt検定です。
 さらに一元配置の分散分析です。これは3値以上の質的変数のグループ間で平均が違うというのを見てあげるために使うのが分散分析法です。
 検定の考え方とか、よく分からないというか、質問とかは大丈夫ですか。原理としては、まずは間違っていてほしいというか、帰無仮説、本当は示したいことの逆のことというのが正しいと仮定して、その正しい世界、正しいと仮定したもとで実際に得られたデータがどれぐらい偶然に得られやすいのかというのを計算して、すごくまれなことが起こっているか。つまり、今回取ってきたデータは帰無仮説が正しい世界で調査をすると、そんな簡単に出てくるような値ではないよというときには、もともとの仮定である帰無仮説が間違っているよと考えようという考え方です。
 その検定の具体的なというか、細かいいろいろな種類があるのでここからお話をしていきます。
 まずパラメトリック検定です。パラメトリック検定で基本的に仮定するのは正規分布という形です。これはいろいろな、よく自然界にある変数というか、ものがこういう正規分布に従うといわれています。身長とか、自然科学とか、そういうのでは正規分布がよく出てきたりします。
 正規分布は分布の特徴として平均と中央値と最頻値が一致する。このmというところです。あと、これも確率分布。どれぐらいの確率でどれぐらいの値を取るかというのは分かっているので、平均±1標準偏差の間には68.3%の人が入る。平均±2標準偏差の間には95.4%の人が入ってくる。なので、これは結構偏差値と関わってくるところなんですが、偏差値は平均からどれぐらい離れているかで値が違ってくるというか、平均のところを50にして、プラス10掛ける標準得点というのを計算してあげたものなので、偏差値60というのは1標準偏差離れた人。平均より1標準偏差離れている人なので、偏差値60以上の人は13.59%+2.14%+0.14、だいたい16%ぐらいしかいない。偏差値が70を超えてくる人はさらに少なくて2.28%というのがだいたい分かる。それぐらい偏差値70とかだとすごい。偏差値80だと変態的なというか、0.14%しかいないということになります。
 逆もそうです。偏差値が20の人はほとんどいないです。
 それに対してノンパラメトリック検定というのがあります。これは母集団での分布に仮定を置かないものです。主に従属変数が質的変数のときに使われます。きょう出てくるのはχ2検定とか、マン・ホイットニーのU検定とか、ウィルコクソンの符号順位検定とか、クラスカル・ワリス検定とか、順位相関とか、そういったものが出てきます。
 パラメトリック検定とノンパラメトリック検定は一部対応があって、こういう感じになっています。比率の検定のほうは、基本的には比率を計算するのは質的変数なので、χ2検定とかフィッシャーの正確確率検定はノンパラメトリックしかないんですが、パラメトリック、平均の検定はこういう形でマン・ホイットニーのU検定、そういうのと対応していたりとか、対応のあるt検定はウィルコクソンの符号付き順位検定に対応していたりとか、こういう対応があります。後でちょこっとまた触れます。