第8章:ノンパラメトリック検定

ナレーション原稿

 ここまでがパラメトリックというものになります。ここまでで何か、質問とか、この用語の説明がなかったけれど、どういう意味だというのはないでしょうか。大丈夫ですか。
 では、なければノンパラメトリック検定に移っていきます。
 まず一番初めに出てくるのは、クロス表の検定というものです。質的変数と質的変数の関連性を見るときに出てくるものです。このデータでは喫煙している人としていない人の肺がんの発生というのを調べていますが、このデータだと喫煙していると1,000人中100人が肺がんになる。喫煙していなければ1,000人中10人。じゃあ、これは母集団でも本当に喫煙している人のほうが肺がんになりやすいということがいえるのだろうかというのを検定してあげるのがクロス表の検定という考え方ですね。
 これは午前中やったので飛ばしますが、これもですね。
 χ2検定というのを使ってクロス表の検定をします。ここでは、考え方は同じですね。つまり、喫煙しているかしていないかで肺がん発生率は同じだと仮定をして、その仮定のもと、このデータが得られる確率がどれぐらいなのかというのを計算してあげるというのがχ2検定の考え方です。
 じゃあ、喫煙しているか、していないかで肺がんの発生率に違いがないというのはどういう状況だろうかというのがこれですね。もし仮に喫煙が肺がんに何も影響を与えていないとしたら、こういうデータになるはずというのが分かる。全体、先ほどのデータでは肺がんになった人は全部で110人いました。その110人がたばこを吸っているか、吸っていないか100人と10人に振り分けられていますが、仮に肺がんの発生率たばこを吸っていようが、吸ってなかろうが同じだとするとこういうデータになるはずです。つまり、たばこを吸っていようが、吸ってなかろうが1,000人中55人は肺がんになるだろう。
 ただ、これは帰無仮説のもとでのデータですね。
 じゃあ、この状況と実際に得られた状況の乖離、どれぐらいずれているかというのを計算してあげれば、どれぐらいあり得ないことなのかというのが分かるのではないかという考え方になります。そうすると、今出てきた期待値と実際に得られた観察値に外れがないというはずなんです。本当に帰無仮説が正しければそうのはずですが、そのずれを定量化してあげるというのがカイ二乗検定統計量というものです。
 実際に得られた度数を観察度数、取ってきたデータから期待値を引いてあげて二乗してあげたものを期待度数で割ってあげたものを各セルについて出してあげます。計算だとこんな感じの式ですが、χ2検定統計量が自由度と列数-1、行数-1のカイ二乗分布に従います。2掛ける二乗であれば、列数が2で、行数が2なので、自由度は1のカイ二乗分布に従うということが分かっています。
 χ2の検定統計量を計算してあげて、それがどれぐらい得られやすいか。どれぐらいの確率で出てくるかというのを計算してあげて、それが5%を下回っているか、上回っているかで結論が違う。
 あと、細かいところですが、各セルの度数が少なくなってきている場合はχ2検定統計量とカイ二乗分布からちょっとずれてくる分布になってしまうということが分かっているので、こういう補正をかける必要があります。そういうイエーツの補正をかけてあげて分析をすることもあります。これは知っておけばいいだけの話で、計算自体は統計ソフトが勝手にやってくれるので、こういうことがあるよということだけを知っておいてもらえばいいです。
 さらにクロス表の検定で各セルの値が小さいときにはフィッシャーの直接確率法という検定を使う必要がある場合もあります。これは文字通り確率を直接計算してあげます。帰無仮説、2つの変数に関係がないという状況のもとで得られたデータより極端な場合が偶然生じる確率を直接求めてあげます。これは場合の数を応用して計算する方法です。
 これは計算例のデータですが、病棟看護師の経験年数と病棟で人数に違いがあるかというのを見ている。クロス表がこんなふうに出てきました。内科では10年以上の人と10年未満の人がほぼ半々なのに対して、外科では10年以上の人の割合が少なそうに見える。これで、内科と外科で経験年数の違いがあるのかというのをやってあげると、こんな感じで結果が出る。χ2検定のところは0.013というので書かれているので、内科と外科で経験年数が違うだろうというのが分かってくるということですね。
 これは今いったとおりで、これは統計パッケージとかによって出てくる結果が違ったりもするんですが、この場合は期待度数が少ないセルというのはそんなになかったので、フィッシャーの直接確率法は使わなくても大丈夫。連続修正というところでのイエーツの補正をかけた結果ですが、どっちでも有意は有意なので、基本的には内科と外科と経験年数の違いがあるだろうと考えてもよさそうだというのが分かってきます。
 次がマン・ホイットニーのU検定です。これはt検定、さっき労働時間が男女で違うかというのをやったと思うんですが、それのノンパラメトリック版です。これは順序変数だけではなくて、連続変数ですね。労働時間とかは連続ですが、さっきの労働時間はt検定でやりましたが、マン・ホイットニーのU検定で男女に労働時間に違いがあるかというのを見ることもできます。
 どういうときに使うかというと、従属変数、平均とか、そういうのを出すような変数が正規分布していないという状況だとか、順序尺度の値が違うかどうかというのを検定にかけるときに使います。
 マン・ホイットニーのU検定はウィルコクソンの順位和検定という呼び方をされることもあります。
 これは順序変数をそれぞれ見てきて、内科と外科の看護師さん、それぞれ5人に現在の勤務先について志望順位を聞いてみた。そうすると、志望順位、内科と外科で同じなのか違うのかというのを見てあげようというのが、マン・ホイットニーのU検定です。
 計算手順を見ると書きましたが、これは覚えなくていいです。基本的には順位というものをどう使って検定統計量を計算してあげて、そうすると、統計ソフトが有意確率を出してくれます。
 この原理というか、検定の考え方は全部一緒なので、結局差がないという仮定を置いてデータが得られる確率を計算してあげて、あり得るというか、その確率が大きいか低いかというのを見てあげて判断を下すという考え方は同じです。結局、この出しているものは、この検定統計量の計算の仕方が違うだけなので、ここら辺は興味があれば、手計算をやってみてもらってもいいかもしれないですが、手計算を使って、こういうノンパラメトリック検定をすることは、おそらく皆さんはないと思います。
 同じように対応のあるt検定に相当するのがウィルコクソンの符号付順位検定というもので、これも検定統計量の計算の仕方が違うだけでやっていることは同じ。
 同じ人に何回かデータを取って、前後で変わったかどうかというのを見るためにやるのがウィルコクソンの符号付順位検定というものです。これも計算方法は飛ばします。結果の見方も基本的には同じです。この有意確率というところを見てあげれば、差があるといっていいのか、そうでないのかというのが分かる。5%、0.05を切るか切らないかを見てあげれば分かる。基本的な考え方と同じです。
 さらにさっき出てきた分散分析、3グループ以上で順位に差があるかどうかというのを見るときに使うのがクラスカル・ウォリス検定というものです。これも考え方というか、やっていることは同じです。ただ単に検定統計量の計算の仕方が違うだけで、3グループ間で順位に差があるかどうか。3グループ以上の順位に差があるかどうかというのを検討するのがこのクラスカル・ウォリス検定というものです。ここら辺は原理とかは置いておいて、どういうシチュエーションに使うのかということだけを覚えておいてもらえばいいと思います。基本的には従属変数が正規分布しないとか、順序データというときに3グループ間で順位に差があるかというのを見るときに使うのがクラスカル・ウォリス検定の技法です。
 さらに3つ以上、つまり3時点以上でデータを取っていて、そこで変化があるかどうかというのを見るときに使うフリードマン検定というのもあるんですが、こういうのを使いことも結構あります。
 多重比較の問題、さっき分散分析のときに出てきたんですが、3群以上の比較をするときはノンパラメトリック検定でも多重比較の問題は当然起こってきます。ノンパラメトリック検定のほうでも多重比較の調整はできるので、そういうのが必要になったときにちょっと思い出してもらえれば。一番シンプルなのはボンフェローニ法ですね。検定の回数で割ったりする方法でやるのが一番シンプルで、簡単なやり方です。
 あとは量的変数と量的変数の関係を見るとき、相関係数を出せというのがあったんですが、質的変数、順序変数、順序変数同士でも相関係数を定義することができます。そこで出てきたのが順位相関係数というものです。2種類あって、スピアマンの順位相関係数とケンドールの順位相関係数というのがあるんですが、よく使われるのはスピアマンの順位相関係数だと思われます。
 これは考え方はピアソン相関係数と同じですが、ピアソン相関係数を使うときに計算するデータを自由に変換して計算しているものです。要は順序変数同士で相関係数を見たいというときは順位相関係数を出してあげればいいですよという話です。
 これとこれはさっき出てきましたが、平均の差とかを見たいときはパラメトリックだったら対応のないt検定、スチューデントのt検定とか、4つのt検定を使いますし、ノンパラメトリックは順序尺度ですね。と2群の代表値に差があるかというのを検定したいときはマン・ホイットニーのU検定を使う。対応のあるt検定、前後で変化があったかどうか。そういうのを見たいときはパラメトリック、つまり従属変数が連続量、量的変数のときは対応のあるt検定を使いますし、そうでない場合はウィルコクソンの符号付順位検定を使います。
 それから独立した3群、3群以上の代表値を比較するときは一元配置の分散分析を使いますし、そうでない場合、パラメトリックではない場合はクラスカル・ウォリス検定を使います。あとは対応がある3群以上の場合、これは説明しませんでしたが、反復測定分散分析というのがあります。ただ、これはまた触れませんが、最近は反復測定分散分析も使わなくなってきていて、混合効果モデルを使ったりすることが多いです。
 フリードマン検定です。ノンパラメトリックの場合はフリードマン検定を使うことが多いです。それから相関係数、量的変数と量的変数の相関、関連性の調査を見るときはピアソン相関係数というのを見ますし、順位相関、順序尺度という尺度の関連性を見るときは順位相関係数を見ますよということになります。
 あとは、フローチャートというか、どういう検定を選んだらいいかというフローチャートを載せているので、自分でやるときにここら辺に従って検定を決めていただけばいいかと思います。