2変量の関連(2)

2つのカテゴリカル変数を分析する方法をまとめておきます。大きく分けて、母比率に差があるかどうかを調べる方法と、2変数の関連を調べる方法があります。

このページでも、データはすでに読み込んでいるという前提でコードを書いております。

2つのカテゴリ変数の母比率の比較

2つのカテゴリ変数の母比率の比較は、prop.test()関数を用いて行います。

prop.test(成功した数のベクトル, 試行した数のベクトル)

例えば、ある試験の合格数で、男性が180人(3000人中)、女性が4人(40人中)となっていたとき、合格率は女性の方が10%と高く、そこに性差別があったのかどうかを調べることができる。

## 2つのカテゴリ変数の母比率の比較の検定

2つのカテゴリ変数の母比率の比較する場合に用いられる。

```{r prop}

prop.test(c(180, 4), c(3000, 40))

```

結果から、どちらかの性別に有利であったという証拠は存在しなかったと判断できます。ただし、今回の例の女性群のように、少ない標本においては、少しの変化が大きな影響を与えることがあるので、注意が必要だといえます。例えば、「prop.test(c(180, 7), c(3000, 50))」のように、女性の受験者が10人増えて、3人合格すると、すぐに結果が変わってしまいます。