Q17

Q

ダミー変数とは何か?

A

0か1の値を取る変数です。質的変数を重回帰分析などの多変量解析の説明変数として使う場合に用いられます。

【解説】

質的変数はカテゴリを区別するために値が割り当てられており,数値の大小に意味はありません。回帰分析では従属変数と説明変数の関係は線形関係(直線関係)であることを仮定しているので,質的変数をそのまま回帰分析の説明変数に使うと正しい結果が出ません。質的変数を回帰分析の説明変数で使用する際はそれぞれのカテゴリに属するかどうかを表すダミー変数の組み合わせで質的変数を表現します。 例えば住んでいる地域(居住地域)を表す変数で,北海道=1,東北=2,関東=3,中部=4,近畿=5,中国=6,四国=7,九州・沖縄=8とコードされている場合は,北海道に住んでいる人は1,それ以外は0,東北に住んでいる人は1,それ以外は0というようにそれぞれについてダミー変数を作ります。回帰分析等で使用する場合は,基準にするカテゴリを1つ決めて,それ以外のダミー変数を回帰式に投入することで質的変数を回帰分析等に組み込むことができます。

【参照】

永岡 淳一、応用情報処理 | 第11回 重回帰分析(1) | アパートの家賃 http://www.cuc.ac.jp/~nagaoka/2011/ouyou/11/rent2/index.html