TITLE:独立性の検定 *独立性の検定 [#s8d7c420] |CENTER:|CENTER:|CENTER:|CENTER:|CENTER:|CENTER:|c ||&mimetex(B_1);|&mimetex(B_2);|…|&mimetex(B_l);|計| |&mimetex(A_1);|&mimetex(n_{11});|&mimetex(n_{12});|…|&mimetex(B_{1l});|&mimetex(B_{1\cdot});| -2つの変数に関連性があるか、つまり2つの変数の独立性を検定する。 -アンケートの結果の分析などに利用できる、基本的な手法のひとつ。 **分割表(クロス表) [#id28bcfe] ***分割表とは [#k9276f95] -観測された2つの変数(要因と結果など)を組み合わせた表を、「''分割表(クロス表)''」という --クロス集計表ともいう --Excelでは「ピボットテーブル」の機能で作ることができる -'''k'''行'''l'''列の表からなる分割表を、「'' '''k''' × '''l''' 分割表''」という |CENTER:40|CENTER:40|CENTER:40|CENTER:40|CENTER:40|CENTER:40|c |~ |~&mimetex(\normalsize B_1);|~&mimetex(\normalsize B_2);|~…|~&mimetex(\normalsize B_l);|~計| |~&mimetex(\normalsize A_1);|&mimetex(\normalsize n_{11});|&mimetex(\normalsize n_{12});|…|&mimetex(\normalsize n_{1l});|&mimetex(\normalsize n_{1\cdot});| |~&mimetex(\normalsize A_2);|&mimetex(\normalsize n_{21});|&mimetex(\normalsize n_{22});|…|&mimetex(\normalsize n_{2l});|&mimetex(\normalsize n_{2\cdot});| |~…|…|…|…|…|…| |~&mimetex(\normalsize A_k);|&mimetex(\normalsize n_{k1});|&mimetex(\normalsize n_{k2});|…|&mimetex(\normalsize n_{kl});|&mimetex(\normalsize n_{k\cdot});| |~計|&mimetex(\normalsize n_{\cdot1});|&mimetex(\normalsize n_{\cdot2});|…|&mimetex(\normalsize n_{{\cdot}l});|&mimetex(\normalsize n);| -なお、周辺分布(右端の列や最下行の値)は、次のような意味になる。 --標本数 : &mimetex(\normalsize n_{{\cdot}l}); --第 '''i''' 行の標本数 : &mimetex(\normalsize n_{i {\cdot}}); : --第 '''j''' 行の標本数 : &mimetex(\normalsize n_{{\cdot} j}); : #mimetex(){{ \begin{eqnarray} n_{i \cdot} &=& \sum_{j=1}^l n_{ij} \\ n_{\cdot j} &=& \sum_{i=1}^k n_{ij} \\ n &=& \sum_{i=1}^k \sum_{j=1}^l n_{ij} \\ \end{eqnarray} }} ***期待度数 [#fe71f223] -分割表の各セルの期待値は、周辺分布の値から、次のように計算する。 -- '''i''' 行 '''j''' 列のセルの期待値 : &mimetex(\normalsize e_{ij}); #mimetex(){{ \begin{eqnarray} e_{ij} &=& n \times \frac{ n_{i \cdot} }{n} \times \frac{ n_{{\cdot} j} }{n} \\ &=& \frac{ n_{i \cdot} n_{{\cdot} j} }{ n } \end{eqnarray} }} **独立性の検定(2×2より大きい表の場合 : 自由度 '''df''' >1) [#bd79672a] -2行2列より大きい分割表の場合は、カイ二乗(&mimetex(\normalsize \chi^2 ); )分布を利用して検定する ***帰無仮説と対立仮説 [#z16fb68b] 2つの変数が独立であるか(関連がないか)を調べるを調べる。 -帰無仮説 &mimetex(\normalsize H_{0} ); は「2つの変数は独立である(関連がない)」 -対立仮説 &mimetex(\normalsize H_{1} ); は「2つの変数は独立ではない(関連がある)」 ***検定統計量の算出 [#pb6e4893] -自由度 &mimetex(\normalsize (k-1) \times (l-1) ); のカイ二乗(&mimetex(\normalsize \chi^2 ); )分布にしたがう、検定統計量 &mimetex(\normalsize {\chi_0}^2 ); を次の式から算出する #mimetex(){{ {\chi_0}^2 = \sum_{i=1}^k \sum_{j=1}^l \frac{( n_{ij} - e_{ij} )^2}{ e_{ij} } }} ***仮説の判定(両側検定) [#q5beac9b] -検定統計量 &mimetex(\normalsize {\chi_0}^2 ); と、自由度 &mimetex(\normalsize df = (k-1) \times (l-1) ); 、有意水準 &mimetex(\normalsize \alpha ); の有意点の値(カイ二乗分布表などから求める)を使って、判定をする --帰無仮説 &mimetex(\normalsize H_{0} ); を棄却 : &mimetex(\normalsize |{\chi_0}^2| > \chi^2); ---「有意に差がある」「検定の結果、有意である」 --帰無仮説 &mimetex(\normalsize H_{0} ); を採択 : &mimetex(\normalsize |{\chi_0}^2| < \chi^2); ---「有意に差はない」「検定の結果、有意でない」「差があるとはいえない」 **独立性の検定(2×2表の場合 : 自由度 '''df''' =1) [#r29b9f97] -2行2列の分割表の場合は、直接確率を計算するか、カイ二乗(&mimetex(\normalsize \chi^2 ); )分布に近似した検定統計量で検定する --フィッシャー(Fisher)の直接確率法 ---標本数が20未満、または標本数が40未満で最小期待値が5未満の場合 --イェーツ(Yates)の連続補正 ---標本数が40未満で、フィッシャーの直接確率法の条件を満たさない場合 -ここでは、Yatesの連続補正について説明する ***帰無仮説と対立仮説 [#gcb38bd2] 2つの変数が独立であるか(関連がないか)を調べるを調べる。 -帰無仮説 &mimetex(\normalsize H_{0} ); は「2つの変数は独立である(関連がない)」 -対立仮説 &mimetex(\normalsize H_{1} ); は「2つの変数は独立ではない(関連がある)」 ***2×2分割表 [#qa24329e] -観測値による分割表を、次のようにあらわす |CENTER:|CENTER:|CENTER:|CENTER:|c |~ |>|~教育後|~計| |~ |~はい|~いいえ|~| |~はい|&mimetex(\normalsize a);|&mimetex(\normalsize b);|&mimetex(\normalsize a+b );| |~いいえ|&mimetex(\normalsize c);|&mimetex(\normalsize d);|&mimetex(\normalsize c+d );| |~計|&mimetex(\normalsize a+c );|&mimetex(\normalsize b+d );|&mimetex(\normalsize a+b+c+d =n);| -期待値による分割表は、次のような表になる |CENTER:|CENTER:|CENTER:|CENTER:|c |~ |~要因1|~要因2|~計| |~結果A|&mimetex(\normalsize (a+b) \times \frac{a+c}{n});|&mimetex(\normalsize (a+b) \times \frac{b+d}{n});|&mimetex(\normalsize a+b );| |~結果B|&mimetex(\normalsize (c+d) \times \frac{a+c}{n});|&mimetex(\normalsize (c+d) \times \frac{b+d}{n});|&mimetex(\normalsize c+d );| |~計|&mimetex(\normalsize a+c );|&mimetex(\normalsize b+d );|&mimetex(\normalsize a+b+c+d =n);| ***検定統計量の算出 [#obd393b1] -2×2分割表では、次の式のような簡便な方法から、自由度 &mimetex(\normalsize (2-1) \times (2-1) =1 ); のカイ二乗(&mimetex(\normalsize \chi^2 ); )分布にしたがう、検定統計量 &mimetex(\normalsize {\chi_0}^2 ); を次の式から算出できる #mimetex(){{ {\chi_o}^2 = \frac{ \left( ad-bc \right)^2 n }{ (a + b) (c + d) (a + c) (b + d) } }} -しかし、この方法では、計算した値が実際の &mimetex(\normalsize \chi^2 ); 分布とずれてしまうことがわかっている --理由は、 &mimetex(\normalsize \chi^2 ); 分布は連続的にもかかわらず、計算した検定統計量は離散的だから -そこで、Yatesの連続補正を使って、検定統計量を補正する --原則として、2×2分割表ではYatesの連続補正を使うと考えてよい #mimetex(){{ {\chi_o}^2 = \frac{ \left( |ad-bc| - \frac{n}{2} \right)^2 n }{ (a + b) (c + d) (a + c) (b + d) } }} ***仮説の判定(両側検定) [#xcb75dd9] -検定統計量 &mimetex(\normalsize {\chi_0}^2 ); と、自由度 &mimetex(\normalsize df = (k-1) \times (l-1) ); 、有意水準 &mimetex(\normalsize \alpha ); の有意点の値(カイ二乗分布表などから求める)を使って、判定をする --帰無仮説 &mimetex(\normalsize H_{0} ); を棄却 : &mimetex(\normalsize |{\chi_0}^2| > \chi^2); ---「有意に差がある」「検定の結果、有意である」 --帰無仮説 &mimetex(\normalsize H_{0} ); を採択 : &mimetex(\normalsize |{\chi_0}^2| < \chi^2); ---「有意に差はない」「検定の結果、有意でない」「差があるとはいえない」 |