TITLE:符号検定 *符号検定 [#g44746d3] 母比率の検定では、「''母比率と標本比率との差の程度''」を調べる。 -帰無仮説 &mimetex(\normalsize H_{0} ); は「母比率と標本比率が等しい」 : &mimetex(\normalsize p = \hat{p}); -対立仮説 &mimetex(\normalsize H_{1} ); は「母比率と標本比率が等しくない」 : --両側検定の場合は &mimetex(\normalsize p \neq \hat{p}); --片側検定の場合は &mimetex(\normalsize p < \hat{p}); または &mimetex(\normalsize p > \hat{p}); -中央値の差を検定する手法である -対応のある2つの標本(調査前と調査後、教育前と教育後など)について、それぞれのデータの対(各組)の大小(または優劣)関係にもとづいて検定する **二項検定 [#b25eafda] -二項定理を使って、母比率に対する標本比率の統計値を直接計算し、有意水準と比較する -理論的には正当な方法だが計算が複雑なため、コンピュータによる統計処理が登場するまでは、正規分布に近似する方法(後述)などが使われていた。 **検定の対象 [#i36c0164] 対応のある2組の標本(標本数は同じ)について考える。 -例えば、ある教育の前と後の効果、実験の前と後の結果の違いなどを調べる ***考え方、 [#uc065470] -母比率 &mimetex(\normalsize p_0 ); の事象を、&mimetex(\normalsize n); 回試行するとき、 -&mimetex(\normalsize r); 回起きる確率は次のようになる 2つの標本AとBについて、データを表にまとめると次のようになったとする。 |CENTER:|CENTER:|CENTER:|CENTER:|CENTER:|CENTER:|CENTER:|CENTER:|CENTER:|c |~ |~1|~2|~3|~4|~5|~…|~n-1|~n| |~標本A|5|3|3|4|2|…|2|4| |~標本B|3|5|1|5|2|…|1|2| -2つの標本のデータの各組を比較する --「大きい(または、優れている)」となった組の数を &mimetex(\normalsize n_1 ); とする --「小さい(または、劣っている)」となった組の数を &mimetex(\normalsize n_2 ); とする --同じになった組は、検定から除外する |CENTER:|CENTER:|CENTER:|CENTER:|CENTER:|CENTER:|CENTER:|CENTER:|CENTER:|c |~ |~1|~2|~3|~4|~5|~…|~n-1|~n| |~標本A|5|3|3|4|2|…|2|4| |~標本B|3|5|1|5|2|…|1|2| |~A-B|+|−|+|−|0|…|+|+| -試行回数が &mimetex(\normalsize n_1 + n_2 ); と見なして考えると、2つの標本の中央値に差がないとすれば、「大きい」と「小さい」となる確率は &mimetex(\normalsize \frac{1}{2} ); となるはず -標本数を &mimetex(\normalsize N = n_1 + n_2 ); とする **符号検定(小標本 : 二項検定を利用) [#sc80c31a] -標本数が少ない場合は、二項検定を利用して、正確な有意確率を求める ***帰無仮説と対立仮説 [#i9abbb97] 対応のある2組の標本の中央値に差があるかどうかを調べる。 -帰無仮説 &mimetex(\normalsize H_{0} ); は「2組の標本の中央値に差はない」 -対立仮説 &mimetex(\normalsize H_{1} ); は「2組の標本の中央値に差がある」 ***検定統計量の算出 [#p360dd81] -試行回数が &mimetex(\normalsize n_1 + n_2 ); の状況で、帰無仮説が成り立つとすれば「大きい」と「小さい」となる確率は &mimetex(\normalsize \frac{1}{2} ); となるのを利用 -&mimetex(\normalsize n_1 ); と &mimetex(\normalsize n_2 ); の小さい方の値 &mimetex(\normalsize m ); 以下 に対応する符号が出現する確率を求める #mimetex(){{ P_r = {}_nC_r {p_0}^r (1 - {p_0})^{n-r} m = \min (n_1, n_2) }} -「&mimetex(\normalsize r); 回以上」起きる確率は、次のような確率の和から算出できる -二項検定を利用して、次の式から「&mimetex(\normalsize m); 回以下」起きる確率を算出する #mimetex(){{ \begin{eqnarray} P &=& {}_nC_r {p_0}^r (1 - {p_0})^{n-r} + {}_nC_{r+1} {p_0}^{r+1} (1 - {p_0})^{n-r+1} + \cdots + {}_nC_n {p_0}^n (1 - {p_0})^{0} \\ &=& \sum_{i=r}^{n} {}_nC_i {p_0}^i (1 - {p_0})^{n-i} \\ &=& 1 - \sum_{i=0}^{r-1} {}_nC_i {p_0}^i (1 - {p_0})^{n-i} \\ \end{eqnarray} P_0 = 2 \sum_{i=0}^m {}_N C_i \left( \frac{1}{2} \right)^2 }} -算出した確率(P値)と有意水準を比較する **仮説の判定 [#e1607938] -算出した有意確率(P値)と有意水準を比較する --片側検定 ---帰無仮説 &mimetex(\normalsize H_{0} ); を棄却 : &mimetex(\normalsize P < \alpha); ---帰無仮説 &mimetex(\normalsize H_{0} ); を採択 : &mimetex(\normalsize P \geq \alpha); ---帰無仮説 &mimetex(\normalsize H_{0} ); を棄却 : &mimetex(\normalsize P_0 < \alpha); ---帰無仮説 &mimetex(\normalsize H_{0} ); を採択 : &mimetex(\normalsize P_0 \geq \alpha); --両側検定 ---帰無仮説 &mimetex(\normalsize H_{0} ); を棄却 : &mimetex(\normalsize 2P < \alpha); ---帰無仮説 &mimetex(\normalsize H_{0} ); を採択 : &mimetex(\normalsize 2P \geq \alpha); ---帰無仮説 &mimetex(\normalsize H_{0} ); を棄却 : &mimetex(\normalsize 2P_0 < \alpha); ---帰無仮説 &mimetex(\normalsize H_{0} ); を採択 : &mimetex(\normalsize 2P_0 \geq \alpha); **正規分布に近似 [#bed6ea64] -特定の条件の時にだけ使える方法である --標本数を &mimetex(\normalsize n ); 、母比率を &mimetex(\normalsize p_0 ); とするとき、 -- &mimetex(\normalsize np_0 > 5 , \hspace{8} p_0 < 1 - p_0 ); 、または、 &mimetex(\normalsize n > 25); の場合 ***考え方 [#qd2e8eba] -標本の値を &mimetex(\normalsize x ); 、標本比率を &mimetex(\normalsize \hat{p_0} = \frac{x}{n} ); とする -標準正規分布に近似される、検定統計量 &mimetex(\normalsize z_0 ); を次の式から算出する **符号検定(大標本 : 標準正規分布を利用) [#cd5ba662] -標本数が多い場合は、標準正規分布を利用して検定する ***帰無仮説と対立仮説 [#odd75632] 対応のある2組の標本の中央値に差があるかどうかを調べる。 -帰無仮説 &mimetex(\normalsize H_{0} ); は「2組の標本の中央値に差はない」 -対立仮説 &mimetex(\normalsize H_{1} ); は「2組の標本の中央値に差がある」 ***検定統計量の算出 [#wf6a0a0a] -標準正規分布にしたがう、検定統計量 &mimetex(\normalsize z_0 ); を次の式から算出する #mimetex(){{ z_{0} = \frac{ \hat{p_0} - p_0 }{ \sqrt{ \frac{ p_0 (1 - p_0) }{ n } } } z_0 = \frac{ | n_1 -n_2 | }{ \sqrt{ n_1 + n_2 } } }} -検定統計量 &mimetex(\normalsize z_{0} ); を使って判定をする ***連続補正をする場合 [#a117ad7f] -二項分布は離散型の分布であるため、正規分布のような連続型の分布に近似すると、その精度はあまりよくない -そこで、連続補正(イエーツ(Yates)の補正)をすることで、精度をよくする -二項分布は離散型の分布であるため、標準正規分布のような連続型の分布に近似すると、その精度はあまりよくない -そこで、Yatesの連続補正をすることで、精度をよくする #mimetex(){{ z_{0c} = \frac{ |x - np_0| - 0.5 }{ \sqrt{np_0 (1 - p_0)} } z_0 = \frac{ | n_1 -n_2 | - 1 }{ \sqrt{ n_1 + n_2 } } }} -補正した検定統計量 &mimetex(\normalsize z_{0c} ); を使って判定をする ***仮説の判定(両側検定) [#fb3ae6fb] -検定統計量 &mimetex(\normalsize z_0 ); と、有意水準 &mimetex(\normalsize \alpha ); の有意点の値(標準正規分布表などから求める)を使って、判定をする --帰無仮説 &mimetex(\normalsize H_{0} ); を棄却 : &mimetex(\normalsize |z_0| > z(\alpha/2)); ---「有意に差がある」「検定の結果、有意である」 --帰無仮説 &mimetex(\normalsize H_{0} ); を採択 : &mimetex(\normalsize |z_0| < z(\alpha/2)); ---「有意に差はない」「検定の結果、有意でない」「差があるとはいえない」 |