TITLE:一元配置分散分析 *一元配置分散分析 [#i608c405] -平均値の差の検定で、3つ以上の標本について平均値の差を比較するときに使用する --2つの標本の平均値の差の検定は「 [[対応のないt検定>../../12th/Unpaired_tTest]] 」を使う --もし、3つ以上の標本についてt検定を使う(2組ずつのペアで検定をする)と、例えば差がないにもかかわらず差があると検定してしまう危険性がある -分散分析(ANOVA : ANalysis Of VAriance)は、標本同士の平均値の差の程度がそれぞれの標本内の誤差に比べて大きいかを調べて分析する方法である **検定の対象 [#i36c0164] ***因子と水準 [#v701a706] 対応のない複数の組の標本について考える。 例えば、3つの血圧降下剤(A薬、B薬、C薬)の効果を調べるために、 15人の被験者を無作為に3つのグループに分けて、 それぞれのグループにA薬、B薬、C薬いずれかを投与して 収縮期血圧を測定したところ、 次の表のようになったとする。 |CENTER:|CENTER:|CENTER:|CENTER:|CENTER:|c |~番号|~A薬|~B薬|~C薬|~全体| |~1|116|106|108|| |~2|128|102|100|| |~3|129|108|108|| |~4|137|118|114|| |~5|140|116|110|| |~合計|650|550|540|1740| |~平均|130|110|108|116| -差を調べる変数の要因を「''因子''」という --上の表では「血圧」にあたる --ひとつの因子について分析することから「一元配置分散分析」という -要因の内容が異なるグループを「''水準''」という --上の表では「A薬、B薬、C薬」のような項目にあたる -各水準の標本数(データの個数)を「''繰り返し数''」という 一般には、一元配置分散分析のデータは、次のような表で書くことができる。 |CENTER:|CENTER:50|CENTER:50|CENTER:50|CENTER:50|CENTER:50|c |~番号|~1|~2|~…|~&mimetex(\normalsize p );|~全体| |~1|&mimetex(\normalsize x_{11} );|&mimetex(\normalsize x_{21} );|…|&mimetex(\normalsize x_{p1} );|| |~2|&mimetex(\normalsize x_{12} );|&mimetex(\normalsize x_{22} );|…|&mimetex(\normalsize x_{p2} );|| |~…|||||| |~ |&mimetex(\normalsize x_{1 {n_1} } );|&mimetex(\normalsize x_{2 {n_2} } );|…|&mimetex(\normalsize x_{p {n_p} } );|| |~繰り返し数|&mimetex(\normalsize n_1 );|&mimetex(\normalsize n_2 );|…|&mimetex(\normalsize n_p );|&mimetex(\normalsize n );| |~平均|&mimetex(\normalsize \bar{ x_1 } );|&mimetex(\normalsize \bar{ x_2 } );|…|&mimetex(\normalsize \bar{ x_p } );|&mimetex(\normalsize \bar{x} );| 表のデータは、次のことを表している。 -水準の数 : 1〜'''p''' -それぞれの水準での繰り返し数 : &mimetex(\normalsize n_1, n_2, \cdots, n_p); -全体の標本数 : 各水準の繰り返し数の合計 #mimetex(){{ n = \sum_{i=1}^{p} n_i }} -第 &mimetex(\normalsize i); 水準の第 &mimetex(\normalsize j); 番目のデータ : &mimetex(\normalsize x_{ij}); -それぞれの水準での平均 : &mimetex(\normalsize \bar{x_1}, \bar{x_2}, \cdots, \bar{x_p}); -全体の標本の平均 : #mimetex(){{ \bar{x} = \frac{ \sum_{i=1}^{p} \sum_{j=1}^{n_i} x_{ij} }{n} }} ***全変動と級間変動と誤差変動 [#b30f2b30] ここで、第 &mimetex(\normalsize i); 水準の第 &mimetex(\normalsize j); 番目のデータ &mimetex(\normalsize x_{ij}); について考えてみる。 -全体の平均 &mimetex(\normalsize \bar{x}); や水準内の平均 &mimetex(\normalsize \bar{x_i}); を使って考えると、… -各データは、「全体の平均」と「全体平均とそのデータの水準の平均とのズレ」と「そのデータの水準の平均とデータとのズレ」に分解することができる。 (各データの値)=(全体の平均)+(全体の平均と水準の平均のズレ)+(各データと水準の平均のズレ) -別の書き方をすると、「各データが全体の平均からどれくらいズレているか」は、「全体平均とそのデータの水準の平均とのズレ」と「そのデータの水準の平均とデータとのズレ」に分解することができる。 (各データと全体の平均のズレ)=(全体の平均と水準の平均のズレ)+(各データと水準の平均のズレ) -このズレを「''変動''」という --全体の平均と水準の平均とのズレ(差)を「''級間変動''」(または群間変動)といい、次のようにあらわす #mimetex(){{ T_1 = \sum_{i=1}^{p} n_i ( \bar{x_i}- \bar{x} )^2 }} --各データと水準の平均とのズレ(差)を「''誤差変動''」(級内変動または群内変動)といい、次のようにあらわす #mimetex(){{ T_E = \sum_{i=1}^{p} \sum_{j=1}^{n_i} ( x_{ij} - \bar{x_i} )^2 }} --各データと全体の平均とのズレ(差)を「''全変動''」といい、次のようにあらわす #mimetex(){{ \begin{eqnarray} T &=& \sum_{i=1}^{p} \sum_{j=1}^{n_i} ( x_{ij} - \bar{x} )^2 \\ &=& T_1 + T_E \end{eqnarray} }} -また、級間変動と誤差変動について、不偏分散を次のように定義しておく --級間変動の不偏分散 &mimetex(\normalsize V_1 ); #mimetex(){{ V_1 = \frac{T_1}{p - 1} }} --誤差変動の不偏分散 &mimetex(\normalsize V_E ); #mimetex(){{ V_E = \frac{T_E}{n - p} }} ---もし、各水準の繰り返し数が一定の値 &mimetex(\normalsize n_i ); の場合は次のようにも書ける #mimetex(){{ V_E = \frac{T_E}{p ( n_i - 1)} }} **1元配置分散分析 [#r70d9659] -3つ以上の標本について平均値の差を調べて、級間変動と誤差変動のどちらの比率が高いか調べる -級間変動のほうが大きければ、全変動に与える影響が級間変動の方が大きいと見なし、平均値に差があるとする **ウィルコクソンの符号付順位検定 [#q1ce2989] -データ対の順位がわかる場合は、符号検定よりも効率が良い ***帰無仮説と対立仮説 [#i9abbb97] 対応のある2組の標本の代表値に差があるかどうかを調べる。 対応のない3組以上の標本の平均値に差があるかどうかを調べる。 -帰無仮説 &mimetex(\normalsize H_{0} ); は「2組の標本の代表値に差はない」 -対立仮説 &mimetex(\normalsize H_{1} ); は「2組の標本の代表値に差がある」 -帰無仮説 &mimetex(\normalsize H_{0} ); は「各水準の平均値に差はない」 -対立仮説 &mimetex(\normalsize H_{1} ); は「各水準の(少なくとも1つの組み合わせで)平均値に差がある」 ***検定統計量の算出 [#o36222cb] -2つの標本の差 &mimetex(\normalsize d_i); の順位の和を、次のように求める --差 &mimetex(\normalsize d_i); が正の値の順位の和を &mimetex(\normalsize T+); とする --差 &mimetex(\normalsize d_i); が負の値の順位の和を &mimetex(\normalsize T-); とする -&mimetex(\normalsize T+ ); と &mimetex(\normalsize T- ); の小さい方の値を &mimetex(\normalsize T_0 ); とする。 --標本数 &mimetex(\normalsize n ); は、差が0でない組の数とする -級間変動(または群間変動)を求める #mimetex(){{ T_0 = \min ( T+ , T-) T_1 = \sum_{i=1}^{p} n_i ( \bar{x_i}- \bar{x} )^2 }} -&mimetex(\normalsize n \leq 25 ); (または &mimetex(\normalsize n \leq 50 ); )の場合… --ウィルコクソンの符号付順位検定表から、標本数 &mimetex(\normalsize n ); に対応する &mimetex(\normalsize T ); の値を求める -&mimetex(\normalsize n > 25 ); (または &mimetex(\normalsize n > 50 ); )の場合… --平均 &mimetex(\normalsize \mu_{T} ); と標準偏差 &mimetex(\normalsize \sigma_{T} ); を次の式から求める -誤差変動(級内変動または群内変動)を求める #mimetex(){{ \begin{eqnarray} \mu_{T} &=& \frac{n(n+1)}{4} \\ \sigma_{T} &=& \sqrt{ \frac{ n(n+1)(2n+1) }{24} } \end{eqnarray} T_E = \sum_{i=1}^{p} \sum_{j=1}^{n_i} ( x_{ij} - \bar{x_i} )^2 }} --標準正規分布にしたがう、検定統計量 &mimetex(\normalsize z_0 ); を次の式から算出する -級間変動の不偏分散を求める #mimetex(){{ z_0 = \frac{ | T_0 - \mu_{T} | }{ \sigma_{T} } V_1 = \frac{T_1}{p - 1} }} -誤差変動の不偏分散を求める #mimetex(){{ V_E = \frac{T_E}{n - p} }} -第1自由度が &mimetex(\normalsize df_1 = p-1); 、第2自由度が &mimetex(\normalsize df_E = n-p); のF分布にしたがう、検定統計量 &mimetex(\normalsize F_1 ); を次の式から算出する #mimetex(){{ F_1 = \frac{ T_1 }{ T_E } }} 分散分析表にまとめると、次のようになる。 |CENTER:|CENTER:|CENTER:|CENTER:|CENTER:|c |~要因|~平方和|~自由度|~平均平方|~F値| |~級間|&mimetex(\normalsize T_1);|&mimetex(\normalsize df_1 = p-1);|&mimetex(\normalsize V_1 = T_1 / df_1);|&mimetex(\normalsize F_1 = V_1 / V_E);| |~誤差|&mimetex(\normalsize T_E);|&mimetex(\normalsize df_E = n-p);|&mimetex(\normalsize V_E = T_E / df_E);|| |~全体|&mimetex(\normalsize T = T_1 + T_E);|&mimetex(\normalsize df_T = n-1);|&mimetex(\normalsize V_T = T / df_T);|| ***仮説の判定(検定表からの算出) [#he4b582f] -&mimetex(\normalsize n \leq 25 ); (または &mimetex(\normalsize n \leq 50 ); )の場合… --帰無仮説 &mimetex(\normalsize H_{0} ); を棄却 : &mimetex(\normalsize T_0 \leq T); ---「有意に差がある」「検定の結果、有意である」 --帰無仮説 &mimetex(\normalsize H_{0} ); を採択 : &mimetex(\normalsize T_0 > T); ---「有意に差はない」「検定の結果、有意でない」「差があるとはいえない」 #br -&mimetex(\normalsize n > 25 ); (または &mimetex(\normalsize n > 50 ); )の場合… -検定統計量 &mimetex(\normalsize z_0 ); と、有意水準 &mimetex(\normalsize \alpha ); の有意点の値(標準正規分布表などから求める)を使って、判定をする --帰無仮説 &mimetex(\normalsize H_{0} ); を棄却 : &mimetex(\normalsize |z_0| > z(\alpha/2)); ---「有意に差がある」「検定の結果、有意である」 --帰無仮説 &mimetex(\normalsize H_{0} ); を採択 : &mimetex(\normalsize |z_0| < z(\alpha/2)); ---「有意に差はない」「検定の結果、有意でない」「差があるとはいえない」 |