TITLE:母平均の区間推定 *母平均の区間推定 [#j49d7c4f] 母集団から抽出した標本をもとに母集団の平均(母平均)を区間推定する --大卒100人の初任給のデータからすべての大卒の初任給の平均を推定 --あるクラスの男子の身長のデータから日本全体の同年代の男子の身長の平均を推定 **母平均の区間推定の準備 [#yb83ae43] ***標準得点 [#d7539f34] 平均が &mimetex(\normalsize \mu ); 、分散が &mimetex(\normalsize \sigma^2); の ''正規分布''から、 ''標準正規分布''を導くときに、次の式を用いて''標準化''を行う。 #mimetex(){{ z = \frac{ x - \mu }{ \sigma } }} このときの &mimetex(\normalsize z); を、 ''標準得点''(standardized score)という。 標準得点は、平均が0で分散が1の標準正規分布 &mimetex(\normalsize N(0,1)); にしたがう。 ***中心極限定理と標本平均の分布 [#vdc24cb1] 中心極限定理では、 「平均が &mimetex(\normalsize \mu ); で分散が &mimetex(\normalsize \sigma^2 ); の母集団について、 母集団の分布が正規分布でなくても、 標本の大きさ &mimetex(\normalsize n ); が十分大きい標本を抽出すれば、 標本平均 &mimetex(\normalsize \bar{x} ); の分布は平均が &mimetex(\normalsize \mu ); で分散が &mimetex(\normalsize \frac{\sigma^2}{n} ); の正規分布にしたがう」ことが成り立つ。 ある標本の標本平均 &mimetex(\normalsize \bar{x}_i ); を標準化した分布を考える。 標本平均を標準得点 &mimetex(\normalsize z_i ); に変換すると、次の式になる。 #mimetex(){{ z_i = \frac{ \bar{x}_i - \mu }{ \sqrt{ \frac{\sigma^2}{n} } } }} ***標本平均の分布と信頼区間 [#eb335db6] 標準正規分布にしたがう標本平均の信頼区間について考える。 95%信頼区間は、標本平均を標準化した &mimetex(\normalsize z ); が、-1.96〜1.96の区間を示す。 つまり、信頼度を95%とした95%信頼区間では、 標本平均の存在する範囲は次の式のようになる。 #mimetex(){{ -1.96 < \frac{ \bar{x}_i - \mu }{ \sqrt{ \frac{\sigma^2}{n} } } < 1.96 }} ここで、信頼度を 100(1-α)% とすると、次のように書き換えることができる。 #mimetex(){{ -z_{( \alpha / 2)} < \frac{ \bar{x}_i - \mu }{ \sqrt{ \frac{\sigma^2}{n} } } < z_{( \alpha / 2)} }} 区間推定では、調べたいのは母平均 &mimetex(\normalsize \mu ); の範囲になるので、 上の式を &mimetex(\normalsize \mu ); について解くと、 次の式が得られる。 次の式が得られる。これは「母平均が標本平均±z値×標準誤差の範囲にある」ことを示している。 #mimetex(){{ \bar{x} - z_{( \alpha / 2)} \frac{ \sigma }{ \sqrt{n} } \hspace{5} \leq \hspace{5} \mu \hspace{5} \leq \hspace{5} \bar{x} + z_{( \alpha / 2)} \frac{ \sigma }{ \sqrt{n} } }} **母分散が既知の場合 [#h5f914b9] -分散が &mimetex(\normalsize \sigma^2 ); 母集団から抽出した大きさ &mimetex(\normalsize n ); の標本の平均(標本平均)が &mimetex(\normalsize \bar{x} ); であるとき -母平均(母集団の平均) &mimetex(\normalsize \mu ); の信頼度 100(1-α)% の信頼区間は次のとおり #mimetex(){{ \bar{x} - z_{( \alpha / 2)} \frac{ \sigma }{ \sqrt{n} } \hspace{5} \leq \hspace{5} \mu \hspace{5} \leq \hspace{5} \bar{x} + z_{( \alpha / 2)} \frac{ \sigma }{ \sqrt{n} } }} --なお &mimetex(\normalsize z ); は次のように標準化した統計量で、標準正規分布にしたがう #mimetex(){{ z = \frac{ \bar{x} - \mu }{ \frac{ \sigma }{ \sqrt{n} } } }} --推定量(この場合は標本平均)の分散の平方根を''標準誤差''(SE : Standard Error)といい、次のように表す #mimetex(){{ SE = sqrt{ \frac{ \sigma^2 }{ n } } = \frac{ \sigma }{ \sqrt{n} } }} -標本平均 &mimetex(\normalsize \bar{x} ); の分布は正規分布にしたがい(中心極限定理より)、平均は &mimetex(\normalsize \mu ); 、分散は &mimetex(\normalsize \frac{ \sigma^2}{n} ); となる -標本数が多い場合にも使う **母分散が未知の場合(t推定) [#j4707223] -母標準偏差 &mimetex(\normalsize \sigma ); のかわりに、標本標準偏差 &mimetex(\normalsize s ); を用いる --分散は不偏分散になる #mimetex(){{ s^2 = \frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x}) }} -母集団から抽出した大きさ &mimetex(\normalsize n ); の標本の平均(標本平均)が &mimetex(\normalsize \bar{x} ); 、分散(不偏分散)&mimetex(\normalsize s^2 ); がであるとき -母平均 &mimetex(\normalsize \mu ); の信頼度 100(1-α)% の信頼区間は次のとおり #mimetex(){{ \bar{x} - t_{(\alpha / 2)}(n - 1) \frac{ s }{ \sqrt{n} } \hspace{5} \leq \hspace{5} \mu \hspace{5} \leq \hspace{5} \bar{x} + t_{(\alpha / 2)}(n - 1) \frac{ s }{ \sqrt{n} } }} --&mimetex(\normalsize t ); は次のように標準化した統計量で、t分布にしたがい、平均は &mimetex(\normalsize \mu ); 、分散は &mimetex(\normalsize \frac{ s^2}{n} ); となる #mimetex(){{ t = \frac{ \bar{x} - \mu }{ \frac{ s }{ \sqrt{n} } } }} --標準誤差の推定値は &mimetex(\normalsize \sqrt{ \frac{ s^2}{n} } ); となる --&mimetex(\normalsize t_{(\alpha / 2)}(n - 1) ); は、自由度 n-1、確率α/2 のtの値 -標本数が少ない場合にも用いる --自由度(すなわち標本数)が増えれば、t分布が標準正規分布 N(0, 1) に近づくので、母分散が既知の場合と同じになる |