TITLE:散布度 *散布度(dispersion) [#pb8170c7] -代表値のほかに、重要な特性値として「''散布度''」がある。 -平均値に対して、''どれくらいデータが散らばっているか''を示す。 --分布の裾の広がり具合 --平均値への集中の度合い **標準偏差 [#ybb7d5b1] ***偏差(diviation) [#o008acb2] -偏差 &mimetex(\normalsize d); は、各データと平均との差である。 --+の偏差と−の偏差があるため、すべての偏差の合計は0になる。 #mimetex(){{ d_i = \bar{x} - x_i d_i = x_i - \bar{x} }} ***分散(variance)と標準偏差(standard deviation) [#n79494b7] 分析対象となる全体(母集団)の分布のバラつきの度合い求める場合には、 代表的な散布度である、分散と標準偏差を用いる。 -分散 &mimetex(\normalsize s^2);(または &mimetex(\normalsize \sigma^2);)は、''偏差平方和''(偏差の二乗の和)をとって、その平均を求めたものである。 --全データの平均からのバラツキの程度を示す。 #mimetex(){{ \begin{eqnarray} s^2 &=& \frac{1}{n} \sum_{i=1}^n \left( \bar{x}-x_i \right)^2 \\ s^2 &=& \frac{1}{n} \sum_{i=1}^n \left( x_i - \bar{x} \right)^2 \\ &=& \frac{1}{n} \sum_{i=1}^n {d_i}^2 \end{eqnarray} }} -標準偏差 &mimetex(\normalsize s); は、分散の平方根を求めたものである。 --全データの平均からのバラツキの程度を示す(単位はデータと同じ)。 #mimetex(){{ s = \sqrt{ \frac{\sum_{i=1}^n \left( \bar{x}-x_i \right)^2}{n} } s = \sqrt{ \frac{\sum_{i=1}^n \left( x_i - \bar{x} \right)^2}{n} } }} -標準偏差や分散の値が大きい場合はデータのバラつきが大きく、小さい場合はバラつきが小さい(データが同じ程度に揃ってる) ***不偏分散(unbiased variance)と不偏標準偏差(unbiased standard diviation) [#eb4658eb] 分析対象となる全体(母集団)ではなく、 対象の一部分(標本)の分布のバラつきの度合いを求める場合には、 不偏分散と不偏標準偏差を用いる。 -不偏分散 &mimetex(\normalsize U^2); は、偏差平方和(偏差の二乗の和)をとって、その平均を求めたものである。 --分散との違いは、分母は「標本数-1」であること。 --データ全体についての平均値からのバラツキの程度を示す。 #mimetex(){{ U^2 = \frac{1}{n-1} \sum_{i=1}^n \left( \bar{x}-x_i \right)^2 U^2 = \frac{1}{n-1} \sum_{i=1}^n \left( x_i - \bar{x} \right)^2 }} -不偏標準偏差&mimetex(\normalsize U);は、分散の平方根を求めたもの --全データの平均からのバラツキの程度を示す(単位はデータと同じ)。 #mimetex(){{ U = \sqrt{ \frac{\sum_{i=1}^n \left( \bar{x}-x_i \right)^2}{n-1} } }} **標準偏差の和 [#hf1fdb2e] &mimetex( n ); 組の資料(データ)があるとき、 資料全体の標準偏差は次のようになる。 #mimetex(){{ s_{T}=\sqrt{ \frac{\sum_{i=1}^{n}N_{i}\left(\ V_{i}+D_{i}^2 \right)}{\sum_{i=1}^{n}N_i} } }} --&mimetex(\normalsize s_{T}); …全体の標準偏差 --&mimetex(\normalsize N_i); …'''i'''組目の資料の標本数 --&mimetex(\normalsize V_i); …'''i'''組目の資料の分散 --&mimetex(\normalsize D_i); …'''i'''組目の資料の偏差 **範囲(range) [#b1119e4a] -範囲 &mimetex( R ); は、データの最大値 &mimetex(\normalsize x_{max}); と最小値 &mimetex(\normalsize x_{min}); との差で、データ全体の範囲を示す。 -ハズレ値の影響を受けやすい #mimetex(){{ R = x_{max} - x_{min} }} **四分位偏差(quartile deviation) [#c2bd3404] -四分位偏差はデータの変動の目安に利用される散布度で、代表値として中央値を用いたときに使われることがある。 -ハズレ値やデータ数に影響されにくい値である。 #pre{{ 四分位偏差=(第3四分位数-第1四分位数)/2 }} **平均偏差(mean deviation) [#w0852639] -平均偏差 &mimetex(\normalsize M_{dev}); は、偏差の絶対値を平均したもので、データと平均値とのずれの程度を示す。 #mimetex(){{ \begin{eqnarray} M_{dev} &=& \frac{1}{n} \sum_{i=1}^{n} \left| x_i - \bar{x} \right| \\ &=& \frac{1}{n} \sum_{i=1}^{n} \left| D_i \right| \end{eqnarray} }} **変異係数(coefficient of variance) [#k8290ec8] -変異係数(変動係数) &mimetex( Cv ); は、標準偏差を平均で割ったもので、平均値に対する標準偏差の割合を示す(%表示)。 -変異係数は相対的な散布度(割合を示す無名数で単位はない)で、平均値や標準偏差の異なる複数の種類のデータを比較するときに用いる。 #mimetex(){{ Cv = s / \bar{x} }} -2つの系列(データの集まり)を比較するとき、次のような場合は相対的散布度が有利になる。 --双方の単位が同じで、平均がほぼ等しい --双方の単位は同じだが、平均が違う --双方の単位が違う |