TITLE:散布度 *散布度(dispersion) [#pb8170c7] -代表値のほかに、重要な特性値として「''散布度''」がある。 -平均値にたいして、''どれくらいデータが散らばっているか''を示す。 --分布の裾の広がり具合、集中の度合い -平均値に対して、''どれくらいデータが散らばっているか''を示す。 --分布の裾の広がり具合 --平均値への集中の度合い **標準偏差 [#ybb7d5b1] ***偏差 [#o008acb2] -偏差 '''D''' (または '''d''') は、各データと平均との差。 --+の偏差と−の偏差があるため、偏差の合計は0になる。 ***偏差(diviation) [#o008acb2] -偏差 &mimetex(\normalsize D); は、各データと平均との差である。 --+の偏差と−の偏差があるため、すべての偏差の合計は0になる。 #mimetex(){{ D=\bar{x} - x_i D_i = \bar{x} - x_i }} ***分散(variance)と標準偏差(standard deviation) [#n79494b7] -分散&mimetex(\normalsize s^2);(または&mimetex(\normalsize \delta^2);)は、偏差平方和(偏差の二乗の和)をとって、その平均を求めたもの。 分析対象となる全体(母集団)の分布のバラつきの度合い求める場合には、 代表的な散布度である、分散と標準偏差を用いる。 -分散 &mimetex(\normalsize s^2);(または &mimetex(\normalsize \delta^2);)は、''偏差平方和''(偏差の二乗の和)をとって、その平均を求めたものである。 --全データの平均からのバラツキの程度を示す。 #mimetex(){{ s^2=\frac{\sum_{i=1}^n \left( \bar{x}-x_i \right)^2}{n} \begin{eqnarray} s^2 &=& \frac{1}{n} \sum_{i=1}^n \left( \bar{x}-x_i \right)^2 \\ &=& \frac{1}{n} \sum_{i=1}^n D_i \end{eqnarray} }} -標準偏差&mimetex(\normalsize s);は、分散の平方根を求めたもの -標準偏差 &mimetex(\normalsize s); は、分散の平方根を求めたものである。 --全データの平均からのバラツキの程度を示す(単位はデータと同じ)。 --標準偏差は、代表的な散布度である。 #mimetex(){{ s=\sqrt{ \frac{\sum_{i=1}^n \left( \bar{x}-x_i \right)^2}{n} } s = \sqrt{ \frac{\sum_{i=1}^n \left( \bar{x}-x_i \right)^2}{n} } }} -母集団(対象となる全体)の分散や標準偏差を求める場合は、上の式を用いる。 -標準偏差や分散の値が大きい場合はデータのバラつきが大きく、小さい場合はバラつきが小さい(データが同じ程度に揃ってる) ***不偏分散と不偏標準偏差 [#eb4658eb] -不偏分散&mimetex(\normalsize U^2);は、偏差平方和(偏差の二乗の和)をとって、その平均を求めたもの。 -分母は、「標本数-1」となる。 --全データの平均からのバラツキの程度を示す。 ***不偏分散(unbiased variance)と不偏標準偏差(unbiased standard diviation) [#eb4658eb] 分析対象となる全体(母集団)ではなく、 対象の一部分(標本)の分布のバラつきの度合い求める場合には、 不偏分散と不偏標準偏差を用いる。 -不偏分散 &mimetex(\normalsize U^2); は、偏差平方和(偏差の二乗の和)をとって、その平均を求めたものである。 --分散との違いは、分母は「標本数-1」であること。 --データ全体についての平均値からのバラツキの程度を示す。 #mimetex(){{ U^2=\frac{\sum_{i=1}^n \left( \bar{x}-x_i \right)^2}{n-1} U^2 = \frac{1}{n-1} \sum_{i=1}^n \left( \bar{x}-x_i \right)^2 }} -不偏標準偏差&mimetex(\normalsize U);は、分散の平方根を求めたもの --全データの平均からのバラツキの程度を示す(単位はデータと同じ)。 --標準偏差は、代表的な散布度である。 #mimetex(){{ U=\sqrt{ \frac{\sum_{i=1}^n \left( \bar{x}-x_i \right)^2}{n-1} } U = \sqrt{ \frac{\sum_{i=1}^n \left( \bar{x}-x_i \right)^2}{n-1} } }} -母集団(対象となる全体)ではなく、標本(対象の一部)の分散や標準偏差を求める場合は、上の式を用いる。 **標準偏差の和 [#hf1fdb2e] n組の資料があるとき、資料全体の標準偏差は次のようになる。 &mimetex( n ); 組の資料(データ)があるとき、 資料全体の標準偏差は次のようになる。 #mimetex(){{ s_{T}=\left( \frac{\sum_{i=1}^{n}N_{i}\left(\ V_{i}+D_{i}^2 \right)}{\sum_{i=1}^{n}N_i} \right)^{1/2} s_{T}=\sqrt{ \frac{\sum_{i=1}^{n}N_{i}\left(\ V_{i}+D_{i}^2 \right)}{\sum_{i=1}^{n}N_i} } }} --&mimetex(\normalsize s_{T}); …全体の標準偏差 --&mimetex(\normalsize N_i); …'''i'''組目の資料の標本数 --&mimetex(\normalsize V_i); …'''i'''組目の資料の分散 --&mimetex(\normalsize D_i); …'''i'''組目の資料の偏差 **範囲 [#b1119e4a] -範囲 '''R''' は、最大値&mimetex(\normalsize x_{max});と最小値&mimetex(\normalsize x_{min});との差で示される。 **範囲(range) [#b1119e4a] -範囲 &mimetex( R ); は、データの最大値 &mimetex(\normalsize x_{max}); と最小値 &mimetex(\normalsize x_{min}); との差で、データ全体の範囲を示す。 -ハズレ値の影響を受けやすい #mimetex(){{ R=x_{max}-x_{min} R = x_{max} - x_{min} }} **四分位偏差 [#c2bd3404] -四分位偏差は、変動の目安に利用される -ハズレ値や観測数に影響されにくい **四分位偏差(quartile deviation) [#c2bd3404] -四分位偏差はデータの変動の目安に利用される散布度で、代表値として中央値を用いたときに使われることがある。 -ハズレ値やデータ数に影響されにくい値である。 #pre{{ 四分位偏差=(第3四分位数-第1四分位数)/2 }} **平均偏差 [#w0852639] -平均偏差 &mimetex(\normalsize M_{dev}); は、偏差の絶対値を平均したもの。 **平均偏差(mean deviation) [#w0852639] -平均偏差 &mimetex(\normalsize M_{dev}); は、偏差の絶対値を平均したもので、データと平均値とのずれの程度を示す。 #mimetex(){{ M_{dev}=\frac{1}{n} \sum_{i=1}^{n}\left| D_i \right| \begin{eqnarray} M_{dev} &=& \frac{1}{n} \sum_{i=1}^{n} \left| x_i - \bar{x} \right| \\ &=& \frac{1}{n} \sum_{i=1}^{n} \left| D_i \right| \end{eqnarray} }} **変異係数 [#k8290ec8] -変異(変動)係数 '''C''' は、標準偏差を平均で割ったもの。 --標準偏差の平均に対する割合を示す(%表示)。 -変異係数は相対的な散布度(無名数で単位はない)。 **変異係数(coefficient of variance) [#k8290ec8] -変異係数(変動係数) &mimetex( Cv ); は、標準偏差を平均で割ったもので、平均値に対する標準偏差の割合を示す(%表示)。 -変異係数は相対的な散布度(割合を示す無名数で単位はない)で、平均値や標準偏差の異なる複数の種類のデータを比較するときに用いる。 #mimetex(){{ C = s / \bar{x} Cv = s / \bar{x} }} -2つの系列を比較するとき、次のような場合は、相対的散布度が有利 -2つの系列(データの集まり)を比較するとき、次のような場合は相対的散布度が有利になる。 --双方の単位が同じで、平均がほぼ等しい --双方の単位は同じだが、平均が違う --双方の単位が違う |