TITLE:散布度 *散布度(dispersion) [#pb8170c7] -代表値のほかに、重要な特性値として「''散布度''」がある。 -平均値にたいして、''どれくらいデータが散らばっているか''を示す。 --分布の裾の広がり具合、集中の度合い **標準偏差 [#ybb7d5b1] ***偏差 [#o008acb2] -偏差 '''D''' (または '''d''') は、各データと平均との差。 --+の偏差と−の偏差があるため、偏差の合計は0になる。 #mimetex(){{ D=\bar{x} - x_i }} ***分散(variance)と標準偏差(standard deviation) [#n79494b7] -分散&mimetex(\normalsize s^2);(または&mimetex(\normalsize \delta^2);)は、偏差平方和(偏差の二乗の和)をとって、その平均を求めたもの。 --全データの平均からのバラツキの程度を示す。 #mimetex(){{ s^2=\frac{\sum_{i=1}^n \left( \bar{x}-x_i \right)^2}{n} }} -標準偏差&mimetex(\normalsize s);は、分散の平方根を求めたもの --全データの平均からのバラツキの程度を示す(単位はデータと同じ)。 --標準偏差は、代表的な散布度である。 #mimetex(){{ s=\sqrt{ \frac{\sum_{i=1}^n \left( \bar{x}-x_i \right)^2}{n} } }} -母集団(対象となる全体)の分散や標準偏差を求める場合は、上の式を用いる。 ***不偏分散と不偏標準偏差 [#eb4658eb] -不偏分散&mimetex(\normalsize U^2);は、偏差平方和(偏差の二乗の和)をとって、その平均を求めたもの。 -分母は、「標本数-1」となる。 --全データの平均からのバラツキの程度を示す。 #mimetex(){{ U^2=\frac{\sum_{i=1}^n \left( \bar{x}-x_i \right)^2}{n-1} }} -不偏標準偏差&mimetex(\normalsize U);は、分散の平方根を求めたもの --全データの平均からのバラツキの程度を示す(単位はデータと同じ)。 --標準偏差は、代表的な散布度である。 #mimetex(){{ U=\sqrt{ \frac{\sum_{i=1}^n \left( \bar{x}-x_i \right)^2}{n-1} } }} -母集団(対象となる全体)ではなく、標本(対象の一部)の分散や標準偏差を求める場合は、上の式を用いる。 **標準偏差の和 [#hf1fdb2e] n組の資料があるとき、資料全体の標準偏差は次のようになる。 #mimetex(){{ s_{T}=\left( \frac{\sum_{i=1}^{n}N_{i}\left(\ V_{i}+D_{i}^2 \right)}{\sum_{i=1}^{n}N_i} \right)^{1/2} }} --&mimetex(\normalsize s_{T}); …全体の標準偏差 --&mimetex(\normalsize N_i); …'''i'''組目の資料の標本数 --&mimetex(\normalsize V_i); …'''i'''組目の資料の分散 --&mimetex(\normalsize D_i); …'''i'''組目の資料の偏差 **範囲 [#b1119e4a] -範囲 '''R''' は、最大値&mimetex(\normalsize x_{max});と最小値&mimetex(\normalsize x_{min});との差で示される。 -ハズレ値の影響を受けやすい #mimetex(){{ R=x_{max}-x_{min} }} **四分位偏差 [#c2bd3404] -四分位偏差は、変動の目安に利用される -ハズレ値や観測数に影響されにくい #pre{{ 四分位偏差=(第3四分位数-第1四分位数)/2 }} **平均偏差 [#w0852639] -平均偏差 &mimetex(\normalsize M_{dev}); は、偏差の絶対値を平均したもの。 #mimetex(){{ M_{dev}=\frac{1}{n} \sum_{i=1}^{n}\left| D_i \right| }} **変異係数 [#k8290ec8] -変異(変動)係数 '''C''' は、標準偏差を平均で割ったもの。 --標準偏差の平均に対する割合を示す(%表示)。 -変異係数は相対的な散布度(無名数で単位はない)。 #mimetex(){{ C = s / \bar{x} }} -2つの系列を比較するとき、次のような場合は、相対的散布度が有利 --双方の単位が同じで、平均がほぼ等しい --双方の単位は同じだが、平均が違う --双方の単位が違う |