Top > 2009 > 3rd > Dispersion
AND OR

散布度(dispersion)

  • 代表値のほかに、重要な特性値として「散布度」がある。
  • 平均値にたいして、どれくらいデータが散らばっているかを示す。
    • 分布の裾の広がり具合、集中の度合い

標準偏差

偏差

  • 偏差 D (または d) は、各データと平均との差。
    • +の偏差と−の偏差があるため、偏差の合計は0になる。
      D=\bar{x} - x_i

分散(variance)と標準偏差(standard deviation)

  • 分散\normalsize s^2(または\normalsize \delta^2)は、偏差平方和(偏差の二乗の和)をとって、その平均を求めたもの。
    • 全データの平均からのバラツキの程度を示す。
      s^2=\frac{\sum_{i=1}^n \left( \bar{x}-x_i \right)^2}{n}
  • 標準偏差\normalsize sは、分散の平方根を求めたもの
    • 全データの平均からのバラツキの程度を示す(単位はデータと同じ)。
    • 標準偏差は、代表的な散布度である。
      s=\sqrt{ \frac{\sum_{i=1}^n \left( \bar{x}-x_i \right)^2}{n} }
  • 母集団(対象となる全体)の分散や標準偏差を求める場合は、上の式を用いる。

不偏分散と不偏標準偏差

  • 不偏分散\normalsize U^2は、偏差平方和(偏差の二乗の和)をとって、その平均を求めたもの。
  • 分母は、「標本数-1」となる。
    • 全データの平均からのバラツキの程度を示す。
      U^2=\frac{\sum_{i=1}^n \left( \bar{x}-x_i \right)^2}{n-1}
  • 不偏標準偏差\normalsize Uは、分散の平方根を求めたもの
    • 全データの平均からのバラツキの程度を示す(単位はデータと同じ)。
    • 標準偏差は、代表的な散布度である。
      U=\sqrt{ \frac{\sum_{i=1}^n \left( \bar{x}-x_i \right)^2}{n-1} }
  • 母集団(対象となる全体)ではなく、標本(対象の一部)の分散や標準偏差を求める場合は、上の式を用いる。

標準偏差の和

n組の資料があるとき、資料全体の標準偏差は次のようになる。

s_{T}=\left( \frac{\sum_{i=1}^{n}N_{i}\left(\ V_{i}+D_{i}^2 \right)}{\sum_{i=1}^{n}N_i} \right)^{1/2}
  • \normalsize s_{T} …全体の標準偏差
  • \normalsize N_ii組目の資料の標本数
  • \normalsize V_ii組目の資料の分散
  • \normalsize D_ii組目の資料の偏差

範囲

  • 範囲 R は、最大値\normalsize x_{max}と最小値\normalsize x_{min}との差で示される。
  • ハズレ値の影響を受けやすい
R=x_{max}-x_{min}

四分位偏差

  • 四分位偏差は、変動の目安に利用される
  • ハズレ値や観測数に影響されにくい
 四分位偏差=(第3四分位数-第1四分位数)/2

平均偏差

  • 平均偏差 \normalsize M_{dev} は、偏差の絶対値を平均したもの。
M_{dev}=\frac{1}{n} \sum_{i=1}^{n}\left| D_i \right|

変異係数

  • 変異(変動)係数 C は、標準偏差を平均で割ったもの。
    • 標準偏差の平均に対する割合を示す(%表示)。
  • 変異係数は相対的な散布度(無名数で単位はない)。
C = s / \bar{x}
  • 2つの系列を比較するとき、次のような場合は、相対的散布度が有利
    • 双方の単位が同じで、平均がほぼ等しい
    • 双方の単位は同じだが、平均が違う
    • 双方の単位が違う

リロード   差分   ホーム 一覧 検索 最終更新 バックアップ リンク元   ヘルプ   最終更新のRSS
Last-modified: Tue, 11 Mar 2014 19:49:35 JST (3692d)