[ ホーム | 一覧 | 検索 | 最終更新 | ヘルプ ] [ 新規 ]

健康統計の基礎・健康統計学 - 2011/3rd/Dispersion のバックアップ(No.3)

AND OR
  • バックアップ一覧
  • 差分 を表示
  • 現在との差分 を表示
  • 現在との差分 - Visual を表示
  • ソース を表示
  • 2011/3rd/Dispersion へ行く。
    • 1 (2011-04-16 (土) 02:19:18)
    • 2 (2011-04-27 (水) 20:11:54)
    • 3 (2011-05-11 (水) 21:11:17)

散布度(dispersion)

  • 代表値のほかに、重要な特性値として「散布度」がある。
  • 平均値に対して、どれくらいデータが散らばっているかを示す。
    • 分布の裾の広がり具合
    • 平均値への集中の度合い
▲ ▼

標準偏差

▲ ▼

偏差(diviation)

  • 偏差 \normalsize d は、各データと平均との差である。
    • +の偏差と−の偏差があるため、すべての偏差の合計は0になる。
      d_i = \bar{x} - x_i
▲ ▼

分散(variance)と標準偏差(standard deviation)

分析対象となる全体(母集団)の分布のバラつきの度合い求める場合には、 代表的な散布度である、分散と標準偏差を用いる。

  • 分散 \normalsize s^2(または \normalsize \sigma^2)は、偏差平方和(偏差の二乗の和)をとって、その平均を求めたものである。
    • 全データの平均からのバラツキの程度を示す。
      \begin{eqnarray}s^2 &=& \frac{1}{n} \sum_{i=1}^n \left( \bar{x}-x_i \right)^2  \\ &=& \frac{1}{n} \sum_{i=1}^n {d_i}^2\end{eqnarray}
  • 標準偏差 \normalsize s は、分散の平方根を求めたものである。
    • 全データの平均からのバラツキの程度を示す(単位はデータと同じ)。
      s = \sqrt{ \frac{\sum_{i=1}^n \left( \bar{x}-x_i \right)^2}{n} }
  • 標準偏差や分散の値が大きい場合はデータのバラつきが大きく、小さい場合はバラつきが小さい(データが同じ程度に揃ってる)
▲ ▼

不偏分散(unbiased variance)と不偏標準偏差(unbiased standard diviation)

分析対象となる全体(母集団)ではなく、 対象の一部分(標本)の分布のバラつきの度合いを求める場合には、 不偏分散と不偏標準偏差を用いる。

  • 不偏分散 \normalsize U^2 は、偏差平方和(偏差の二乗の和)をとって、その平均を求めたものである。
    • 分散との違いは、分母は「標本数-1」であること。
    • データ全体についての平均値からのバラツキの程度を示す。
      U^2 = \frac{1}{n-1} \sum_{i=1}^n \left( \bar{x}-x_i \right)^2
  • 不偏標準偏差\normalsize Uは、分散の平方根を求めたもの
    • 全データの平均からのバラツキの程度を示す(単位はデータと同じ)。
      U = \sqrt{ \frac{\sum_{i=1}^n \left( \bar{x}-x_i \right)^2}{n-1} }
▲ ▼

標準偏差の和

n 組の資料(データ)があるとき、 資料全体の標準偏差は次のようになる。

s_{T}=\sqrt{ \frac{\sum_{i=1}^{n}N_{i}\left(\ V_{i}+D_{i}^2 \right)}{\sum_{i=1}^{n}N_i} }
  • \normalsize s_{T} …全体の標準偏差
  • \normalsize N_i …i組目の資料の標本数
  • \normalsize V_i …i組目の資料の分散
  • \normalsize D_i …i組目の資料の偏差
▲ ▼

範囲(range)

  • 範囲 R は、データの最大値 \normalsize x_{max} と最小値 \normalsize x_{min} との差で、データ全体の範囲を示す。
  • ハズレ値の影響を受けやすい
    R = x_{max} - x_{min}
▲ ▼

四分位偏差(quartile deviation)

  • 四分位偏差はデータの変動の目安に利用される散布度で、代表値として中央値を用いたときに使われることがある。
  • ハズレ値やデータ数に影響されにくい値である。
     四分位偏差=(第3四分位数-第1四分位数)/2
    
▲ ▼

平均偏差(mean deviation)

  • 平均偏差 \normalsize M_{dev} は、偏差の絶対値を平均したもので、データと平均値とのずれの程度を示す。
    \begin{eqnarray}M_{dev} &=& \frac{1}{n} \sum_{i=1}^{n} \left| x_i - \bar{x} \right| \\ &=& \frac{1}{n} \sum_{i=1}^{n} \left| D_i \right|\end{eqnarray}
▲ ▼

変異係数(coefficient of variance)

  • 変異係数(変動係数) Cv は、標準偏差を平均で割ったもので、平均値に対する標準偏差の割合を示す(%表示)。
  • 変異係数は相対的な散布度(割合を示す無名数で単位はない)で、平均値や標準偏差の異なる複数の種類のデータを比較するときに用いる。
    Cv = s / \bar{x}
  • 2つの系列(データの集まり)を比較するとき、次のような場合は相対的散布度が有利になる。
    • 双方の単位が同じで、平均がほぼ等しい
    • 双方の単位は同じだが、平均が違う
    • 双方の単位が違う

メニュー

  • トップページ
  • 参考書籍

授業内容

  • 第1回
  • 第2回
  • 第3回
  • 第4回

ケータイで教員にメール

mkawano%40ed.hyogo-dai.ac.jp

今日の5件
  • 2011/6th/Excel2(35)
  • 2015/5th/Excel2(30)
  • FrontPage(9)
  • 2025/BHS/8th(3)
  • 2015/2nd/Histogram_by_Excel(3)
最新の10件
2025-06-02
  • 2025/BHS/8th/1st
  • 2025/BHS/8th/exercise
  • 2025/BHS/8th
  • 2025/BHS
2025-05-26
  • 2025/BHS/7th/exercise
  • 2025/BHS/7th/1st
  • 2025/BHS/7th
2025-05-19
  • 2025/BHS/6th/1st
2025-05-12
  • 2025/BHS/5th/exercise
  • 2025/BHS/6th/exercise

total: 4441
today: 1
yesterday: 0
now: 10

リロード   差分   ホーム 一覧 検索 最終更新 バックアップ リンク元   ヘルプ   最終更新のRSS
http%3A%2F%2Fhs-www.hyogo-dai.ac.jp%2F~kawano%2FHStat%2F%3F2011%25252F3rd%25252FDispersion
Founded by Minoru Kawano.
Powered by PukiWiki Plus! 1.4.7plus-u2-i18n. HTML convert time to 0.125 sec.
Valid XHTML 1.1