[ ホーム | 一覧 | 検索 | 最終更新 | ヘルプ ] [ 新規 ]

健康統計の基礎・健康統計学 - 2009/4th/Regression のバックアップ(No.5)

AND OR
  • バックアップ一覧
  • 差分 を表示
  • 現在との差分 を表示
  • 現在との差分 - Visual を表示
  • ソース を表示
  • 2009/4th/Regression へ行く。
    • 1 (2009-04-23 (木) 13:12:11)
    • 2 (2009-04-29 (水) 03:46:35)
    • 3 (2009-04-29 (水) 04:48:39)
    • 4 (2009-04-29 (水) 06:24:56)
    • 5 (2009-05-01 (金) 02:24:14)
    • 6 (2009-05-01 (金) 04:52:55)
    • 7 (2009-05-01 (金) 06:29:21)

回帰 (regression)

▲ ▼

回帰直線 (regression line)

▲ ▼

回帰直線

  • 散布図の各点 \normalsize (x_i, y_i) が近くに分布するような直線を回帰直線という。
    y = ax + b
    • 回帰係数(回帰直線の傾き):\normalsize a
    • 回帰直線のy切片(x=0 のときのyの値):\normalsize b
    • 独立変数(説明変数:予測に使う変数):\normalsize x
    • 従属変数(目的変数、基準変数:予測したい変数):\normalsize y
  • なお、回帰式は必ず \normalsize (\bar{x}, \bar{y}) を通る
▲ ▼

最小二乗法

  • 観測値(または実測値) \normalsize y_i と 推定値(または予測値) \normalsize \hat{y} との差(残差 \normalsize e )の二乗が最小になるような \normalsize a と \normalsize b を求める。
    • 次の値が最小となるような、aとbを求める。
      \sum_{i=1}^n (y_i - \hat{y}_i)^2
    • \normalsize e^2 を足したものを、残差平方和 \normalsize S_e という
      S_e = \sum e^2 = \sum_{i=1}^n (y_i - \hat{y}_i)^2
▲ ▼

回帰式の計算

  • \normalsize x を独立変数(横軸)、 \normalsize y を従属変数(縦軸)としたときの回帰式( \normalsize y への \normalsize x からの回帰式)は次のようになる。
    y = r \cdot \frac{s_y}{s_x} x + \left( \bar{y} - \frac{s_{xy} }{ {s_x}^2 } \cdot \bar{x} \right)
    • なお、
      \begin{eqnarray}a &=& r \cdot \frac{s_y}{s_x} \\b &=& \bar{y} - \frac{s_{xy} }{ {s_x}^2 } \cdot \bar{x} = \bar{y} - \bar{x} a\end{eqnarray}
    • 相関係数: \normalsize r
    • 2変数の標準偏差: \normalsize s_x , \normalsize s_y
    • 2変数の共分散(偏差積和の平均)
      s_{xy} = \frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})(y_i - \bar{y})
  • 回帰式を変形すると、次のようになる。
    \begin{eqnarray}y - \bar{y} &=& \frac{s_{xy} }{ {s_x}^2 } (x - \bar{x}) \\&=& \frac{ S_{xy} }{ S_{xx} } (x - \bar{x})\end{eqnarray}
    • 2変数の平均値: \normalsize \bar{x} , \normalsize \bar{y}
    • 2変数の偏差積和:\normalsize S_{xy}
      \normalsize\displaystyle S_{xy} = \sum_{i=1}^n d_x \cdot d_y = \sum_{i=1}^n (x_i - \bar{x}) (y_i - \bar{y})
    • 偏差平方和:\normalsize S_{xx}
      S_{xx} = \sum_{i=1}^n {d_x}^2 = \sum_{i=1}^n (x_i - \bar{x})^2
▲ ▼

標準誤差

  • 予測値と実測値のずれ(予測値の誤差)の標準偏差を、標準誤差という
    \sqrt{ \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y})^2 } \\
▲ ▼

決定係数

  • 相関係数の二乗を決定係数(または寄与率)という。
    • 決定係数: \normalsize r^2
  • 決定係数は、0から1の値をとる。
    0 \leq r^2 \leq 1
  • 推定(回帰式)の精度を表す指標である
    • 従属変数 \normalsize y の分散の何%を推定値 \normalsize \hat{y} の分散が説明しているか、を示す
    • だいたい、0.5以上であれば精度が高いといえる

メニュー

  • トップページ
  • 参考書籍

授業内容

  • 第1回
  • 第2回
  • 第3回
  • 第4回

ケータイで教員にメール

mkawano%40ed.hyogo-dai.ac.jp

今日の5件
  • 2011/6th/Excel2(45)
  • 2015/5th/Excel2(32)
  • FrontPage(10)
  • 2015/2nd/Histogram_by_Excel(4)
  • 2014/5th/Excel2(3)
最新の10件
2025-06-02
  • 2025/BHS/8th/1st
  • 2025/BHS/8th/exercise
  • 2025/BHS/8th
  • 2025/BHS
2025-05-26
  • 2025/BHS/7th/exercise
  • 2025/BHS/7th/1st
  • 2025/BHS/7th
2025-05-19
  • 2025/BHS/6th/1st
2025-05-12
  • 2025/BHS/5th/exercise
  • 2025/BHS/6th/exercise

total: 1162
today: 1
yesterday: 2
now: 5

リロード   差分   ホーム 一覧 検索 最終更新 バックアップ リンク元   ヘルプ   最終更新のRSS
http%3A%2F%2Fhs-www.hyogo-dai.ac.jp%2F~kawano%2FHStat%2F%3F2009%25252F4th%25252FRegression
Founded by Minoru Kawano.
Powered by PukiWiki Plus! 1.4.7plus-u2-i18n. HTML convert time to 0.121 sec.
Valid XHTML 1.1