TITLE:回帰 *回帰 (regression) [#o7f971ab] **回帰直線 (regression line) [#ref46612] ***回帰直線 [#r027a082] -散布図の各点 &mimetex(\normalsize (x_i, y_i)); が近くに分布するような直線を回帰直線という。 #mimetex(){{ y = ax + b }} --回帰係数(回帰直線の傾き):&mimetex(\normalsize a); --回帰直線のy切片('''x'''=0 のときのyの値):&mimetex(\normalsize b); --独立変数(または説明変数):&mimetex(\normalsize x); --従属変数(または基準変数):&mimetex(\normalsize y); -なお、回帰式は必ず &mimetex(\normalsize (\bar{x}, \bar{y})); を通る ***最小二乗法 [#ve4df718] -観測値(または実測値) &mimetex(\normalsize y_i); と 推定値(または予測値) &mimetex(\normalsize \hat{y}); との差(残差 &mimetex(\normalsize e); )の二乗が最小になるような &mimetex(\normalsize a); と &mimetex(\normalsize b); を求める。 --次の値が最小となるような、'''a'''と'''b'''を求める。 #mimetex(){{ \sum_{i=1}^n (y_i - \hat{y}_i)^2 }} --&mimetex(\normalsize e^2); を足したものを、残差平方和 &mimetex(\normalsize S_e); という #mimetex(){{ S_e = \sum e^2 = \sum_{i=1}^n (y_i - \hat{y}_i)^2 }} **回帰式の計算 [#vc65a5ea] &mimetex(\normalsize x); を独立変数(横軸)、 &mimetex(\normalsize y); を従属変数(縦軸)としたときの回帰式は次のようになる。 #mimetex(){{ y = r \cdot \frac{s_y}{s_x} x + \left( \bar{y} - \frac{s_{xy} }{s_x^2} \cdot \bar{x} \right) }} なお、 #mimetex(){{ \begin{eqnarray} a &=& r \cdot \frac{s_y}{s_x} \\ b &=& \bar{y} - \frac{s_{xy} }{s_x^2} \cdot \bar{x} = \bar{y} - \bar{x} a \end{eqnarray} }} --相関係数: &mimetex(\normalsize r); --2変数の標準偏差: &mimetex(\normalsize s_x); , &mimetex(\normalsize s_y); --2変数の共分散(偏差積和の平均) #mimetex(){{ s_{xy} = \frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})(y_i - \bar{y}) }} 回帰式を変形すると、次のようになる。 #mimetex(){{ y - \bar{y} = \frac{s_{xy} }{s_x^2} (x - \bar{x}) }} --2変数の平均値: &mimetex(\normalsize \bar{x}); , &mimetex(\normalsize \bar{y}); **標準誤差 [#a7ccecca] -予測値と実測値のずれ(予測値の誤差)の標準偏差を、標準誤差という #mimetex(){{ \sqrt{ \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y})^2 } \\ }} **決定係数 [#r5cbda2c] -相関係数の二乗を決定係数(または寄与率)という。 --決定係数: &mimetex(\normalsize r^2); -決定係数は、0から1の値をとる。 #mimetex(){{ 0 \leq r^2 \leq 1 }} -推定(回帰式)の精度を表す指標である --従属変数 &mimetex(\normalsize y); の分散の何%を推定値 &mimetex(\normalsize \hat{y}); の分散が説明しているか、を示す --だいたい、0.5以上であれば精度が高いといえる |