2009/3rd/代表値のバックアップ差分(No.4) - 健康統計の基礎・健康統計学

バックアップ一覧
現在との差分を表示
現在との差分 - Visual を表示
ソースを表示
バックアップを表示
2009/3rd/代表値へ行く。
- 1 (2010-03-17 (水) 09:17:07)
- 2 (2010-03-17 (水) 13:07:17)
- 3 (2010-03-17 (水) 14:24:01)
- 4 (2010-03-20 (土) 12:01:15)
- 5 (2010-03-20 (土) 13:45:28)

追加された行はこの色です。
削除された行はこの色です。

TITLE:代表値
*代表値（average） [#b5a2191d]
-データの分布などの特徴を示す数値（特性値）を「''代表値''」という。
-データ全体を''ひとつの値で代表''させる値である。

**平均値（mean） [#ja6c6e7f]

***算術平均（arithmetic mean） [#tfe77ec6]
-算術平均 &mathtex(\normalsize \bar{x}); は、データをすべて足しあわせ、標本数で割ったもの。
-平均値でもっとも一般的。
#mathtex(){{
\Large \parstyle\begin{eqnarray*}
\dpi{200}\scriptsize \parstyle\begin{eqnarray*}
 e_{ij} &=& n \times \frac{ n_{i \cdot} }{n} \times \frac{ n_{{\cdot} j} }{n} \\
 &=& \frac{ n_{i \cdot} n_{{\cdot} j} }{ n }
 \end{eqnarray*}
}}

#mathtex(){{
\Large
{Mo} = l_m + \frac{ f_{m+1} }{ f{m-1} + f{m} } \times h
{Mo} = l_m + \frac{ f_{m+1} }{ f_{m-1} + f_{m} } \times h
}}

#mathtex(){{
\Large \varepsilon=\sum_{i=1}^{n-1} \frac{1}{\Delta x} \int\limits_{x_i}^{ x_{i+1} } \left\{\frac1{\Delta x}\big[    (x_{i+1}-x)y_i^\ast+(x-x_i)y_{i+1}^\ast\big]-f(x)\right\}^2dx
}}

***算術平均（arithmetic mean） [#tfe77ec6]
-算術平均 &mimetex(\normalsize \bar{x}); は、データをすべて足しあわせ、標本数で割ったもの。
-平均値でもっとも一般的。
#mimetex(){{
\bar{x} = \frac{ \sum_{i=1}^{n} x_i }{n}
}}

***幾何平均（geometric mean） [#s21314c7]
-幾何平均 &mimetex(\normalsize Gm); は、各変数の積に対して標本数のべき根を求めたもの。
#mimetex(){{
Gm = \left( \prod_{i=1}^{n}x_i \right)^{1/2}
}}
-幾何平均の例
--5年間の物価上昇率が7％のとき、1年の平均上昇率は何％か？
--過去3年間の売上高の対前年比が120%、110%、130%のとき、平均の売上高の伸びは？

***調和平均（harmonic mean） [#f0f037b0]
-調和平均 &mimetex(\normalsize Hm); は、標本数を各変数の逆数の和で割ったもの。
#mimetex(){{
Hm = \frac{ n }{ \sum_{i=1}^n \frac{1}{x_i} }
}}
-調和平均の例
--山頂まで6kmの道のりを、往きは2km/hで、帰りは6km/hで歩いたとき、平均の速さはいくらか？
--車でドライブをして、最初の24kmは30km/h、次の24kmは40km/h、最後の24kmは60km/hで走った時、平均速度はいくらか？



**中央値（median） [#wffe6dbf]

***中央値（中位数） [#gabbc456]
-中央値 &mimetex(\normalsize Me); は、データを大きさの順に並べたときに、中央にくる値のことである。
--データ数が奇数のときは中央にくるデータの値になる。
--データ数が偶数のときは中央にある2つのデータの平均の値になる。
#mimetex(){{
Me = \left{ x_m\text{    if $n$ odd, $m=(n+1)/2$ } \\\frac{ x_m + x_{m+1} }{2} \text{  if $n$ even, $m=n/2$ }\right.
}}

-度数分布表がある場合は、階級や度数などから中央値を求めることもできる。
#mimetex(){{
Me = l_m + \left( \frac{n}{2} - F \right) \frac{h}{f_m}
}}
--&mimetex(\normalsize n); …標本数
--&mimetex(\normalsize h); …階級幅
--&mimetex(\normalsize l_m); …'''m'''番目の階級の下限値
--&mimetex(\normalsize f_m); …'''m'''組目の階級の度数
--&mimetex(\normalsize F); …'''m-1'''番目までの累積度数


***四分位数（quartile） [#p9383ced]
-四分位数は、ヒストグラムの面積を1/4ずつに分ける値である。
--中央値は、ヒストグラムの面積を半分に分ける値。
-小さいほうから、第1、第2、第3四分位数という。
--中央値は、第2四分位数になる。

***百分位数（percentile） [#xdd8fe38]
-百分位数（パーセンタイル値）は、ヒストグラムの面積を1/100ずつに分ける値である。
--25パーセンタイル値は第1四分位数である。
--50パーセンタイル値は中央値（で第2四分位数でもある）。
-度数分布表がある場合は、階級や度数などからパーセンタイル値'''p'''を求めることもできる。
#mimetex(){{
p = l_m + \left( \frac{n \times p}{100} - F \right) \frac{h}{f_m}
}}
--&mimetex(\normalsize n); …標本数
--&mimetex(\normalsize h); …階級幅
--&mimetex(\normalsize l_m); …'''m'''番目の階級の下限値
--&mimetex(\normalsize f_m); …'''m'''組目の階級の度数
--&mimetex(\normalsize F); …'''m-1'''番目までの累積度数


**最頻値（mode） [#n7cf0b15]
-最頻値 &mimetex(\normalsize Mo); は、データのなかで''最も多く出てくる値''のことである。
--度数分布表がある場合は、もっとも度数の多い階級値を最頻値とする。
-元のデータから最頻値を求める場合は、度数分布表から最頻値を求めることができる。
#mimetex(){{
Mo = l_m + \frac{ f_{m+1} }{ f{m-1} + f{m} } \times h
}}
--&mimetex(\normalsize m); …最大度数の階級
--&mimetex(\normalsize h); …階級幅
--&mimetex(\normalsize l_m); …'''m'''番目の階級の下限値
--&mimetex(\normalsize f_m); …'''m'''組目の階級の度数

**代表値の特性 [#j2b6463c]
-平均値はすべてのデータを反映している。
--ハズレ値（極端に飛び離れたデータ）があるとその影響を受けやすいため、ハズレ値の考慮が必要。
-中央値（四分位数や百分位数も）は分布上の位置（中央など）を示す。
--ハズレ値の影響を受けにくく、分布に偏りがある場合に優れている。
-最頻値は、「データの多くはこのあたりにある」という説明をするのにわかりやすい。
--ハズレ値の影響を受けにくい。

メニュー

授業内容

ケータイで教員にメール

健康統計の基礎・健康統計学 - 2009/3rd/代表値のバックアップ差分(No.4)

メニュー

授業内容

ケータイで教員にメール

今日の5件

最新の10件

健康統計の基礎・健康統計学 - 2009/3rd/代表値 のバックアップ差分(No.4)

メニュー

授業内容

ケータイで教員にメール

今日の5件

最新の10件

健康統計の基礎・健康統計学 - 2009/3rd/代表値のバックアップ差分(No.4)