[ ホーム | 一覧 | 検索 | 最終更新 | ヘルプ ] [ 新規 ]

健康統計の基礎・健康統計学 - 2011/3rd/Average の変更点

Top > 2011 > 3rd > Average
AND OR
  • 追加された行はこの色です。
  • 削除された行はこの色です。
  • 2011/3rd/Average へ行く。

TITLE:代表値
*代表値(average) [#b5a2191d]
-データの分布などの特徴を示す数値(特性値)を「''代表値''」という。
-データ全体を''ひとつの値で代表''させる値である。

**平均値(mean) [#ja6c6e7f]

***算術平均(arithmetic mean) [#tfe77ec6]
-算術平均 &mimetex(\normalsize \bar{x}); は、データをすべて足しあわせ、データ数で割ったもの。
-平均値のなかで、もっとも一般的なもの。
#mimetex(){{
\begin{eqnarray}
\bar{x} &=& \frac{1}{n} \hspace{5} (x_1 + x_2 + \cdots + x_n) \\
 &=& \frac{1}{n} \sum_{i=1}^{n} x_i
\end{eqnarray}
}}

***幾何平均(geometric mean) [#s21314c7]
-幾何平均 &mimetex(\normalsize Gm); は、各データの値の積に対してデータ数のべき根を求めたもの。
#mimetex(){{
\begin{eqnarray}
Gm &=& \sqrt[n]{ x_1 \times x_2 \times \cdots \times x_n } \\
 &=& \left( x_1 \times x_2 \times \cdots \times x_n \right)^{1/n} \\
 &=& \left( \prod_{i=1}^{n}x_i \right)^{1/n}
\end{eqnarray}
}}
-幾何平均の例
--5年間の物価上昇率が7%のとき、1年の平均上昇率は何%か?
--過去3年間の売上高の対前年比が120%、110%、130%のとき、平均の売上高の伸びは?

***調和平均(harmonic mean) [#f0f037b0]
-調和平均 &mimetex(\normalsize Hm); は、データ数を各データの値の逆数の和で割ったもの。
#mimetex(){{
\begin{eqnarray}
Hm &=& \frac{ n }{ \frac{1}{x_1} + \frac{1}{x_2} + \cdots + \frac{1}{x_n} } \\
 &=& \frac{ n }{ \sum_{i=1}^n \frac{1}{x_i} }
\end{eqnarray}
}}
-調和平均の例
--山頂まで6kmの道のりを、往きは2km/hで、帰りは6km/hで歩いたとき、平均の速さはいくらか?
--車でドライブをして、最初の24kmは30km/h、次の24kmは40km/h、最後の24kmは60km/hで走った時、平均速度はいくらか?



**中央値(median) [#wffe6dbf]

***中央値(中位数) [#gabbc456]
-中央値 &mimetex(\normalsize Me); は、データを大きさの順に並べたときに、中央にくる値のことである。
--データ数が奇数のときは中央にくるデータの値になる。
--データ数が偶数のときは中央にある2つのデータの平均の値になる。
#mimetex(){{
Me = \left{ x_m\text{    if $n$ odd, $m=(n+1)/2$ } \\\frac{ x_m + x_{m+1} }{2} \text{  if $n$ even, $m=n/2$ }\right.
Me = \left{ x_m\text{    if $n$ is odd, $m=(n+1)/2$ } \\\frac{ x_m + x_{m+1} }{2} \text{  if $n$ is even, $m=n/2$ }\right.
}}

-中央に位置するデータが複数個ある場合(「結び(tie)」があるという)、次のような式で中央値を求めることができる。
#mimetex(){{
Me = \frac{1}{ 2 n_M } ( n_{ x > M } \hspace{5} - \hspace{5} n_{ x < M } ) + M
}}
--中央にあるデータ : &mimetex(M);
--値 &mimetex(M); になるデータの個数 : &mimetex(n_M);
--値 &mimetex(M); より小さいデータの個数 : &mimetex( n_{ x < M });
--値 &mimetex(M); より大きいデータの個数 : &mimetex( n_{ x > M });


-度数分布表がある場合は、階級や度数などの情報から、中央値を求めることもできる。
#mimetex(){{
Me = l_m + \left( \frac{n}{2} - F \right) \frac{h}{f_m}
}}
--標本数 : &mimetex(\normalsize n);
--階級幅 : &mimetex(\normalsize h); 
-- m 番目の階級の下限 : &mimetex(\normalsize l_m);
-- m 番目の階級の度数 : &mimetex(\normalsize f_m);
-- m-1 番目までの累積度数 : &mimetex(\normalsize F);


***四分位数(quartile) [#p9383ced]
-ヒストグラムから考えると、四分位数はヒストグラムの面積を1/4ずつに分ける値である。
--中央値は、ヒストグラムの面積を半分に分ける値になる。
-データを大きさの順に並べた場合は、データの個数を4分の1ずつの部分にわける個所である。
-小さいほうから、第1、第2、第3四分位数といい、中央値は、第2四分位数になる。
-データが &mimetex(\normalsize n); 個のあるときの第1四分位数 &mimetex(\normalsize Q_1); と第3四分位数 &mimetex(\normalsize Q_3); は、次のようにして求められる。
--&mimetex(\normalsize n = 4k+1, \hspace{5} 2, \hspace{5} 3); の場合
#mimetex(){{
\begin{eqnarray}
Q_1 &=& x_{ k+1 } \\
Q_3 &=& x_{ n-k }
\end{eqnarray}
}}
--&mimetex(\normalsize n = 4k); の場合
#mimetex(){{
\begin{eqnarray}
Q_1 &=& (x_k + x_{ k+1 }) / 2 \\
Q_3 &=& (x_{ n-k } + x_{ n-k+1 } ) / 2
\end{eqnarray}
}}

***百分位数(percentile) [#xdd8fe38]
-百分位数(パーセンタイル値)は、ヒストグラムの面積を1/100ずつに分ける値である。
--25パーセンタイル値は第1四分位数である。
--50パーセンタイル値は中央値(第2四分位数でもある)。
-度数分布表がある場合は、階級や度数などからパーセンタイル値 &mimetex(\normalsize p); を求めることもできる。
#mimetex(){{
p = l_m + \left( \frac{n \times p}{100} - F \right) \frac{h}{f_m}
}}
--標本数 : &mimetex(\normalsize n);
--階級幅 : &mimetex(\normalsize h); 
-- m 番目の階級の下限 : &mimetex(\normalsize l_m);
-- m 番目の階級の度数 : &mimetex(\normalsize f_m);
-- m-1 番目までの累積度数 : &mimetex(\normalsize F);


**最頻値(mode) [#n7cf0b15]
-最頻値 &mimetex(\normalsize Mo); は、データのなかで''最も多く出てくる値''のことである。
--度数分布表がある場合は、もっとも度数の多い階級値を最頻値として、次の式から最頻値を求めることができる。
#mimetex(){{
Mo = l_m + \frac{ f_{m+1} }{ f{m-1} + f{m+1} } \times h
}}
---最大度数の階級 : &mimetex(\normalsize m); 
---階級幅 : &mimetex(\normalsize h); 
--- m 番目の階級の下限 : &mimetex(\normalsize l_m);
--- m 番目の階級の度数 : &mimetex(\normalsize f_m);

-分布が釣り鐘形の場合は、ピアソン(Pearson)の式を用いることができる。
#mimetex(){{
Mo = \bar{x} - 3 \times (\bar{x} - Me)
}}

**代表値の特性 [#j2b6463c]
-平均値はすべてのデータを反映している。
--ハズレ値(極端に小さく・大きくて飛び離れたデータ)があるとその影響を受けやすいため、ハズレ値の考慮が必要。
-中央値(四分位数や百分位数も)は分布上の位置(中央など)を示す。
--ハズレ値の影響を受けにくく、分布に偏りがある場合に優れている。
-最頻値は、「データの多くはこのあたりにある」という説明をするのにわかりやすい。
--ハズレ値の影響を受けにくい。

メニュー

  • トップページ
  • 参考書籍

授業内容

  • 第1回
  • 第2回
  • 第3回
  • 第4回

ケータイで教員にメール

mkawano%40ed.hyogo-dai.ac.jp

今日の5件
  • FrontPage(70)
  • 2011/6th/Excel2(62)
  • 2015/5th/Excel2(31)
  • 2010/4th/Excel2(6)
  • 2012/3rd/Excel(4)
最新の10件
2025-05-26
  • 2025/BHS/7th/exercise
  • 2025/BHS/7th/1st
  • 2025/BHS/7th
  • 2025/BHS
2025-05-19
  • 2025/BHS/6th/1st
2025-05-12
  • 2025/BHS/5th/exercise
  • 2025/BHS/6th/exercise
  • 2025/BHS/6th
2025-04-28
  • 2025/BHS/4th/1st
  • 2025/BHS/5th/Mathematical_Basic_Knowledge

total: 1392
today: 2
yesterday: 2
now: 3

リロード   差分   ホーム 一覧 検索 最終更新 バックアップ リンク元   ヘルプ   最終更新のRSS
http%3A%2F%2Fhs-www.hyogo-dai.ac.jp%2F~kawano%2FHStat%2F%3F2011%25252F3rd%25252FAverage
Founded by Minoru Kawano.
Powered by PukiWiki Plus! 1.4.7plus-u2-i18n. HTML convert time to 0.105 sec.
Valid XHTML 1.1