TITLE:代表値 *代表値(average) [#b5a2191d] -データの分布などの特徴を示す数値(特性値)を「''代表値''」という。 -データ全体を''ひとつの値で代表''させる値である。 **平均値(mean) [#ja6c6e7f] ***算術平均(arithmetic mean) [#tfe77ec6] -算術平均 &mathtex(\normalsize \bar{x}); は、データをすべて足しあわせ、標本数で割ったもの。 -平均値でもっとも一般的。 #mathtex(){{ \Large \parstyle\begin{eqnarray*} \dpi{200}\scriptsize \parstyle\begin{eqnarray*} e_{ij} &=& n \times \frac{ n_{i \cdot} }{n} \times \frac{ n_{{\cdot} j} }{n} \\ &=& \frac{ n_{i \cdot} n_{{\cdot} j} }{ n } \end{eqnarray*} }} #mathtex(){{ \Large {Mo} = l_m + \frac{ f_{m+1} }{ f{m-1} + f{m} } \times h {Mo} = l_m + \frac{ f_{m+1} }{ f_{m-1} + f_{m} } \times h }} #mathtex(){{ \Large \varepsilon=\sum_{i=1}^{n-1} \frac{1}{\Delta x} \int\limits_{x_i}^{ x_{i+1} } \left\{\frac1{\Delta x}\big[ (x_{i+1}-x)y_i^\ast+(x-x_i)y_{i+1}^\ast\big]-f(x)\right\}^2dx }} ***算術平均(arithmetic mean) [#tfe77ec6] -算術平均 &mimetex(\normalsize \bar{x}); は、データをすべて足しあわせ、標本数で割ったもの。 -平均値でもっとも一般的。 #mimetex(){{ \bar{x} = \frac{ \sum_{i=1}^{n} x_i }{n} }} ***幾何平均(geometric mean) [#s21314c7] -幾何平均 &mimetex(\normalsize Gm); は、各変数の積に対して標本数のべき根を求めたもの。 #mimetex(){{ Gm = \left( \prod_{i=1}^{n}x_i \right)^{1/2} }} -幾何平均の例 --5年間の物価上昇率が7%のとき、1年の平均上昇率は何%か? --過去3年間の売上高の対前年比が120%、110%、130%のとき、平均の売上高の伸びは? ***調和平均(harmonic mean) [#f0f037b0] -調和平均 &mimetex(\normalsize Hm); は、標本数を各変数の逆数の和で割ったもの。 #mimetex(){{ Hm = \frac{ n }{ \sum_{i=1}^n \frac{1}{x_i} } }} -調和平均の例 --山頂まで6kmの道のりを、往きは2km/hで、帰りは6km/hで歩いたとき、平均の速さはいくらか? --車でドライブをして、最初の24kmは30km/h、次の24kmは40km/h、最後の24kmは60km/hで走った時、平均速度はいくらか? **中央値(median) [#wffe6dbf] ***中央値(中位数) [#gabbc456] -中央値 &mimetex(\normalsize Me); は、データを大きさの順に並べたときに、中央にくる値のことである。 --データ数が奇数のときは中央にくるデータの値になる。 --データ数が偶数のときは中央にある2つのデータの平均の値になる。 #mimetex(){{ Me = \left{ x_m\text{ if $n$ odd, $m=(n+1)/2$ } \\\frac{ x_m + x_{m+1} }{2} \text{ if $n$ even, $m=n/2$ }\right. }} -度数分布表がある場合は、階級や度数などから中央値を求めることもできる。 #mimetex(){{ Me = l_m + \left( \frac{n}{2} - F \right) \frac{h}{f_m} }} --&mimetex(\normalsize n); …標本数 --&mimetex(\normalsize h); …階級幅 --&mimetex(\normalsize l_m); …'''m'''番目の階級の下限値 --&mimetex(\normalsize f_m); …'''m'''組目の階級の度数 --&mimetex(\normalsize F); …'''m-1'''番目までの累積度数 ***四分位数(quartile) [#p9383ced] -四分位数は、ヒストグラムの面積を1/4ずつに分ける値である。 --中央値は、ヒストグラムの面積を半分に分ける値。 -小さいほうから、第1、第2、第3四分位数という。 --中央値は、第2四分位数になる。 ***百分位数(percentile) [#xdd8fe38] -百分位数(パーセンタイル値)は、ヒストグラムの面積を1/100ずつに分ける値である。 --25パーセンタイル値は第1四分位数である。 --50パーセンタイル値は中央値(で第2四分位数でもある)。 -度数分布表がある場合は、階級や度数などからパーセンタイル値'''p'''を求めることもできる。 #mimetex(){{ p = l_m + \left( \frac{n \times p}{100} - F \right) \frac{h}{f_m} }} --&mimetex(\normalsize n); …標本数 --&mimetex(\normalsize h); …階級幅 --&mimetex(\normalsize l_m); …'''m'''番目の階級の下限値 --&mimetex(\normalsize f_m); …'''m'''組目の階級の度数 --&mimetex(\normalsize F); …'''m-1'''番目までの累積度数 **最頻値(mode) [#n7cf0b15] -最頻値 &mimetex(\normalsize Mo); は、データのなかで''最も多く出てくる値''のことである。 --度数分布表がある場合は、もっとも度数の多い階級値を最頻値とする。 -元のデータから最頻値を求める場合は、度数分布表から最頻値を求めることができる。 #mimetex(){{ Mo = l_m + \frac{ f_{m+1} }{ f{m-1} + f{m} } \times h }} --&mimetex(\normalsize m); …最大度数の階級 --&mimetex(\normalsize h); …階級幅 --&mimetex(\normalsize l_m); …'''m'''番目の階級の下限値 --&mimetex(\normalsize f_m); …'''m'''組目の階級の度数 **代表値の特性 [#j2b6463c] -平均値はすべてのデータを反映している。 --ハズレ値(極端に飛び離れたデータ)があるとその影響を受けやすいため、ハズレ値の考慮が必要。 -中央値(四分位数や百分位数も)は分布上の位置(中央など)を示す。 --ハズレ値の影響を受けにくく、分布に偏りがある場合に優れている。 -最頻値は、「データの多くはこのあたりにある」という説明をするのにわかりやすい。 --ハズレ値の影響を受けにくい。 |