[ ホーム | 一覧 | 検索 | 最終更新 | ヘルプ ] [ 新規 ]

健康統計の基礎・健康統計学 - 2012/2nd/Frequency_Distribution_Table の変更点

Top > 2012 > 2nd > Frequency_Distribution_Table
AND OR
  • 追加された行はこの色です。
  • 削除された行はこの色です。
  • 2012/2nd/Frequency_Distribution_Table へ行く。

TITLE:資料の整理と度数分布表
*資料の整理と度数分布表 [#j2361e14]

**統計資料の整理 [#r5a39fe5]
記述統計学では、統計資料(データ)をまとめて整理して、
直感的に理解できるように視覚化したり、
特徴を代表的な数値にまとめて、資料の全体像が理解できるようにします。

ここでは、基本的な資料の整理方法である、
度数分布表とヒストグラムについて説明します。


**度数分布表とは [#db4ec9e3]
度数分布表(frequency table)とは、
データを大きさの順に並び変えいくつか区分にまとめた表で、
データ全体の分布(distribution)を把握するために用います。


**度数分布表の作成手順 [#w1fe347f]
+階級数または階級幅を決める
+階級値および有効桁数を考え、階級の境界(どこで区切るか)を決める
+各階級の度数を数える
+階級と度数を元に、度数分布表を作成し、必要に応じて分布の形を見たりする

#ref(2010/2nd/2nd/HS01.png,nolink,度数分布表の例)

**用語 [#oc7a6aa8]
-階級 (class)
--データを区切るときの区間
--各階級でとりうる最大の値を上限、最小の値を下限という
-階級数
--いくつの区間に区切るかの区間の数
--一般には10前後が目安(多すぎても少なすぎてもいけない)
--どのように区切るかは、キリのいい値や経験などを元にする場合があるが、客観的な区切り方を検討する場合はスタージスの方法(後述)などを用いる
-階級幅 (class interval)
--データをいくつ刻みに区切るかの区切る値の幅
-階級値 (class mark)
--各階級の中央の値
 階級値={(階級の上限)+(階級の下限)}/2
-度数 (frequency)
--各階級に含まれるデータの数(階級ごとの頻度)
-累積度数 (cumulative frequency)
--階級値の小さい(または大きい)ほうから、ある階級までの度数を合計した値
--最後の階級での累積度数は度数の合計になる
-相対度数 (relative frequency)
--度数の合計に対する各階級の度数の比(全体を 100%=1 または 100 とする)
 相対度数=(その階級の度数)/(全体の度数)
  または
 相対度数=(その階級の度数)/(全体の度数)×100
-累積相対度数 (relative cumulative frequency)
--階級値の小さい(または大きい)ほうから、ある階級までの相対度数を合計した値
--つまり、ある階級までの度数の合計が全体の何%かを示す
--最後の階級での値は 100%=1 または 100 になる
 累積相対度数=(各階級の累積度数)/(全体の度数)
  または
 累積相対度数=(各階級の累積度数)/(全体の度数)×100

***階級数の算出 [#fc3b5d65]
階級数を算出するときに、
経験やキリのいい数字ではなく、
何らかの客観的な理由が必要となる場合に、使用される方法がいくつかある。
-スタージス (Starges) の方法
--データの数が n 個のとき、常用対数 &mimetex(\normalsize \log_{10} ); を用いて算出
#mimetex(){{
 1 + (3.322) \log_{10}{n} = 1 + \Large\frac{ \log_{10}{n} }{ \log_{10}{2} }
}}
-シャリエ (Charier) の方法:標準偏差の1/3
-フィッシャー (Fisher) の方法:標準偏差の1/4


**Excelで度数分布表を作成 [#gd08480d]
表計算ソフトの「Microsoft Excel」を使って、
度数分布表を作成する場合、
関数を使わなくても、四則演算(+−*/)だけでも作成できます。

しかし、データ数が多い場合に度数を求めたり、
度数などの合計を求めるときには、
関数を使えばデータを処理しやすくなります。

***度数分布表の作成で使用する関数 [#h7f8f30d]
-合計は、''SUM''関数を利用します。
>
:SUM(合計を計算する)|
--書式 : SUM(数値1, 数値2, ...)
--引数 : 数値1, 数値2, ... :平均を計算するセルの範囲
--例:B1〜B10セルまでのセルの数値の平均値を計算する
#pre(novervatim){{
=COLOR(red):SUMCOLOR(black):(B1:B10)
}}
<
-「値が60以上のセル」のように、特定の条件を満たすセルの個数を数えるには、''COUNTIF''関数を使います。
>
:COUNTIF(指定された範囲のセルのうち、検索条件に一致するセルの個数を返す)|
--書式 : COUNTIF(範囲, 検索条件)
--引数 : 範囲 : 個数を求めるセルの範囲
--引数 : 検索条件 : 個数を求めるセルの検索条件
--例:W1〜W10セルまでで値が「80以上」のセルの個数を数える
#pre(novervatim){{
=COLOR(red):COUNTIFCOLOR(black):(W1:W10,">=80")
}}
<

COUNTIF関数を利用して数式をつくるとと、
「40以上60未満の値があるセルの数」を求めることができます。
ただし、COUNTIF 関数には条件は1つしか設定できないため、
ひとつの数式でCOUNTIF 関数を2つ使います。

#ref(2010/2nd/2nd/is0826.png,nolink,COUNTIF関数を使った処理)
たとえば、C1〜C7セルに上の図のように点数の値が入力されているとします。
そのときに、「40以上60未満の値があるセルの数」を求める場合は、
次のような数式になります
 =COUNTIF(C1:C7,">=40")-COUNTIF(C1:C7,">=60")
つまり、「40以上の値があるセルの数」と「60以上の値があるセルの数」の差を求めればよいわけです。

メニュー

  • トップページ
  • 参考書籍

授業内容

  • 第1回
  • 第2回
  • 第3回
  • 第4回

ケータイで教員にメール

mkawano%40ed.hyogo-dai.ac.jp

今日の5件
  • 2011/6th/Excel2(34)
  • 2015/5th/Excel2(30)
  • FrontPage(9)
  • 2014/5th/Excel2(3)
  • 2025/BHS/8th(3)
最新の10件
2025-06-02
  • 2025/BHS/8th/1st
  • 2025/BHS/8th/exercise
  • 2025/BHS/8th
  • 2025/BHS
2025-05-26
  • 2025/BHS/7th/exercise
  • 2025/BHS/7th/1st
  • 2025/BHS/7th
2025-05-19
  • 2025/BHS/6th/1st
2025-05-12
  • 2025/BHS/5th/exercise
  • 2025/BHS/6th/exercise

total: 7826
today: 2
yesterday: 2
now: 5

リロード   差分   ホーム 一覧 検索 最終更新 バックアップ リンク元   ヘルプ   最終更新のRSS
http%3A%2F%2Fhs-www.hyogo-dai.ac.jp%2F~kawano%2FHStat%2F%3F2012%25252F2nd%25252FFrequency_Distribution_Table
Founded by Minoru Kawano.
Powered by PukiWiki Plus! 1.4.7plus-u2-i18n. HTML convert time to 0.106 sec.
Valid XHTML 1.1