相関 (correlation)2種類のデータのあいだになんらかの関係がある場合、 統計学的な関係性がみられるときに、 「相関がある」や「相関関係がある」といいます。
データの尺度と相関関係データを大雑把に、量的データ(比例尺度、間隔尺度)と 質的データ(順序尺度、名義尺度)に分けるときに、 データの尺度によって、相関関係を表す指標は異なります。 次の表を参考にしてください。
この授業では、よく利用される、 ピアソンの積率相関係数とスピアマンの順位相関係数を扱います。 相関係数 (correlation coefficient)相関の種類
偏差積和
相関係数(ピアソンの積率相関係数)
共分散(covariance)
偏差平方和
相関関係と因果関係相関関係から因果関係を確定するときの注意点何でもよいから2組のデータの関係性を調べればよいわけではありません。 次のような5つの因果関係が認められる場合に、 相関関係を調べることが有効になります。
疑似相関(見かけの相関)直接の相関はないが、何かある要因が2つの事象と相関しているために、 2つの事象に相関がみられるケースがあります。 このような場合を「疑似相関」といいます。 つまり、相関関係があるからといって、 それが必ずしも因果関係であるとは限らない場合です。
相関の程度相関係数の値から、相関の程度を次のように記述できます。
なお、標本数が少ない場合は、 母相関係数の推定や検定(後日説明)が必要となります。 順位相関係数(rank correlation coefficient)相関がない場合や順位に意味がある・順位だけしかわからない場合には、 順位データ(データを小さいほうから並べた順位)をもとに、 相関を求める方法が有効になります。
また、順位尺度のデータだけでなく、 比例・間隔尺度のデータについても何らかの順位を求めることで適用できます。
|