因果関係と相関関係(Causation and Correlation)

因果関係とは、ある原因によって他のデータに直接的に影響を及ぼすことをいい、相関関係とは、あるデータと別のデータの単に間に関連のあることをいいます。そのため、相関関係だけでは因果関係を語ることはできません。 具体例を挙げて考えてみましょう。仮に、「身長の高い人ほど国語の達成度得点が高い。身長の低い人ほど国語の得点が低い」という中学生のデータがあったとして、「身長を伸ばすために、国語の勉強をたくさんしよう」と、因果関係を主張することはできるでしょうか。

「国語の勉強をする」ことが原因で、その結果として「国語の成績がよくなる」という詳細なステップが示されているのなら、これは因果関係であるといえます。一方、相関関係は何が原因であるかは問われず、両方のデータに関係があるかどうかだけが問題となるのです。

そういうわけで今回の主張の場合、相関関係はありますが、直接の因果関係は表わしていない、となります。同じように、「バレーボールなどを練習して身長をのばせば国語がよくできるようになる」や「国語の勉強をすれば身長がのびる」などの主張も正当化できないのです。しかし、中学生のデータを収集すると、身長と国語の得点の間に相関関係があります。どうしてでしょうか。

実は、この相関関係に影響を及ぼしているのは「年齢」です。身長と国語の点数の間には、共通の原因である、年齢という原因があるのです。

ふつう、中学校全体では低学年の生徒ほど身長も低く、国語の達成度も未熟だと考えられます。そして、高学年になるほど背も伸び、国語力も上がっていくでしょう。因果関係を主張するのであれば、本来ならば年齢別に身長と国語力を調査したうえで判断するのですが、今回のデータは年齢を考慮せずに集計したので、身長と国語の点数のあいだに相関関係がみられただけなのです。