「AとBの関係を調査した結果、相関関係があることが分かりました。」
このような報告は何かの調査結果などで良く目にします。
相関関係とは、AとBの値の変化に何らかの連動する関係性が見られることを指します。例えば「Aが増えるとBが増える」のは正の相関関係。「Aが増えるとBが減る」のは負の相関関係といった具合です。
相関関係と言うのは何かの関係を調査する際に、だいたい着目されるものです。何か自分でも未知の現象を調査していて「相関関係」を発見すると、「これは大発見だ!」というように嬉しくなります。
しかし、「相関関係」を見つけるのは大事なことですが、実際に「相関関係」があったとしても、それが役に立つかどうか(意味があるかどうか)はよく調べなければわかりません。
今回はその話をします。
目次
「科学」の目的:現象の予測と制御
まず、科学の目的とはなんぞや、と言う話をします。科学の目的というと難しそうですが、「科学」は何の役に立つのか、と考えるとそれは
「現象の予測と制御」
にあると言えます。
例えば、
- ジュラルミンをφ25の円柱にすれば、100Nの力がかかっても破壊しない。
- この電池を使えば、電気自動車を100km先まで走らせられる。
上記の例は、現象の「制御」を行っている例で、これらを行うには科学的な知見が役に立ちます。
また、自然現象のように「制御」ができなくても、台風○○号の進路が事前に「予測」できれば被害は「制御」(減少)できます。
ところで、相関関係というのは、パラメータAとBの関係です。Aを増やせばBも増える(あるいは減る)ということが分かっていれば、予測と制御に役立ちそうです。
でもこれだけでは不十分なのです。
「相関関係」のワナ
例えば、次の例を考えてみましょう。
第2次大戦後の日本において、日本人の平均寿命と、テレビの人口当たりの普及台数の関係を調べましょう。
ちゃんと統計を調べたわけではないですが、おそらくこんな関係があるでしょう。テレビの普及割合が増えるとともに、平均寿命が延びています。
これは間違いなく正の相関があるデータです。
では、この相関関係を使って、「現象の予測と制御」を行うとどうなるでしょうか。
例えば、平均寿命が短い国に対して、平均寿命を延ばすためにはテレビの普及割合を増やせば良い。
各家庭に対してテレビを配布すれば、平均寿命が延びるのでしょうか?
これは皆さんお分かりの通りそうはならないでしょう。
これはなぜかというと、相関関係だけでなくその相関をつなぐメカニズムの検討が無いためです。
繰り返しですが、上記の寿命とテレビの普及割合には間違いなく相関関係があります。しかしこの二つのパラメータには直接の影響しあうメカニズムや因果関係がありません。
実際には、2者が増加した共通の要因・メカニズムとして経済成長が隠れているのです。
- 経済成長→栄養・衛生・医療の改善→平均寿命の増加
- 経済成長→可処分所得の増加→テレビの普及
ここで、経済成長と平均寿命の増加、経済成長とテレビの普及には相関関係があります。また、その因果関係も存在します。
よって平均寿命を増加させるためには、栄養状態の改善が必要だ。そのためには経済成長できるようにすることが必要だ。というのは、平均寿命を制御するために役に立つ方策となるでしょう。
単に相関関係があるだけでなく、その2者をつなぐ因果関係やメカニズムを考えなければ役に立たない可能性があるということです。
因果やメカニズムが不明でも役に立たせるには
ただし、こう考えることもできます。
因果関係やメカニズムが分からなくても、実際にAを操作して、Bが制御できるのであれば、その間がブラックボックスであっても役に立てることができます。
実際エンジニアリングにおいても、液晶パネルを製造する際に、材料のポリイミドを「ラビング(こする)」ということをやります。こするとポリイミドがうまく構造変化して液晶ディスプレイに必要な特性が得られるのです。
このとき、実はなぜラビングすると、ポリイミドが構造変化するのかは明らかではありません。しかしそれによって確実に必要な特性が得られると確かめられていれば、現象の予測と制御は可能なのです。
これはサイエンスとしては上等ではないかもしれません。でもエンジニアリングとしては立派な解法と言えます。
よって、相関関係を役に立たせるためには、関係を使って実際に現象の予測と制御が可能か確認することが必要です。
お疲れ様でした
以上で説明を終わります。
途中に挙げた寿命とテレビの関係は新人研修でもよく話題にします。
これは例なので、誰にでもわかる話にしてあります。
しかし、現実の仕事の中で誰も正解を知らないことを調査していくとき、この相関関係のワナに陥りがちです。よく注意しておきましょう。