相関があっても「使っていい相関/ダメな相関」

相関が出た。
散布図もきれいだ。相関係数も高い。
それだけで「根拠ができた」と感じることがある。

だから会議では、こう言いやすい。
「Aを増やせばBが増える」
「この指標を見れば判断できる」

ただ、相関があることと、意思決定の根拠にしてよいことは別です。
この記事では、相関を否定するのではなく、
使っていい相関/ダメな相関の線引きを整理します。

目次

相関は、簡単に“説得力”を作れます

相関は、資料に載せると強いです。
散布図がきれいに並び、相関係数も高い。
それだけで、結論が一段“それっぽく”見えてしまう。

だから会議では、こう言いやすい。
「Aを増やせばBが増える」
「この指標を見れば、判断できる」

ただ、相関があることと、
意思決定の根拠にしてよいことは別です。
ここを飛ばすと、後から説明に困ります。

相関は“混ざり”と“見え方”で簡単に生まれる

相関が危うくなるのは、
相関そのものが嘘をつくというより、理由が混ざるからです。

実務でよくあるのは、次の3つです。

  • 第三の要因に、両方が引っ張られている
    たとえば景気や季節、キャンペーンなど、外部要因がAもBも動かす。
  • 母集団や構成が混ざっている
    全体では相関が見えても、セグメントで分けると崩れる。
  • 期間や局面に依存している
    ある期間だけ「たまたま合う」。期間をずらすと消える。

この状態で「だからAを増やせばBが増える」と言い切ると、
後から説明に困ります。

研究でも実務でも、相関は「目的と前提」で使い方が変わります

相関は否定しません。
ただ、私が研究でも実務でも強く意識してきたのは、
相関は「目的と前提」が揃ってはじめて判断材料になるということです。

研究:相関を「一枚のルール」で使うと外す

研究の現場でも、相関はとても便利です。
私も、銀河のサンプルから楕円銀河を抽出するために、光の分布と形態の相関を使おうとしたことがあります。

ただ、この相関は「一枚の基準」で扱うと外します。
暗い(=軽い)銀河では、中心集中度が高いほど楕円銀河らしい、という相関が素直に使える。
一方で明るい(=重い)銀河では、裾野の広がりも効いてきて、中心集中度だけだと重い楕円銀河が落ちてしまう

そこで私は、目的(軽いものだけでなく重いものも含めて抽出したい)に合わせて、
銀河の質量でレンジを分け、それぞれのレンジで相関の形を確認し、基準も変えました。
同じ「相関」でも、条件が変わると意味が変わる。だから前提を揃える。
この感覚は、そのまま実務にもつながっています。

実務:相関は「説明できること」が最低条件

実務では、相関が見えた瞬間に「根拠」にしたくなります。
でも私は、データ上の相関だけでは足りないと思っています。最低条件は、その相関の背景に説明がつけられることです。

「指標Aが動くと、こういう仕組みで指標Bも動く」──定性的に説明できない相関は、判断の根拠にしにくい。
もちろん、未知データで崩れないか(汎化性能)や、推計がぶれないか(安定性)も見ます。
ただし厳密さは目的次第です。仮説段階なら方向づけとして使える。役員会で言い切るなら、前提と説明可能性が必要になる。

相関は否定しません。
ただ、目的と前提を揃えないまま「相関がある」から結論を強くするのが危ない。
私は研究でも実務でも、この線引きを意識してきました。

実務でありがちな例(相関が“根拠”になってしまう瞬間)

相関は、見つかった瞬間に「根拠」に見えます。
そして気づかないうちに、結論の強さが上がっていきます。

実務でよく見るのは、たとえば次のような形です。

例1:相関が高い → 施策の根拠にしてしまう

広告費と売上に相関がある。
だから「広告を増やせば売上は伸びる」と言い切ってしまう。

でも、その相関は景気や季節、キャンペーンで両方が動いているだけかもしれません。
根拠として強く言った瞬間に、後から説明が難しくなります。

例2:全体では相関、分けると崩れる(構成の罠)

全体のデータでは相関がある。
ところが、顧客セグメントや地域で分けると、相関が消える/逆になる。

このとき相関が見えていたのは、
「構成が混ざっていただけ」ということがあります。
全体の相関をそのまま判断に使うと危ない。

例3:期間を変えると相関が消える(局面依存)

直近の短い期間では相関がきれいに出る。
だから「いまはこの指標が効いている」と言いたくなる。

でも、期間を少し伸ばす/ずらすと相関が消えることがあります。
局面が変われば、関係も変わる。
その前提を置かずに結論を言うと、事故になります。

線引き:使っていい相関/ダメな相関

相関が見つかったときに危ないのは、
相関そのものより、結論が強くなりすぎることです。
ここも、結論の強さを三段階に分けておくと安全です。

言ってよい(事実)

  • 「AとBは同時に動いている」
  • 「この期間では相関が見られる」

条件付きなら言える(暫定)

  • 「セグメントや期間を変えても同じ傾向が残るなら、判断材料としては強くなる」
  • 「外部要因や構成の影響を説明したうえで、施策の仮説として扱う」
  • 「相関を“方向づけ”に使い、結論は別の根拠とセットで出す」

言うと危ない(断言)

  • 「Aが原因でBが増える」
  • 「この施策で改善する」
  • 「今後も同じ関係が続く」

“使っていい相関”は、相関係数の大きさでは決まりません。
どこまで崩れにくく、どこまで説明できるかで決まります。

あなたの相関は「誰が」「いつ」見ても残りますか?

最後に一つだけ、確認させてください。
あなたが見ているその相関は、「誰が」「いつ」見ても残りますか。

  • 顧客セグメントや地域で分けても、同じ関係が残りますか。
  • 期間を伸ばす/ずらすときも、同じ関係が残りますか。
  • 「だから施策を打つ」と言い切ったとき、崩れる条件を言えますか。

もしここで少しでも引っかかるなら、
相関が間違いなのではなく、
判断に使うための整理がまだ終わっていないだけかもしれません。

分析やKPIを、
「このまま意思決定に使ってよいか」
判断に迷う場合は、
設計段階から一緒に整理します。

具体的な相談の進め方は、「相談について」のページにまとめています。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

意思決定のためのデータ設計 顧問。研究と実務の両方で、数字は出ているが結論に使うと危険な場面で、どこまで言ってよいかの線引きをしてきました。判断に迷う場合は設計段階から一緒に整理します。

コメント

コメントする

目次