統計的因果推論を考え方から理解してみる(未完)

  • 途中まで書いて力尽きた記事を勿体無いので公開。以下もここと同じリスト形式内の文はすべて追記として後から付け加えたもの

相変わらず統計の勉強はずっと続けているが、統計的因果推論もその一つだ。私は、自分も教えられた心理学の標準的な統計の知識が間違っていることを知って以来、統計は論理的に理解できるのだと目覚めてしまい、統計の勉強が楽しい。

私の場合は、他の人と違って統計のテクニカルな部分よりもその統計的な考え方の方に興味を持っている。ベイジアンについてはまだ分からないことが多いが、統計的因果推論については理解の目処が多少ついてきたので、半ば自分向けのメモとしてこの記事を書くことにした。なので、あまり真に受けず軽い気持ちで読んでください。

因果推論とは何か?

因果推論とは、特定の要因間に因果関係があるかを証拠から推測することだ。

例えば、あるダイエット法に効果があるか知りたければ、そのダイエット法をしてる人の体重が減っているかを知ればよいはずだ。しかし、そうした例を見つけたとしても、体重の減少が本当にそのダイエット法のお陰なのか、たまたまその人が痩せやすいからなのか、必ずしも原因ははっきりと分からない。

このように、単に観察された事実だけからは因果関係を知るのは難しいので、科学的な実験をすれば因果関係があると分かるはずだ。

無作為化比較試験とは何か?

無作為化比較試験(Randomized Controlled Trial; RCT)とは、医療や心理学を始めとする科学的な研究で最も(唯一?)因果関係を知るのに相応しい実験の仕方である。エビデンスベース(証拠に基づく)の世界では、これこそが因果関係が分かる頂点の研究法に位置づけられている。

RCTは意訳すると、対象をランダムに各条件に割り当てる制御された実験…となる。つまり、性別や体格などで偏らないように対象となる人達をそれぞれのダイエット法に無作為に参加してもらう。

観察された事実のままでは各自が自分の好きなダイエット法を選んでいるので、どんなダイエット法を好むか自体が痩せやすさと関わりがある可能性を否定できない。だが、外側からランダムに各ダイエット法に各自を割り当てることで、そのダイエット法がどんな人でも効果があることがはっきりと分かる。薬の効果などもこうした科学的な実験手法によって確かめられている。

他にも盲検法なども重要だが、ここではこの説明で十分だ。

統計的因果推論とは何か?

世の中で因果関係を知りたいものが全てこのような実験ができる訳ではない。どのような教育を受けると収入が高くなるかを知りたくとも、あなたは大学に行ってそちらは就職して!と勝手に割り振ることはできない。

だが、現実にどの学歴でどのくらいの収入かというデータを手に入れることはできる。そうしたデータだけからなんとか因果関係を知る事ができないか?と考えられたのが、統計的因果推論である。

相関→補正→因果とたどれ!

統計的因果推論は大きくルービン流とパール流があり、そのやり方も考え方も異なる。どちらであれ、統計的因果推論にとって重要となる基本は、相関関係だけからは因果関係は分からないだ。相関関係とは二つの要因の数値上の関係を表したもので、一方が増えるとするともう一方も増えるといった線形な関係などが分かる。

例えば食事量が多いと体重が重いなら、食事量と体重の相関は高くなり、因果もあると言えそうだ。もし子供のデータから、体重が重いと語彙量が増えるとすると体重と語彙量の相関は高い。しかし、体重が重いと語彙量が多くなるという因果はおかしいが、それは年齢が上がると体重も語彙量も同時に増えるから相関が見た目で高くなってるだけだ。

相関関係だけから因果関係をしれないならどうすればよいのか。二つの統計的因果推論に共通して言えるのは、交絡(confounding)を補正して因果関係を推測するだ。上の例では年齢のせいで体重と語彙量の相関に偏りが生まれているので、その分を補正すればその相関が表面的なものだと分かる。


  • 以下は既に公開済みの記事からの抜粋

ルービン流とパール流の因果推論に共通の考え方は、相関だけから因果は導けないので交絡を補正して因果を推論することだ。要するに、要因(変数)同士がぐちゃぐちゃに絡んでるのを統計処理上で解きほぐすことで因果を導くのだ(相関→補正→因果)。

ルービン流の統計的因果推論

  • ルービン流の統計的因果推論は反事実(counterfactual)で説明されることが多いが、これは誤解を招く。反事実は形而上学的な概念なので、そもそも現実には観察不可能だ。反実仮想を実験的に確認できるかのような形式として、各条件へのランダムな割り当てを行なうRCTがある。

ルービン流の因果推論では、RCTにおける対象のランダムな割り当てを統計上で実現させる。例えば一方の条件に男が多い時に条件ごとに性別の影響が均等になるように数値を補正するが、これは傾向スコアの方法だ(交絡の補正)。

ルービン流では、属性(性別や学歴など)を持った対象が条件に割り振られるとそれに対応する効果が現れるとする(対象[属性]→条件→効果 ;潜在結果フレームワーク)。ここからSUTVAの説明もできる(例えば条件に割り当てた後の要因は扱えない)。

パール流の統計的因果推論

パール流の因果推論は、パス解析(構造方程式)とグラフィカルモデル(因果ネットワーク)からなるが、これらの間の関係がうまく説明されない。構造方程式は単に要因(変数)間の関係を見るだけで相関のレベルに留まる。可能な構造方程式から描かれる複数のパス図(因果ネットワーク)の内どれが正しいのかは分からないので、グラフィカルモデルを使って要因間の絡まりを解きほぐして、正しい因果ネットワークを選び出す必要がある。

例えば、必ずしも測定した要因(共変量)を全て用いて分析していい訳でなく、そうすると余計な交絡が生じてしまうこともあり、影響関係を過大または過小評価したりする原因となる。場合によっては、せっかく測った要因を分析から外す必要もある(交絡の補正)。そういったことを判定するのがグラフィカルモデルの役割だ。

パール流の場合は、要因間の関係を直接に探るのが特徴だが、正しい因果ネットワークを選ぶのは困難も多く、その点ではルービン流の方が実用的。ただ、それまでのパス解析にあった、これで分かるのは選ばれた要因の間の相対的な影響関係だけであって、因果推論と呼ぶには相応しくないのでは?(所詮、分かるのは相関に過ぎない)、という疑問にパールが答えてくれてるのは大きな功績だと思う。

ちなみに、パール流でのグラフィカルモデルは、(ルービン流での)潜在結果モデルを扱うことはできる(含んでいる)が別に前提ではない…と思う。