認知科学そのものについては、何をどこから記事に書けばよいのやら途方に暮れつつあり、どうも書く気が起こらない。そもそも最近は認知科学そのものよりも別のところに興味を持ってしまい、その内容を自分のための整理とメモも兼ねて記事に書いてもいいかな〜と思う一方、それを公開してどうする感もなくもない。

学習機関における統計力学の位置

一つは、まだアイデアの域はそれほど超えないが、学習機関における統計力学の話題がある。

ニューラルネットワークや自由エネルギー原理のように統計力学の考え方が生物や機械の学習機関に適用されている。しかし、もし学習機関に文字通りに統計力学が当てはまるなら、もともと統計力学が適用されている外部の物理的な環境との差がなくなってしまう。

もちろん生物と環境には振る舞いに違いが観察されるので、どこかに問題があるはずだ。それは学習機関は文字通りの統計力学そのものが当てはまるのではないことだ。だが、それをうまく指摘してくれる文章がないので、自分で勝手に考えてみた。

統計力学エントロピーと結びついた考え方をする。基本の考え方は、どんな整理された部屋も放っておくと散らかり続けることだ。集められた熱を留め続けることはできないとすると、世の中に完全な断熱装置はないと結論できる。

統計力学情報理論との関連性も強く、ここでの話題ではこれが重要だ。情報理論は情報の圧縮はどのくらい可能か?でも語られるが、ここでは記録(記憶)と関連付ける。部屋は放っておくと散らかり続けて、長い時間が経つほど散らかし具合が激しくなり、もとの部屋の状態は分からなくなる。これは情報理論的には、記録に雑音が入り続けて元の記録が分からなくなる感じに似ている。「元の状態を保つ=元の情報を残す」には余分なエネルギーが必要なのだ。

外部の物理的な環境には統計力学的には記憶機能はないが、学習機関としての生物には学習状態を保持する意味での最小限の記憶機能はある。状態を保持するだけでエネルギーは必要になるので、統計力学的にはそれはそれは無駄でしかない。学習機関としての生物になぜそんな記憶機能が必要かと言えば、それは生物は生存(と生殖)という目的を持っているからだ。生物と環境の境界は目的によって定められている。生物を目的によって捉えるのは、哲学では目的論として昔からある。

生物が目的を果たすためには記憶機能が必要だが、そのために無限の記憶能力を持つのは単なるエネルギーの無駄でしかない。目的論と統計力学との間のバランスをとるのが、汎化能力であり、これこそが学習機関そのものだ。汎化能力とは、目的を果たすために最小限のエネルギー消費で済ますための原理だ。

とりあえず、最初の話題では書けるのはこの辺りまでかな。

二つの統計的因果推論を共通項から見渡す

もう一つは統計的因果推論だけど、実は途中まで記事は書いたが、無作為化比較試験(RCT)と相関と因果の関係のような基礎知識をざっと簡潔に説明しただけで長くなってしまい、本番となるルービン流とパール流の因果推論に入る前に力尽きた。ただでさえSNSをやりすぎて文章を読む集中力も読解力も失われてるともされるのに、あまり長い記事はどうせ読まれないと思うと書く気が失せる(この文章も長いが読まれなくとも気にならない…ような気楽な書き方をしてる)。

以下は、私流の統計的因果推論への個人的な理解であって、これが本当に正しいかどうかは(これを取っ掛かりにして)自分で確かめてください。

ルービン流とパール流の因果推論に共通の考え方は、相関だけから因果は導けないので交絡を補正して因果を推論することだ。要するに、要因(変数)同士がぐちゃぐちゃに絡んでるのを統計処理上で解きほぐすことで因果を導くのだ(相関→補正→因果)。

ルービン流

ルービン流の因果推論では、RCTにおける対象のランダムな割り当てを統計上で実現させる。例えば一方の条件に男が多い時に条件ごとに性別の影響が均等になるように数値を補正するが、これは傾向スコアの方法だ(交絡の補正)。

ルービン流では、属性(性別や学歴など)を持った対象が条件に割り振られるとそれに対応する効果が現れるとする(対象[属性]→条件→効果 ;潜在結果フレームワーク)。ここからSUTVAの説明もできる(例えば条件に割り当てた後の要因は扱えない)。

パール流

パール流の因果推論は、パス解析(構造方程式)とグラフィカルモデル(因果ネットワーク)からなるが、これらの間の関係がうまく説明されない。構造方程式は単に要因(変数)間の関係を見るだけで相関のレベルに留まる。可能な構造方程式から描かれる複数のパス図(因果ネットワーク)の内どれが正しいのかは分からないので、グラフィカルモデルを使って要因間の絡まりを解きほぐして、正しい因果ネットワークを選び出す必要がある。

例えば、必ずしも測定した要因(共変量)を全て用いて分析していい訳でなく、そうすると余計な交絡が生じてしまうこともあり、影響関係を過大または過小評価したりする原因となる。場合によっては、せっかく測った要因を分析から外す必要もある(交絡の補正)。そういったことを判定するのがグラフィカルモデルの役割だ。

パール流の場合は、要因間の関係を直接に探るのが特徴だが、正しい因果ネットワークを選ぶのは困難も多く、その点ではルービン流の方が実用的。ただ、それまでのパス解析にあった、これで分かるのは選ばれた要因の間の相対的な影響関係だけであって、因果推論と呼ぶには相応しくないのでは?(所詮、分かるのは相関に過ぎない)、という疑問にパールが答えてくれてるのは大きな功績だと思う。

ちなみに、パール流でのグラフィカルモデルは、(ルービン流での)潜在結果モデルを扱うことはできる(含んでいる)が別に前提ではない…と思う。

他に気づいたこと

統計的因果推論を理解することの長所は、エビデンスベースにも活かせる因果への深い理解に達するのにも便利なところにもある。だが、今はまだテクニカルな話ばかりが目立って、そういう考え方に突っ込んだ説明が日本では見当たらないのは残念。パールが近年書いた因果推論の一般向け解説書が訳されれば状況はマシになるのかな(内容は確認してないので私にはよく分からない)。

他にも、反事実(counterfactual)は本来は形而上学的な概念な故にそもそも観察自体が不可能なのに、統計的因果推論の説明ではその辺りが分かりにくくなってる(反事実が観察不可ゆえにランダムな割り当てを用いる)。この辺りは哲学の知識を持った人が語らないと誤解を与えやすいと感じる。