2020-04-10

統計的因果推論を考え方から理解してみる(未完)

途中まで書いて力尽きた記事を勿体無いので公開。以下もここと同じリスト形式内の文はすべて追記として後から付け加えたもの

相変わらず統計の勉強はずっと続けているが、統計的因果推論もその一つだ。私は、自分も教えられた心理学の標準的な統計の知識が間違っていることを知って以来、統計は論理的に理解できるのだと目覚めてしまい、統計の勉強が楽しい。

私の場合は、他の人と違って統計のテクニカルな部分よりもその統計的な考え方の方に興味を持っている。ベイジアンについてはまだ分からないことが多いが、統計的因果推論については理解の目処が多少ついてきたので、半ば自分向けのメモとしてこの記事を書くことにした。なので、あまり真に受けず軽い気持ちで読んでください。

因果推論とは何か？

因果推論とは、特定の要因間に因果関係があるかを証拠から推測することだ。

例えば、あるダイエット法に効果があるか知りたければ、そのダイエット法をしてる人の体重が減っているかを知ればよいはずだ。しかし、そうした例を見つけたとしても、体重の減少が本当にそのダイエット法のお陰なのか、たまたまその人が痩せやすいからなのか、必ずしも原因ははっきりと分からない。

このように、単に観察された事実だけからは因果関係を知るのは難しいので、科学的な実験をすれば因果関係があると分かるはずだ。

無作為化比較試験とは何か？

無作為化比較試験（Randomized Controlled Trial； RCT)とは、医療や心理学を始めとする科学的な研究で最も(唯一？)因果関係を知るのに相応しい実験の仕方である。エビデンスベース(証拠に基づく)の世界では、これこそが因果関係が分かる頂点の研究法に位置づけられている。

RCTは意訳すると、対象をランダムに各条件に割り当てる制御された実験…となる。つまり、性別や体格などで偏らないように対象となる人達をそれぞれのダイエット法に無作為に参加してもらう。

観察された事実のままでは各自が自分の好きなダイエット法を選んでいるので、どんなダイエット法を好むか自体が痩せやすさと関わりがある可能性を否定できない。だが、外側からランダムに各ダイエット法に各自を割り当てることで、そのダイエット法がどんな人でも効果があることがはっきりと分かる。薬の効果などもこうした科学的な実験手法によって確かめられている。

他にも盲検法なども重要だが、ここではこの説明で十分だ。

RCTについては『科学が暴く「食べてはいけない」の嘘』試し読みもお勧め

統計的因果推論とは何か？

世の中で因果関係を知りたいものが全てこのような実験ができる訳ではない。どのような教育を受けると収入が高くなるかを知りたくとも、あなたは大学に行ってそちらは就職して！と勝手に割り振ることはできない。

だが、現実にどの学歴でどのくらいの収入かというデータを手に入れることはできる。そうしたデータだけからなんとか因果関係を知る事ができないか？と考えられたのが、統計的因果推論である。

google:社会科学における因果推論の可能性石田浩が内容が充実しててお勧め。この講演録は私が統計的因果推論に興味を持ったきっかけでもある。

相関→補正→因果とたどれ！

統計的因果推論は大きくルービン流とパール流があり、そのやり方も考え方も異なる。どちらであれ、統計的因果推論にとって重要となる基本は、相関関係だけからは因果関係は分からないだ。相関関係とは二つの要因の数値上の関係を表したもので、一方が増えるとするともう一方も増えるといった線形な関係などが分かる。

例えば食事量が多いと体重が重いなら、食事量と体重の相関は高くなり、因果もあると言えそうだ。もし子供のデータから、体重が重いと語彙量が増えるとすると体重と語彙量の相関は高い。しかし、体重が重いと語彙量が多くなるという因果はおかしいが、それは年齢が上がると体重も語彙量も同時に増えるから相関が見た目で高くなってるだけだ。

相関関係だけから因果関係をしれないならどうすればよいのか。二つの統計的因果推論に共通して言えるのは、交絡(confounding)を補正して因果関係を推測するだ。上の例では年齢のせいで体重と語彙量の相関に偏りが生まれているので、その分を補正すればその相関が表面的なものだと分かる。

以下は既に公開済みの記事からの抜粋

ルービン流とパール流の因果推論に共通の考え方は、相関だけから因果は導けないので交絡を補正して因果を推論することだ。要するに、要因(変数)同士がぐちゃぐちゃに絡んでるのを統計処理上で解きほぐすことで因果を導くのだ(相関→補正→因果)。

ルービン流の統計的因果推論

ルービン流の統計的因果推論は反事実(counterfactual)で説明されることが多いが、これは誤解を招く。反事実は形而上学的な概念なので、そもそも現実には観察不可能だ。反実仮想を実験的に確認できるかのような形式として、各条件へのランダムな割り当てを行なうRCTがある。

ルービン流の因果推論では、RCTにおける対象のランダムな割り当てを統計上で実現させる。例えば一方の条件に男が多い時に条件ごとに性別の影響が均等になるように数値を補正するが、これは傾向スコアの方法だ(交絡の補正)。

ルービン流では、属性(性別や学歴など)を持った対象が条件に割り振られるとそれに対応する効果が現れるとする(対象[属性]→条件→効果 ;潜在結果フレームワーク)。ここからSUTVAの説明もできる(例えば条件に割り当てた後の要因は扱えない)。

google:傾向スコア解析法による因果効果の推定と調査データの調整について星野崇宏も参照

パール流の統計的因果推論

パール流の因果推論は、パス解析(構造方程式)とグラフィカルモデル(因果ネットワーク)からなるが、これらの間の関係がうまく説明されない。構造方程式は単に要因(変数)間の関係を見るだけで相関のレベルに留まる。可能な構造方程式から描かれる複数のパス図(因果ネットワーク)の内どれが正しいのかは分からないので、グラフィカルモデルを使って要因間の絡まりを解きほぐして、正しい因果ネットワークを選び出す必要がある。

例えば、必ずしも測定した要因(共変量)を全て用いて分析していい訳でなく、そうすると余計な交絡が生じてしまうこともあり、影響関係を過大または過小評価したりする原因となる。場合によっては、せっかく測った要因を分析から外す必要もある(交絡の補正)。そういったことを判定するのがグラフィカルモデルの役割だ。

パール流の場合は、要因間の関係を直接に探るのが特徴だが、正しい因果ネットワークを選ぶのは困難も多く、その点ではルービン流の方が実用的。ただ、それまでのパス解析にあった、これで分かるのは選ばれた要因の間の相対的な影響関係だけであって、因果推論と呼ぶには相応しくないのでは？(所詮、分かるのは相関に過ぎない)、という疑問にパールが答えてくれてるのは大きな功績だと思う。

ちなみに、パール流でのグラフィカルモデルは、(ルービン流での)潜在結果モデルを扱うことはできる(含んでいる)が別に前提ではない…と思う。

結局ここでは大して触れられなかったグラフィカルモデルについてはgoogle:ベイズネットから見た因果と確率大塚淳]や[google:因果ダイアグラム・構造方程式モデルによる因果推論宮川雅巳を参照

2020-04-08

■

独り言

最近ラジオであるニュース番組を聞いていたら、ある人が専門家の間で見解が異なる場合はどうしたら良いのか？に答えていた。

その人が言うには、専門家から直接に聞くのではなくリスクコミュニケーターを介せばよくて、マスメディアがその役割を果たすべきだとしていた。間違ってはないとは思うが、マスメディアへの不信が専門家から直接に聞こうとする原因でもあるはずと考えると、ちょっと理想論に過ぎるように感じた。

そりゃあ、信用できる仲介者がいるならその人を頼ればいいと思うが、まともに科学ジャーナリズムが成立してない日本でそんな都合のいい人がすぐに出てくる訳がない。普段から科学を軽視してきた報いが今になって来ただけだ。

さらに、その論者は、専門家は狭い専門を持っていて狭い条件の元で語っているから…みたいに言っていたが、お前もリスクコミュニケーションの専門家じゃねぇのかよ！と突っ込みたくなった。俺には専門家の語る条件が分かるぜ！的な傲慢と紙一重で感心できる発言ではない。仲介者として名乗り出てるのがこんな人なのかと思うと頭を抱える。

ポストトゥルースとは異なる事態

今回の新型コロナ騒ぎで起こった新しい事態の一つは、専門家同士で見解が異なる事態に一般の人が直面した事だ(しかも日本だけで起きてる事態ではない)。これまでのポストトゥルース(真実以後)の時代とされる中では、事実と異なる間違った情報(misinformation)が話題になり、特にブレグジットやトランプ当選においては悪意のある虚偽情報(disinformation)が問題とされた。

もちろん、今回も(不安に乗じて)事実として間違っている情報は流れているし、それは気をつけてもらうしかない。しかし、今回改めて生じたのは

専門家が語っている(悪意はない)
見解の違いが晒されている(事実が焦点ではない)

であり、いわゆるポストトゥルースとは問題が別になっている。これはどういうことなのか？

ここで専門家と一つに括られているが、これは誤解を招く。ある領域に詳しいジャーナリスト(評論家)と専門分野を持った研究者とは、メディアに出ると同じように専門家と括られてしまうが、その内実は全く異なる。前者は既にある事実や知識に詳しい人だが、後者はまだ未知の領域を研究している人であり、同じく専門家と括るには違いがあまりに大きい。今回問題になっているのは、単に事実や知識を披露するだけでは済まない科学者の問題だ。

一般社会に現れない科学の営みが噴出する

ものすごく大雑把に語ると、科学には既に成果の確定した知識の領域と多くの研究者によって今現在進行形で調べられている探究の領域とがある。実際にはこれらをきれいに分けることはできないが、都合上これで話を進める。

普段メディアに出る科学は確定された知識の領域で済む事が多く、未知の探究の領域は科学番組の他ではあまり話題にならない。探究の領域では研究者の間で日々議論が交わされる先端の戦場である。時々、科学で何でも分かる訳ではない！と物知り顔で論ずる奴がいるが、研究者の側からは科学は分からない事があるから成立してるのであり、何が分かっていないのかを知ること自体が重要でもある。

つまり、メディアなどの表に出てくる科学はきれいに整った結晶だが、先端となる科学の本体はもっと混沌とした状態なのだ。今回は、新型コロナという全く新しい事態によって、本来は科学者の間で済んでいたドロドロな混沌が、一般市民の目にも顕わになってしまったのだ。

一般市民の科学観との乖離

本来なら、科学者の間で議論が交わされその結果が表に晒される…が正しい順番だ。しかし、今回はそうなる余裕がなかった。事態の緊急性と高度になったネット社会が組み合わされて、科学者間の議論をろくに経ずに一般社会にその混沌部分が加工されずに表に出てこざるをえなくなった。

今回は、本来の専門でないことにまで口を出す専門家も出てきているので、話がややこしいが、専門家も専門外については素人と考えた方がよい。本当の問題は、本来の専門に近くても見解が異なるところが表に出てしまったことだ。科学の中ではそこは単に議論すべき論点でしかないが、科学の営みを知らない一般市民には混乱を招いただけだった。

分かりやすくするために、科学を知識の領域と探究の領域に分けたが、実際はもっとややこしい。そもそも科学は一枚岩で語れるものではなく、もっと多様で複雑なものだ。当の科学者でさえその多様さをよく分かってないこともあるのに、科学を批判してれば深遠に聞こえるとでも思っている人文学者の科学観がいい加減に古臭すぎる(最近見たものだとマルスク・ガブリエルのがひどかった。あの人の本来の専門は科学とは関係ない)。

結論は出したいが…

どうしたらいいのか？との問いに処方箋や結論は出したいが、正直私自身がどうすればいいのか困っている。

なに偉そうに助言しとるんじゃ…で本文からは削除

ただ言えるのは、俺の言ってることが正しいぜ！的なのに頼るのは危険(確信の高さと真偽は関係ない)、情報量が多すぎるのは混乱しか招かないので信頼できる情報源に絞る、下手に論争には手を出さない(冷静な議論など期待できないので労力の無駄)…とかかな。

それでもどうしても情報が欲しい…との人にはっきり言えるのは、専門家の話を聞くべきなのは当たり前として、誰が正しいのかという択一の問題にはせずに、なぜその見解をとったのかという理由に遡って比較検討するしかないことだ。例えばマスクをすべきかも、「ウイルスが小さいので防げない」「手が顔に触るのを防げる」「飛沫が飛ぶのを防ぐ」と(ただの見解ではなく)理由を集めればおのずとそれなりの像は結べる…かもしれない。

ちなみに、私自身はタブレット(アンドロイド)にRSSリーダーのアプリを導入したら、ニュースサイトの記名記事を見るのにすごい便利。学者やジャーナリストのブログも登録してるので、一括で管理できて助かる。いくら専門家が書いていても、理由の説明にまで触れられる長めの記事でないともはや使えない。

追記(2020/4/10) ちなみに、私は政府を非難するな！とかとは全く思ってません。批判したいひとは勝手に批判すればいいし、その行為自体を批判したい人も勝手にやればいい。非難をやめろ！と言いたい奴は勝手に言わせればいいし、やっぱり批判したいなら気にせずそんな言葉は無視して構わない。ただ、ネットでの論争は往々にして不毛になりやすいので、本当に興味がある事は自分の頭で考えた方がいいところはある。

2020-04-05

■

独り言

認知科学そのものについては、何をどこから記事に書けばよいのやら途方に暮れつつあり、どうも書く気が起こらない。そもそも最近は認知科学そのものよりも別のところに興味を持ってしまい、その内容を自分のための整理とメモも兼ねて記事に書いてもいいかな〜と思う一方、それを公開してどうする感もなくもない。

学習機関における統計力学の位置

一つは、まだアイデアの域はそれほど超えないが、学習機関における統計力学の話題がある。

ニューラルネットワークや自由エネルギー原理のように統計力学の考え方が生物や機械の学習機関に適用されている。しかし、もし学習機関に文字通りに統計力学が当てはまるなら、もともと統計力学が適用されている外部の物理的な環境との差がなくなってしまう。

もちろん生物と環境には振る舞いに違いが観察されるので、どこかに問題があるはずだ。それは学習機関は文字通りの統計力学そのものが当てはまるのではないことだ。だが、それをうまく指摘してくれる文章がないので、自分で勝手に考えてみた。

統計力学はエントロピーと結びついた考え方をする。基本の考え方は、どんな整理された部屋も放っておくと散らかり続けることだ。集められた熱を留め続けることはできないとすると、世の中に完全な断熱装置はないと結論できる。

統計力学は情報理論との関連性も強く、ここでの話題ではこれが重要だ。情報理論は情報の圧縮はどのくらい可能か？でも語られるが、ここでは記録(記憶)と関連付ける。部屋は放っておくと散らかり続けて、長い時間が経つほど散らかし具合が激しくなり、もとの部屋の状態は分からなくなる。これは情報理論的には、記録に雑音が入り続けて元の記録が分からなくなる感じに似ている。「元の状態を保つ=元の情報を残す」には余分なエネルギーが必要なのだ。

外部の物理的な環境には統計力学的には記憶機能はないが、学習機関としての生物には学習状態を保持する意味での最小限の記憶機能はある。状態を保持するだけでエネルギーは必要になるので、統計力学的にはそれはそれは無駄でしかない。学習機関としての生物になぜそんな記憶機能が必要かと言えば、それは生物は生存(と生殖)という目的を持っているからだ。生物と環境の境界は目的によって定められている。生物を目的によって捉えるのは、哲学では目的論として昔からある。

生物が目的を果たすためには記憶機能が必要だが、そのために無限の記憶能力を持つのは単なるエネルギーの無駄でしかない。目的論と統計力学との間のバランスをとるのが、汎化能力であり、これこそが学習機関そのものだ。汎化能力とは、目的を果たすために最小限のエネルギー消費で済ますための原理だ。

とりあえず、最初の話題では書けるのはこの辺りまでかな。

二つの統計的因果推論を共通項から見渡す

もう一つは統計的因果推論だけど、実は途中まで記事は書いたが、無作為化比較試験(RCT)と相関と因果の関係のような基礎知識をざっと簡潔に説明しただけで長くなってしまい、本番となるルービン流とパール流の因果推論に入る前に力尽きた。ただでさえSNSをやりすぎて文章を読む集中力も読解力も失われてるともされるのに、あまり長い記事はどうせ読まれないと思うと書く気が失せる(この文章も長いが読まれなくとも気にならない…ような気楽な書き方をしてる)。

以下は、私流の統計的因果推論への個人的な理解であって、これが本当に正しいかどうかは(これを取っ掛かりにして)自分で確かめてください。

ルービン流

パール流

ちなみに、パール流でのグラフィカルモデルは、(ルービン流での)潜在結果モデルを扱うことはできる(含んでいる)が別に前提ではない…と思う。

他に気づいたこと

統計的因果推論を理解することの長所は、エビデンスベースにも活かせる因果への深い理解に達するのにも便利なところにもある。だが、今はまだテクニカルな話ばかりが目立って、そういう考え方に突っ込んだ説明が日本では見当たらないのは残念。パールが近年書いた因果推論の一般向け解説書が訳されれば状況はマシになるのかな(内容は確認してないので私にはよく分からない)。

他にも、反事実(counterfactual)は本来は形而上学的な概念な故にそもそも観察自体が不可能なのに、統計的因果推論の説明ではその辺りが分かりにくくなってる(反事実が観察不可ゆえにランダムな割り当てを用いる)。この辺りは哲学の知識を持った人が語らないと誤解を与えやすいと感じる。