フリストンブランケットはどんな科学モデルなのか?

論文「皇帝の新しいマルコフ織物」

今回、ある程度突っ込んで紹介したいのは、次の論文だ。

google:Jelle Bruineberg Krzysztof Dolega Joe Dewhurst Manuel Baltieri The Emperor’s New Markov Blankets

論文のタイトルは、おそらくペンローズ「皇帝の新しい心」からのもじりだと思う(元々のもじり元があるのかもしれないが私はよく知らない)。共著者に私がここで2010年台のベスト論文に選んだ学者もいたので期待してたが、実際に中身を見てみるとなかなか面白い。

マルコフブランケットとは?

この論文では、フリストンの自由エネルギー原理で用いられているマルコフブランケットを検討している。マルコフブランケットとは、ベイジアンネットワークの一種で、物事同士の確率的な関係をつなげて並べたものだ。そのネットワークの図式化が織物(ブランケット)の糸が絡み合った感じに似ているので、そう呼ばれている。

ここではマルコフブランケットについて説明するのが本筋ではない上に、どうせインターネット上に色んな説明があるはずなので、詳しく知りたい人は調べてみてください。ただおそらく、マルコフブランケットについてあまり理解してなくても、以下でする科学モデルについての議論はそれなりには読めるとは思います(たぶん)。

フリストンは、マルコフブランケットを科学モデルとして使用しているのだが、その使用法に疑問を呈するのがこの論文だ。

マルコフブランケットの二つの利用法

フリストンは、マルコフブランケットを生物をその環境と隔てる境界を見つけるのに用いている。生物が身体を動かすと、基本的に身体だけが動いてその環境はそのままだ。大雑把に言えば、生物が制御できる身体の範囲が生物の境界であり、その境界の辺りで物質間の因果関係が断絶しているはずだ。

マルコフブランケットは、元々はパールという学者によって有名になったベイジアンネットワークの一種である。しかし、フリストンのマルコフブランケットの用い方はパールの用い方とは違っているようだ。そこで、マルコフブランケットの使用法をそれぞれパールブランケットとフリストンブランケットと名付けて分けて考えようとしている。

パールブランケットとフリストンブランケットの違い

マルコフブランケットをどう科学モデルとして利用するか?について、どう考えればよいのだろうか

科学哲学にはある大きな論争がある。それは、科学的に観察できない現実を信じることは正当化されるか?(実在論)、観察できない何かは科学的に観察できることを説明する助けになる補助的な構成物であるか?(道具主義)、との論争である。論争の細部を無視すれば、この疑問への答えはモデルを用いることと部分的に関係があると考えている。

google:Jelle Bruineberg Krzysztof Dolega Joe Dewhurst Manuel Baltieri The Emperor’s New Markov Blankets p.31より

科学モデルについての実在論道具主義の考え方は、マルコフブランケットの使用法にも応用できる。パールは主観的確率を採用していることでも知られており、マルコフブランケットの使用も道具的なものに近い。しかし、フリストンはどうも様子が違う。

モデルでの推論(inference with model)とモデル内の推論(inference within inference)との違いは、大雑把にパールブランケットとフリストンブランケットの使用に対応する。これは、後者の構成における隠された交換条件(payoff)が前者よりもかなり雑な理由である。モデルでの推論では、図式的なモデルは科学者が推論を行なうための認識的な道具である。モデル内の推論では科学者は場面から消えて、目の前で起こる解きほぐされる推論の単なる観察者となる。ここでは、フリストンブランケットは推論の構造を表している。つまり、どうすれば生きたシステムと分かり、このシステムと環境との間の境界を定められるのか?を明示しているのだ。

google:Jelle Bruineberg Krzysztof Dolega Joe Dewhurst Manuel Baltieri The Emperor’s New Markov Blankets p.40より

(マルコフブランケットではないが)ベイジアンネットワークは認知モデルとしてもよく使われているが、その場合はパールと同じで主観的確率が前提にされており、あくまでモデルは道具的に使われている。しかしフリストンの場合は、マルコフブランケットを現実をそのまま映し出したものとして使っているようで、単に道具的に使っているとは言いがたい。

モデルとして曖昧な位置にあるフリストンブランケット

結局、この論文で示された考察では、自由エネルギー論者をジレンマに陥らせたままになる。一方で、自由エネルギー論者は、単に道具的な解釈を許す、マルコフブランケットの素朴な概念を受け入れられる、[…中略…]、他方で、現実の持つ数学的な構造について強い形而上学的な前提を幾つも取り入れることができる、そうして主体と環境との間の文字通りの境界となるブランケットとなる実在論的な読み方を支持することになる。

google:Jelle Bruineberg Krzysztof Dolega Joe Dewhurst Manuel Baltieri The Emperor’s New Markov Blankets p.42より

なぜフリストンにおけるマルコフブランケットの使用法がこのような曖昧な位置にあるのだろうか?

パールの場合は、モデルは現実を推測するための道具として端的に使われている。しかしフリストンの場合は、モデルは現実の物質的な構成を推測するための道具でもあるが、さらに生物と環境との境界を見つけるためにも使われている。この推論の二段階の使われ方がフリストンにおけるモデルの位置づけを複雑にしている。

つまり、まずは現実の物質的な構成をモデル化した上で、そこから生物と環境の境界を推測している。後半の境界の推論においては、モデルが現実を映し出していること(自然の鏡!1)が既に前提にされている。まさに、これこそが「モデル内の推論」と言われるゆえんだ。

個人的な感想

私の印象では、フリストンブランケットのこうした特徴は、自由エネルギー原理において認知モデルの層と物理主義の層が分かれていて、その二つの層が実はつながっていないことの反映のようにも見える。

たたでさえ、予測処理理論が少なくとも統一理論としては怪しく思えてきてるのに、さらにフリストンのマルコフブランケットの使用にも疑問があるとなると、自由エネルギー原理にどこまで期待してよいのか?私にはよく分からなくなってきた。


  1. ローティの著作「哲学と自然の鏡」より

画像生成プログラムDALL-Eから人の知性を考える

WIREDの記事はいつも楽しみに読んでいるが、最近はこんな記事が面白かった。

AIは人の知性とは異なる道を歩む

この記事を見てあらためて思うのは、現在の人工知能は生きた知性とは全く違う道を歩んでいるということだ。そこで思い出すのは、スタニスラフ・レム「砂漠の惑星」だ。

私はそこまでのSF好きではないが、私の読んだことのある中で最も好きなSF作家はスタニスラフ・レムだ。レムほどに生命やAIについて科学的な洞察に富んでいるSF作家を私は知らない。その中でも「砂漠の惑星」はかなり好きな作品だ。

粗筋の紹介はここでは省くが、この作品の洞察の一つが、生命やAIを私達の想像の範囲内に収めることへの批判だ。よくあるAI脅威論とは、AIを私達の想像の延長にある脅威として描いている安っぽいSF的想像に過ぎない。

しかし、それはAIが私達とは全く異なる知性へと発展する可能性に目をつぶることにしかならない。そして、今回の記事も現在の人工知能が、生きた人間の知性とは別の方向に向かっていることを示している。

画像生成プログラムを人の知性と比べる

この技術は「CLIP」と呼ばれ、人間の脳が学習する仕組みに着想を得て考え出された人工ニューラルネットワークというアルゴリズムで構成されている。そして、ネット上にある何億もの画像とそれに付随するキャプションを使って学習し、それぞれの画像の正しいラベルを予測するように訓練されている。

http://https://wired.jp/2021/02/11/ai-go-art-steering-self-driving-car/」より

現在のニューラルネットワークが、(着想と元ではあるが)現実の人の脳にあまり似ていないことは前にも指摘した。そして、WIREDの記事で紹介されている「DALL-E」もやはり、話題になった「GPT-3」と同じく生きた人の知性とは似ていない。その理由は刺激の貧困問題にある。

刺激の貧困問題(別名はプラトン問題)とは、チョムスキーが指摘した有名な問題だ。つまり、人はなぜそこまで多くの(言語)刺激に触れていないのに文法(規則性)を理解できるのか?という問題だ。しかも、この指摘の背景にはスキナー流の行動主義への批判があった。(心理学的)行動主義とニューラルネットワークとの関係を考えれば、これは興味深い問題だ。

引用から分かるように、今回発表されたプログラムもネットからの大量のデータセットを用いている1。もちろん、これは実際の人の知性が行なっていることとは異なるし、似てもいない

今のAIが人の知性と似ていないもう一つの理由

リンク先にある「スパゲティでつくられた騎士」の画像を見ると圧倒されてしまうが、これを生み出したアルゴリズムは、現実の人の知性とは似ていない。最近自然な文を生成することで話題になった、同じくOpenAIによって開発されたGPT-3も事情は同じだ。

GPT-3もDALL-Eと同じく、大量のデータセットを用いていてニューラルネットワークに学習させているのは共通だ。だが、人の知性との違いはDALL-EよりGPT-3の方が説明しやすい。

人の想像する「スパゲティでつくられた騎士」とDALL-Eの生成する画像を比較して説明するのは難しい。しかし、GPT-3の生成する文の問題は既に指摘されており、GPT-3が意味を理解していないのは明らかである。

世界を理解していないAI(ただしそれは欠点ではない)

GPT-3を単純に説明すると、語同士の高度な連想ゲームである。連想ゲームもあそこまで高度になると文法的な文を生み出す…と分かったのは大きな発見ではある。しかし、現実の世界ではありえない意味内容の文を平気で生成するので、現実的な存在論(オントロジー)を持っているとはとても思えない。

つまり、GPT-3もDALL-Eも高度な相関や(パターンの)類似を学んでいるだけであり、向こう側にある世界の因果や構造まで学んでいる訳ではない。

しかし、これは逆から捉えることもできる。現実の人間は、世界の因果や構造を前もって想定することで少ないデータからでも規則性を学べる。だが逆から見れば、世界についての想定が邪魔をして、学べる規則性に限界があるとも言える。人のバイアスとはそういうものだ。

おわり

AIを人の知性と似せる汎用人工知能の研究もあり、それはそれで興味深い。だが、現在急速にに発展しているのは、人の知性とは異なる道を歩むAIの方だ。

AIを人の知性と同じ基準で測って、超える超えないで騒ぐシンギュラリティなんて下らない。人とは異なる方向に知性が発展していくAIにもっと想像を巡らすべきだ。


  1. ただし、WIREDの記事には混乱がある。『カーシック・ナラシマンは、DALL-EもCLIPも、どちらも「すごい技術だ」と興奮を隠せない』とあり、まるでDALL-EとCLIPを同等の技術として並べている。記事を読んだ私の印象では、画像を生成するプログラムの名前がDALL-Eで、そこで用いられている技術の名前がCLIPな気がする。CLIPを自動運転のプログラムにも応用できるはず…という内容なので、これが正しい理解だと私は思うが、正確には各自で確認してください。どうであれ、DALL-Eは大量のデータセットを使っているはずなので、このブログ記事の本文には影響はない

なぜ陰謀論を信じるのか?の説明を説明する

最近相次いでラジオで、なぜ陰謀論を信じるのか?を学者が説明するのを聞いた。その説明がどのくらい説得的か?は色々だった。だが、それらを聞いていて何より感じたのは、これは単一の要因で説明できるような代物ではない…という強い感覚だった。

なぜ陰謀論を信じるか?のラジオで聞いた説明を順不同で挙げると、心理学者による認知バイアス政治学者による動機づけられた推論説宮台真司による権威主義的パーソナリティ説、があった1

このうち、認知バイアスと動機づけられた推論は人の一般的特性による説明宮台真司による説明は人の類型的特性による説明で、世の中で聞く説明にはこのどちらかに当てはまるものが多い。

動機づけられた推論について

この中で私が最も感心したのは、動機づけられた推論説だ。このブログでも前に注で動機づけられた認知として触れたのと同じ現象だか、(認知バイアスに比べて有名ではないので)知ってる事自体に驚いた(ただし、これに言及してる翻訳書は最近出てた)。

動機づけられた推論(motivated reasoning)とは、動機が推論に影響を与える現象だ。例えば、動画でスポーツの審判をさせると、同じ場面を見ていても自分のひいきするチームを有利な判定を下しがちになる。これは意図的にそうしてる訳ではない(本人は公正なつもり)なのが重要だ。

陰謀論を信じる心性を説明するには、認知バイアス説よりも動機づけられた推論説の方がよくできてる。なぜなら、単にすべての人に当てはまる認知バイアスより、その人の動機や欲求によって説明する方が、陰謀論を信じる人と信じない人の両者がいる事をうまく説明できるからだ(ただし元々の動機までは説明できない)。

個人の性格による説明

陰謀論を信じる人と信じない人の両者がいる事を説明できる点では、権威主義的パーソナリティ説は悪くない。ただ、これはナチス支持者を調査したフロムらによる研究が元なので、古い感は拭えない。しかし、目の付け所は悪くない。

おそらく現代でこれに当たる説明は、性格のビッグファイブの援用だろう。ビッグファイブはあのケンブリッジアナリティカにも用いられた心理学理論で、まさにフェイク(嘘)を信じ込ませるのに利用された。なぜもっと取り上げる人がいないのか?よく分からない。

とはいえ、人の一般的特性であれ類型的特性であれ、今だけでなく普遍的に人に当てはまることが前提なので、なぜ現在に陰謀論がこんなにも影響があるのか?には答えられていない2

フィルターバブルの影響

人の特性だけでは説明できないなら、その環境や社会にも説明を求めることになる。そんな説明の代表の一つがフィルターバブル説だ。

しかし、フィルターバブルは陰謀論を信じる維持をする役割は果たすが、そもそも陰謀論を信じるきっかけにはならない(なぜならきっかけはまだ情報がフィルタリングされる前だからだ)。

それから、ネットで異なる見解に触れてると意見が穏健になるとする人もいるが、これは根拠がない。まず、意見が中間的3なのは穏健のせいか?無関心のせいか?区別がつかない。なにより、集団分極化現象によって、反対の見解に触れることで、かえって元の見解を強めることが知られている。

メディアの限定効果説について

これもまた宮台真司がラジオで挙げていたのが、メディアの限定効果説だ4。メディアの影響を直接受けるとする弾丸効果説に対して、周りの人の評価を介してメディアは影響するとするのが、限定効果説だ。確かに、これは現代における個々人が別々にコンテンツに触れる状況に対応していて、(つまり誤りが他人に指摘されにくいので)納得できる所はある

ただこれも、たまに聞く最近自分の年配の親がYouTubeを見てネトウヨ化したという話があるが、結局は息子や娘のそれは間違っているとする意見を聞かなかったりする。弾丸効果説がそのままでは正しくないとしても、限定効果説がどう成り立っているのか?もよく分からない。

とりあえず終わり

他にも、なぜ陰謀論を信じるのか?の説明はあるかもしれないが、ラジオで聞いたのを含めて思いつく説明はだいたい書いてみた。

はっきり言えるのは、単一で説明できるこれだ!という説はなさそうなことだ。別の決定的な説明がある可能性もあるが、それよりも考えられるのは、いくつかの要因が重なっていることだ。

しかし、現代においてそうした知識が複数の分野にわたる説明をするのは難しい。各専門分野が専門分化されており、それらを正しく知るのも大変だが5、ましてやそれらをどう組み合わせるべきか?はもっと難しい。


  1. 認知的不協和理論による説明も聞いた覚えがある。認知的不協和理論では、例えば、作業をした後にもらった報酬が少ないと、その作業は楽しかった(役に立った)とすることで、心の不協和を直すとされる。だが、どう不協和を直すと陰謀論を信じるようになるのか?イマイチよく分からない

  2. もう一つ思いついた説明に、存在脅威管理理論もある。だが、単なる不安ではなく死の脅威を感じたときだけに現れる現象というのは、説明としてとても使いにくい。現代の人々に日々死の脅威を感じてる人が多くいるとでも?もしそういう研究結果が出たなら、この説明は採用します(それまでは保留)

  3. ここはあえて中立的とは書かない。両極端の真ん中が中立とするのは完全な幻想だ。両極端がズレれば、真ん中は簡単に移動する。だいたい、事実と嘘の中間が中立的だと思ってるとしたら、その人はむしろどうかしてる。客観的な証拠に基づいて事実を確定する方が、中立的のはずだ

  4. ただし、私は最近のメディア研究についてはあまり知らない。だから、この説が現在、どれくらい検証されているか?もよく分からない

  5. 私はネットで日本語で認知科学について調べているときに、他分野の学者の論文を読むこともよくある。単なる知識のひけらかしは論外としても、それおかしくない?という記述は幾度か見たことがある。学者とされてる人でも、そんな人はいる。本文では触れなかったが、知性が低いから陰謀論を信じる訳ではない。実際に賢い人が陰謀論を信じる現実もある。賢い人はもっともらしく情報を組み合わせるのが得意なので、かえって陰謀論を信じて続けるようだ(その場合は、事実に反してるのは論外としても、情報の選択や重み付けがおかしい場合がよくある)