最近の認知科学の哲学における用語「実在論」の濫用を憂う

前回の記事では、科学における実在論(realism)を取り上げた。あらためて、該当箇所を引用しておこう。

科学哲学にはある大きな論争がある。それは、科学的に観察できない現実を信じることは正当化されるか?(実在論)、観察できない何かは科学的に観察できることを説明する助けになる補助的な構成物であるか?(道具主義)、との論争である。論争の細部を無視すれば、この疑問への答えはモデルを用いることと部分的に関係があると考えている。

google:Jelle Bruineberg Krzysztof Dolega Joe Dewhurst Manuel Baltieri The Emperor’s New Markov Blankets p.31より

最近の認知科学の哲学の論文には、実在論という用語を見かけることが多い。しかし、その実在論という用語の用い方は私から見ると違和感を感じることが多い。前回の記事では引用を見れば分かるように、実在論論争はアナロジー的な比較対象として参照されてるに過ぎない。だが、最近に見かける認知科学の哲学では、実在論という用語が直接に使われているが、どうもその使用法が怪しく見える。

ベイズ認知科学実在論

上の引用からも分かるように、科学的実在論の論争では電子のような直接に観察できない対象の実在性が焦点となる。これを(計算主義的な)認知科学にそのまま応用すると、議論がおかしなことになる。

心的過程のべイズモデルが説明に成功したとき、科学的実在論ならばモデルはだいたい真実であるとする理由があることになる。モデルが近似的に真であるなら、そのモデルで描写されるようなおおよその心的状態が存在して、心的活動はそのモデルでおおよそ描写されるそれらの状態の間を推移するとされる。

google:Michael Rescorla A Realist Perspective on Bayesian Cognitive Science p.26より

これを読んでよく分からないのは、電子に当たる観察できない対象がベイズ認知科学にそもそもあるのか?という疑問である。単にベイズモデルが現実の説明に成功したとしても、必ずしも何かの存在が措定される訳ではない。反実在論的に、引用にある「心的状態が存在」を「心的状態を仮定」に置き換えても、説明に支障が出てくるようには思えない。

統計的分析を例に挙げると分かりやすい。アンケートの結果を因子分析して隠された因子を明らかにしたとして、その因子による現実の説明に成功したとしても、その因子の存在を前提にする必要はない。性格のビッグ5モデルはそのような典型例であるが、性格因子の存在を認めるべき!と主張する必然性がある訳ではない。

ベイズ認知科学が現実の説明に成功したとして、そのベイズモデルの意義や位置づけを問題にすることはできるが、ベイズモデルによって何らかの特別な存在を認めるべき!とするのは多くの前提を含んだ相当に強い主張だ。そして、そんな強い主張をしている科学者を(少なくとも私は)見たことがない(少なくとも主流ではない)。そんな科学者の存在こそ一部の哲学者の妄想でしかない。

認知科学における表象の実在論

最近の認知科学では、新しいタイプの表象主張論争が盛んだが、その定式化には疑問に感じることも多い。

表象についての最も影響力のある実在論的な理論には、私が堅固な実在論と呼ぶ見方に属するものがある。堅固な実在論の目的は、表象を自然化し、純粋な自然主義的で非表象的な用語で説明することである。

google:Dimitri Coelho Mollo Deflationary Realism : Representation and Idealisation in Cognitive Science p.5より

この引用の説明を読むだけでも、それは表象の自然主義1であって、表象の実在論と呼ぶゆえんがあるように見えない。この引用文の後で実在論者の例としてドレツキやミリカンが例として挙げられる。だけど、ドレツキやミリカンが表象についての自然主義者だとはよく言われるけど、表象についての実在論者とするのは無理があると思う。

おそらく、この謎の強引な名付けには反表象主義が関連してると思える。反表象主義とは本来は反古典的計算主義なのだと思うが、今では反計算主義や表象一般の否定にまで拡張してしまっている。しかし、計算や表象の意味合いは昔の認知科学とはかなり変わってしまったので、昔の議論はそのままでは当てはまらないのだが、反表象主義の議論が特に現在に合わせて更新されてはいない。

現在の認知科学における新しい表象主義者の多くは、表象の存在を主張していない。それなのに、表象の実在論と名付けるのは、私には印象操作の悪意にしか見えない。

現在の認知科学の哲学での争点は実在論にはない

最後に、フリストンやアンディ・クラークが共著者となっている、表象主義論争についての論文から本質をついている箇所を引用します。

ショーン・ギャラガーのコメントを借りると、表象をめぐる争いで賭けられているのは、表象が存在するかどうか?ではなくて、問題なのは、認知において表象が役割を果たしているかどうか?の方だ

google:Axel Constant, Andy Clark and Karl J. Friston Representation Wars: Enacting an Armistice Through Active Inference p.10より

現在の表象主義も反表象主義も、現実をうまく説明できれば良いとする(弱い)プラグマティズムは共有できるはず2だから、それを前提にした上で議論が推し進められることを望む。


  1. 自然主義という言葉が哲学において多義的に使われている問題はここでは脇に置く。ここでの表象の自然主義の場合は、表象を因果や法則のような自然的な性質で説明できることだ

  2. (弱い)プラグマティズムの前提さえ受け入れていないなら、残るは反科学主義にしかならないので、それは別に対処する必要がある。正直、(明確にそう主張していなくとも)その匂いのする哲学者はいなくもない。

フリストンブランケットはどんな科学モデルなのか?

論文「皇帝の新しいマルコフ織物」

今回、ある程度突っ込んで紹介したいのは、次の論文だ。

google:Jelle Bruineberg Krzysztof Dolega Joe Dewhurst Manuel Baltieri The Emperor’s New Markov Blankets

論文のタイトルは、おそらくペンローズ「皇帝の新しい心」からのもじりだと思う(元々のもじり元があるのかもしれないが私はよく知らない)。共著者に私がここで2010年台のベスト論文に選んだ学者もいたので期待してたが、実際に中身を見てみるとなかなか面白い。

マルコフブランケットとは?

この論文では、フリストンの自由エネルギー原理で用いられているマルコフブランケットを検討している。マルコフブランケットとは、ベイジアンネットワークの一種で、物事同士の確率的な関係をつなげて並べたものだ。そのネットワークの図式化が織物(ブランケット)の糸が絡み合った感じに似ているので、そう呼ばれている。

ここではマルコフブランケットについて説明するのが本筋ではない上に、どうせインターネット上に色んな説明があるはずなので、詳しく知りたい人は調べてみてください。ただおそらく、マルコフブランケットについてあまり理解してなくても、以下でする科学モデルについての議論はそれなりには読めるとは思います(たぶん)。

フリストンは、マルコフブランケットを科学モデルとして使用しているのだが、その使用法に疑問を呈するのがこの論文だ。

マルコフブランケットの二つの利用法

フリストンは、マルコフブランケットを生物をその環境と隔てる境界を見つけるのに用いている。生物が身体を動かすと、基本的に身体だけが動いてその環境はそのままだ。大雑把に言えば、生物が制御できる身体の範囲が生物の境界であり、その境界の辺りで物質間の因果関係が断絶しているはずだ。

マルコフブランケットは、元々はパールという学者によって有名になったベイジアンネットワークの一種である。しかし、フリストンのマルコフブランケットの用い方はパールの用い方とは違っているようだ。そこで、マルコフブランケットの使用法をそれぞれパールブランケットとフリストンブランケットと名付けて分けて考えようとしている。

パールブランケットとフリストンブランケットの違い

マルコフブランケットをどう科学モデルとして利用するか?について、どう考えればよいのだろうか

科学哲学にはある大きな論争がある。それは、科学的に観察できない現実を信じることは正当化されるか?(実在論)、観察できない何かは科学的に観察できることを説明する助けになる補助的な構成物であるか?(道具主義)、との論争である。論争の細部を無視すれば、この疑問への答えはモデルを用いることと部分的に関係があると考えている。

google:Jelle Bruineberg Krzysztof Dolega Joe Dewhurst Manuel Baltieri The Emperor’s New Markov Blankets p.31より

科学モデルについての実在論道具主義の考え方は、マルコフブランケットの使用法にも応用できる。パールは主観的確率を採用していることでも知られており、マルコフブランケットの使用も道具的なものに近い。しかし、フリストンはどうも様子が違う。

モデルでの推論(inference with model)とモデル内の推論(inference within inference)との違いは、大雑把にパールブランケットとフリストンブランケットの使用に対応する。これは、後者の構成における隠された交換条件(payoff)が前者よりもかなり雑な理由である。モデルでの推論では、図式的なモデルは科学者が推論を行なうための認識的な道具である。モデル内の推論では科学者は場面から消えて、目の前で起こる解きほぐされる推論の単なる観察者となる。ここでは、フリストンブランケットは推論の構造を表している。つまり、どうすれば生きたシステムと分かり、このシステムと環境との間の境界を定められるのか?を明示しているのだ。

google:Jelle Bruineberg Krzysztof Dolega Joe Dewhurst Manuel Baltieri The Emperor’s New Markov Blankets p.40より

(マルコフブランケットではないが)ベイジアンネットワークは認知モデルとしてもよく使われているが、その場合はパールと同じで主観的確率が前提にされており、あくまでモデルは道具的に使われている。しかしフリストンの場合は、マルコフブランケットを現実をそのまま映し出したものとして使っているようで、単に道具的に使っているとは言いがたい。

モデルとして曖昧な位置にあるフリストンブランケット

結局、この論文で示された考察では、自由エネルギー論者をジレンマに陥らせたままになる。一方で、自由エネルギー論者は、単に道具的な解釈を許す、マルコフブランケットの素朴な概念を受け入れられる、[…中略…]、他方で、現実の持つ数学的な構造について強い形而上学的な前提を幾つも取り入れることができる、そうして主体と環境との間の文字通りの境界となるブランケットとなる実在論的な読み方を支持することになる。

google:Jelle Bruineberg Krzysztof Dolega Joe Dewhurst Manuel Baltieri The Emperor’s New Markov Blankets p.42より

なぜフリストンにおけるマルコフブランケットの使用法がこのような曖昧な位置にあるのだろうか?

パールの場合は、モデルは現実を推測するための道具として端的に使われている。しかしフリストンの場合は、モデルは現実の物質的な構成を推測するための道具でもあるが、さらに生物と環境との境界を見つけるためにも使われている。この推論の二段階の使われ方がフリストンにおけるモデルの位置づけを複雑にしている。

つまり、まずは現実の物質的な構成をモデル化した上で、そこから生物と環境の境界を推測している。後半の境界の推論においては、モデルが現実を映し出していること(自然の鏡!1)が既に前提にされている。まさに、これこそが「モデル内の推論」と言われるゆえんだ。

個人的な感想

私の印象では、フリストンブランケットのこうした特徴は、自由エネルギー原理において認知モデルの層と物理主義の層が分かれていて、その二つの層が実はつながっていないことの反映のようにも見える。

たたでさえ、予測処理理論が少なくとも統一理論としては怪しく思えてきてるのに、さらにフリストンのマルコフブランケットの使用にも疑問があるとなると、自由エネルギー原理にどこまで期待してよいのか?私にはよく分からなくなってきた。


  1. ローティの著作「哲学と自然の鏡」より

画像生成プログラムDALL-Eから人の知性を考える

WIREDの記事はいつも楽しみに読んでいるが、最近はこんな記事が面白かった。

AIは人の知性とは異なる道を歩む

この記事を見てあらためて思うのは、現在の人工知能は生きた知性とは全く違う道を歩んでいるということだ。そこで思い出すのは、スタニスラフ・レム「砂漠の惑星」だ。

私はそこまでのSF好きではないが、私の読んだことのある中で最も好きなSF作家はスタニスラフ・レムだ。レムほどに生命やAIについて科学的な洞察に富んでいるSF作家を私は知らない。その中でも「砂漠の惑星」はかなり好きな作品だ。

粗筋の紹介はここでは省くが、この作品の洞察の一つが、生命やAIを私達の想像の範囲内に収めることへの批判だ。よくあるAI脅威論とは、AIを私達の想像の延長にある脅威として描いている安っぽいSF的想像に過ぎない。

しかし、それはAIが私達とは全く異なる知性へと発展する可能性に目をつぶることにしかならない。そして、今回の記事も現在の人工知能が、生きた人間の知性とは別の方向に向かっていることを示している。

画像生成プログラムを人の知性と比べる

この技術は「CLIP」と呼ばれ、人間の脳が学習する仕組みに着想を得て考え出された人工ニューラルネットワークというアルゴリズムで構成されている。そして、ネット上にある何億もの画像とそれに付随するキャプションを使って学習し、それぞれの画像の正しいラベルを予測するように訓練されている。

http://https://wired.jp/2021/02/11/ai-go-art-steering-self-driving-car/」より

現在のニューラルネットワークが、(着想と元ではあるが)現実の人の脳にあまり似ていないことは前にも指摘した。そして、WIREDの記事で紹介されている「DALL-E」もやはり、話題になった「GPT-3」と同じく生きた人の知性とは似ていない。その理由は刺激の貧困問題にある。

刺激の貧困問題(別名はプラトン問題)とは、チョムスキーが指摘した有名な問題だ。つまり、人はなぜそこまで多くの(言語)刺激に触れていないのに文法(規則性)を理解できるのか?という問題だ。しかも、この指摘の背景にはスキナー流の行動主義への批判があった。(心理学的)行動主義とニューラルネットワークとの関係を考えれば、これは興味深い問題だ。

引用から分かるように、今回発表されたプログラムもネットからの大量のデータセットを用いている1。もちろん、これは実際の人の知性が行なっていることとは異なるし、似てもいない

今のAIが人の知性と似ていないもう一つの理由

リンク先にある「スパゲティでつくられた騎士」の画像を見ると圧倒されてしまうが、これを生み出したアルゴリズムは、現実の人の知性とは似ていない。最近自然な文を生成することで話題になった、同じくOpenAIによって開発されたGPT-3も事情は同じだ。

GPT-3もDALL-Eと同じく、大量のデータセットを用いていてニューラルネットワークに学習させているのは共通だ。だが、人の知性との違いはDALL-EよりGPT-3の方が説明しやすい。

人の想像する「スパゲティでつくられた騎士」とDALL-Eの生成する画像を比較して説明するのは難しい。しかし、GPT-3の生成する文の問題は既に指摘されており、GPT-3が意味を理解していないのは明らかである。

世界を理解していないAI(ただしそれは欠点ではない)

GPT-3を単純に説明すると、語同士の高度な連想ゲームである。連想ゲームもあそこまで高度になると文法的な文を生み出す…と分かったのは大きな発見ではある。しかし、現実の世界ではありえない意味内容の文を平気で生成するので、現実的な存在論(オントロジー)を持っているとはとても思えない。

つまり、GPT-3もDALL-Eも高度な相関や(パターンの)類似を学んでいるだけであり、向こう側にある世界の因果や構造まで学んでいる訳ではない。

しかし、これは逆から捉えることもできる。現実の人間は、世界の因果や構造を前もって想定することで少ないデータからでも規則性を学べる。だが逆から見れば、世界についての想定が邪魔をして、学べる規則性に限界があるとも言える。人のバイアスとはそういうものだ。

おわり

AIを人の知性と似せる汎用人工知能の研究もあり、それはそれで興味深い。だが、現在急速にに発展しているのは、人の知性とは異なる道を歩むAIの方だ。

AIを人の知性と同じ基準で測って、超える超えないで騒ぐシンギュラリティなんて下らない。人とは異なる方向に知性が発展していくAIにもっと想像を巡らすべきだ。


  1. ただし、WIREDの記事には混乱がある。『カーシック・ナラシマンは、DALL-EもCLIPも、どちらも「すごい技術だ」と興奮を隠せない』とあり、まるでDALL-EとCLIPを同等の技術として並べている。記事を読んだ私の印象では、画像を生成するプログラムの名前がDALL-Eで、そこで用いられている技術の名前がCLIPな気がする。CLIPを自動運転のプログラムにも応用できるはず…という内容なので、これが正しい理解だと私は思うが、正確には各自で確認してください。どうであれ、DALL-Eは大量のデータセットを使っているはずなので、このブログ記事の本文には影響はない