反表象主義を思弁的実在論の視点から説明してみる〈前編〉

認知科学における一立場である反表象主義については、このブログでも折りに触れて軽くは言及してきた。しかし、反表象主義について独立した記事を書くのはずっと躊躇してきた。

それは、私が反表象主義に批判的なのに日本では反表象主義がほとんど知られていない状況の中で、どうバランスを取るべきか分からなかったのはある。と同時に、認知科学の歴史の流れの中で見ると、反表象主義の登場に唐突なところがあり、位置づけがしにくいのもあった。私自身がよく理解できてないものを、他に向けて説明することなどできない。

最近、たまたま機会があって思弁的実在論の入門書を読んだ。その本自体はあまりお勧めできない(どこが入門書やねん!)のだが、この中に思弁的実在論を語用論的矛盾から説明する試みがあるとの記述が目に付いた。分析的に理解できることにすぐ飛びつく私は、ちょこっと思弁的実在論を調べ直してみた。

その中で、あれ?これって反表象主義と発想が似てないか?と思うところがあった。そこで私も発想を転換させて、思弁的実在論の視点から反表象主義を説明してみたい。

反表象主義とは何か?

それを簡単に説明できるなら、こんなに悩んでいない。とりあえず、ある論文にあった反表象主義についての簡潔な説明をそのまま訳してみる。

心は本質的に内容を持つ訳ではない、なぜなら内容を伴う心の哲学的な説明はHPC(内容の難しい問題)の餌食に陥るからだ…とHuttoとMyinは論じている。HPCの議論は次のように再構成できる:

(T1) 認知科学での存在論的な責務として、説明上の自然主義を尊重すべきである
(T2) 言語的な活動は、基礎的な心の範囲外である
(T3) 内容を持つとは、なにがしらの状況に当てはまることを含意し、(もし存在するなら)内包と外延が決まる
(T4) 基礎的な心に内容を帰属するような、内容に関するいかなるありうる理論でも、(T1)か(T2)か(T3)のどれかを満たしえない
(T5) 内容を持つことは表象であることから成り立つ

(T1)から(T5) を組み合わせると、表象主義―認知は本質的に表象を含むとする見方―は間違っている。これは(T4)と(T5)が真であることから直接的に導かれる。これが本当なら、認知科学にとって決定的な重要性があるだろう。

google:Tomasz Korbak"Unsupervised Learning and the Natural Origins of Content"p.2より翻訳

引用中のcontentの訳語は迷ったが、「内容」と直訳することにした。まさに、これをどう理解するかが反表象主義の理解のかなめに当たり、私にとっても躓きの石でもあった。

まずは正統派のやり方で位置づけてみる

認知科学のなかに位置づけしてみる

まずは、反表象主義を認知科学のなかに位置づけてみよう。反表象主義は、認知科学における身体化(今風には4e認知)の系譜にある。その点では、J.J.ギブソンやドレイファスの影響は明らかで、確実にこれはヴァレラ経由だ。

ヴァレラの時代での古典的計算主義批判を反表象主義は受け継いでる。それは上の引用の(T2) にはっきり表れている。ただ困ったことに、反表象主義はそれを現在の計算主義や認知科学への批判へと全面化しているが、もう時代が違う。論理的形式で心の全てを科学的に解明できるとしてる人は今やほぼいない。

ここまで知ってて反表象主義を公正に説明するのは、私には苦痛でしかない。

分析哲学との関連もすこしだけ

反表象主義を説明するもう一つのやり方は、分析哲学の流れの中に位置づけることだ。ローティの「哲学と自然の鏡」での表象主義批判は有名だ。これを直接的に受け継いだのはブランダムだが、そのアイデアは反表象主義も似ている。

ただ問題は、だったらブランダムのように科学とは無関係に哲学理論を組み立てれば良いのであって、余計な認知科学批判はいらない。そんなんだから、ヴァレラと共著者だったエヴァン・トンプソンに、認知科学の文献をもっと勉強しろ!(特にヴィゴツキーやハッチンス)とから言われるんだよ。

後編に続く

長くなったので、反表象主義を思弁的実在論と比較する本論は次回に回します。最後にこれまでの要点と次回の予告

反表象主義は論理・言語の形式を心の基盤に据えることを拒否する考え方である。そこには、意味論的な言語的思考(相関主義)を哲学の中心から追い出そうとする思弁的実在論と似た問題意識がある。

自由エネルギー原理が正しいときの奇跡に気づく

この前の統一理論としての予測処理理論を批判する論文を読んで以来、疑惑の種が私の中に蒔かれてしまった。その後もいくつか関連記事を読んでるけど、あれ?これは?と言った疑問部分が目に付きやすくなってる。

予測処理理論の関連理論の間の関係がよく分からない

最近、予測処理理論の核概念であるActive inference(能動的推論)を主題にした博士論文を眺めた。本体は数理的分析なのだが、その導入となる背景知識の章を読んでたら、論文タイトルに含まれる4e認知の説明がぬるいのにもあきれたが、予測処理関連を含めその他の説明も私には十分に公正なものに思えなかった1

その論文を読んでいてあらためて感じたが、そもそも予測処理理論の関連した理論(予測符号化とかベイズ脳仮説とか自由エネルギー原理とか)との関係がいまいち理解できない。

でなくとも同じくベイジアンが関連した研究である、GriffithsとTenenbaumの研究グループによるベイズを用いた認知モデルや、ベイズを用いた意思決定論も含む合理的選択理論のような研究などにも興味を持っているので、それぞれをどう位置づけすべきかは前から迷っている。なのに、もっと関連が直接的な理論さえ関係性がはっきりしないのは、困っている。

予測誤差最小化なしの自由エネルギー原理?

以前に2010年代の私的ベスト論文の三位に上げた著者であるDaniel Williamsが、最近ネットにあげていた草稿を読んだ。まだ十分に整理されてないがアイデアは面白い論文だったが、それを読んでいたら、ますます私の混乱は増すばかりだ。

Daniel Williamsは博士論文がまるまる予測処理理論だったので、それが専門みたいなものであり、その論文もそれが扱われていた。その中に、予測誤差最小化が間違っていたとしても、自由エネルギー原理が間違っているわけではない…とあって???。FristonとHohwyの間の違いかと思ったら、どうもそうではないっぽい。どうも文字通りの意味らしいが、これで混乱が増した。大黒柱に当たるはずの予測誤差最小化がなくとも自由エネルギー原理が無事って、そんなことあり得るのか?

自由エネルギー原理はFriston本人が関わる論文が山のように出ており、その全体像はFriston本人にしか分からないのでは?と思われるほどの状態だ。もちろん私にも自由エネルギー原理の全体像どころか、本質さえどの程度に理解してるのかも心許ない。その私でさえ、予測誤差最小化なしに自由エネルギー原理が成り立ちうるとの指摘には驚いた。本当なのか?

もはや、ただの妄想的な思考実験

きちんとした判断は保留にするけれど、自由エネルギー原理は強化学習も扱えるとの話も聞いたことがあるので、一概に間違っているとは断言できない。

以下は、私のただの妄想なので、思いっきり眉に唾を付けて読んでください

そこで予測誤差最小化なしの自由エネルギー原理があり得ると勝手に想定してみよう。ならば、脳に関する力学的アプローチとそれと結びついた認知理論を別々に考えた方がいいだろう。でなければ、予測誤差最小化と自由エネルギー原理を別々に切り分けられない。ならば予測誤差最小化は、脳の力学的アプローチと合致する代表的な理論となる。しかし、他にも合致する候補となる理論があるなら、予測誤差最小化は絶対的な必須と考える必要はなくなる。

なら、脳の力学的アプローチと合致すれば良いなら、理論は色々とありうる。強化学習が許されるなら、ニューラルネットワークそのものも構わないはずだ。それどころか、ベイズによる意思決定である合理的選択理論も候補としてあり得る。脳の力学的アプローチと合致するなら、予測や信念が本来の意味か派生的な意味かを気にする必要はもはやないのだ。

ただ困ったことに、合理的選択理論はそのままでは実際の人間の選択行動と合わないことがあるのは知られている(修正理論もあるが、決定版がある訳ではない)。しかし、考えてみればニューラルネットワークだって、現実の人の行動とそこまで合っている訳ではない。脳の力学的アプローチとの合致と現実の行動との合致は別々の基準であり、必ずしも両立している訳ではない。

元の自由エネルギー原理に帰ってみる

しかし、ここで元に帰ってみると、予測誤差最小化だって統一理論としてはまだ問題があるのだから、どこまで現実の行動と合致しているのか怪しいものだ。その可能性があったから、予測誤差最小化と自由エネルギー原理を試しに切り分けてみたのだが、すると脳の力学的動きと現実の行動とは別々の基準による合致なのが分かり、これらを両立させるのは難しい感じがしてきた。

やはり予測誤差最小化なしの自由エネルギー原理は困難そうだ。かといって、予測誤差最小化つきの自由エネルギー原理がうまくいったとしたら、それはそれで(論理的には)かなりの奇跡だと感じる。なぜなら、脳という基準と行動という基準とに別々に合致する必要があるからだ。

自由エネルギー原理が正しいのかどうか?私には現時点では判断できない。それは科学者による検証を待つしかない。それはそれとして、そもそも自由エネルギー原理が正しいとしたら、それは結構な(論理的な)奇跡なんだと気づけたのは、今回の収穫だ。


  1. 例えばこの論文に限らず、計算論的アプローチと力学的アプローチが排他的に論じられることは多い。しかし、ニューラルネットワークはこのどちらの特徴も持っているので、排他的とは言いがたい。こうした不勉強な想定の原因は、反表象主義者による古典的計算主義が計算主義の全てだとする無茶な前提に遡れる。その結果、(ベイズ)統計的計算は計算主義に含まれないというさらなる無茶な結論さえ生まれている。こういう認知科学の蓄積を無視したレベルの低い議論には早く消えてほしいと切に願う。

予測処理理論は用語があいまいに使われているのか?

この前、統一理論としての予測処理(PP)理論を批判する論文を読んでいると書いた。それは次の論文だ。

google:Piotr Litwin, Marcin Miłkowski Unification by Fiat: Arrested Development of Predictive Processing には、一通り内容には目を通した。それなりに面白かったが、アンディ・クラークらの予測処理理論のレビュー論文とは真逆としたのは誤解を招く書き方だったなぁ〜と思った。

google:Kevin S. Walsh, David P. McGovern, Andy Clark, and Redmond G. O’Connell Evaluating the neurophysiological evidence for predictive processing as a model of perceptionでは、知覚のモデルとしての予測処理理論を検討している論文だったが、その後に私が読んだ論文はあくまで統一理論としての予測処理理論を批判してるものだった。

つまり、始めに挙げた論文での予測処理理論への批判は周辺的な批判であって、本丸には達していない。知覚は予測処理理論の本丸1なので、これらの二つの論文は互いに相反してはいない(少なくとも直接的には)。

どんな論文を読んだの?

「Unification by Fiat: Arrested Development of Predictive Processing」は訳すなら、「専制による統一:阻まれる予測処理の発展」。Fiatは命令が直訳だろうが、それだと意味が分かりにくい。無理矢理に作られた統一が含意なので、こう意訳するのが良いだろう(こういうのは自動翻訳にはできない)。

専制による統一」は、予測処理理論の応用研究への批判が中心であり、その結果として予測処理理論の統一理論としての意義に疑いを発している。予測処理理論そのものの批判が目的ではないが、そもそもの原因として予測処理理論がもつ用語の曖昧さが指摘されてるので、無傷とも言いがたい。

論文「専制による統一」の全体の紹介は面倒なのでしないが、その一部を日本語の論文を引用しながら説明できそうなので、すこしやってみようと思う。

計算論的精神医学における用語の使われ方

専制による統一」ではいくつかの応用研究が挙げられている。その中でも特にある研究がやり玉に挙げられている。それは、予測処理理論の計算論的精神医学への応用だ。あまりに批判が集中してるせいか、ネットで当人同士で反論合戦が繰り広げられている(Marcin Miłkowskiのホームページを参照)。

比喩として心的用語を使うことの罠

この論文での批判が当てはまる記述が、日本語で書かれた計算論的精神医学の論文に見つかったので、まずはそこを引用してみます。引用で出てくるベイズ推論モデルとは、少し前の記述から自由エネルギー原理(代表的な予測処理理論)だと分かります。

具体的には,うつ病患者が呈する自己・世界・将来に対する否定的な信念は,ベイズ推論モデルにおける信念と考えることができる (Chekroud, 2015)。そのように考えると,認知行動療法で行う認知再構成は,患者のもつ信念とは異なる情報や結果を経験する (予測誤差が生じる) ことで,信念の更新が生じ,否定的な信念の確信度を弱めているのかもしれない。
google:国里愛彦 片平健太郎 山下祐一 うつに対する計算論的アプローチ 強化学習モデルの観点からp.100より

ベイジアンの知識があると、かえっておかしいことは言ってないと思いがちだが、ここでのベイジアンの応用は意思決定論ではないことに注意すべき。そこで、次は「専制による統一」からの引用の翻訳(意訳気味)。

しかし、私達の関心は正確さに限られない。予測・期待・信念のような主観的な領域での、呼び名は同じなのに意味が違うそっくりさんがいる、PPのテクニカルな用語にこそ、あいまいな表現の落とし穴がより強烈な形で待ち構えている。
Piotr Litwin, Marcin Miłkowski "Unification by Fiat: Arrested Development of Predictive Processing" p.7より翻訳

例えば、予測処理理論で使われる予測という用語は、私達が主観的に経験できる予測を意味してはいない。あくまで比喩やアナロジーであって、文字通りに受け取るべきでない。

先の引用部分で出てくる「信念」も、本来は計算論的なモデルのはずだが、「患者の持つ信念」とも言われていて、どうも意味の一貫性が守られてるように見えない(ただし、これは英語の元論文による責任の可能性も高い)。これは予測や信念という言葉の曖昧さの現れそのものだ。

大御所でも筆は滑る

もう一つの引用は、予測符号化の先駆的な研究で知られる乾敏郎による、実質的な内容が計算論的精神医学の論文からだ。

したがって統合失調症では誤ったデータに基づき信念が書き換えられていき,結果として世界について誤った信念を持つに至る.換言すれば,知覚異常が学習によって誤信念を導いたということだろう.
google:乾敏郎 誤った知覚から世界に関する修正不能な信念が生じる脳内メカニズムp.176より

「データに基づき信念を書き換え」るとする記述は誤解を招く微妙な書き方だ。ただこれに関しては、信念を直接に書き換えたとせずに、知覚が信念を導く(信念の形成は結果)と解釈すれば問題はなくなる。しかし、これだけの大御所でも誤解を招かない言い方を避けるのは難しいことが分かる。

予測符号化に遡って本来の適用範囲を確認する

予測処理理論は、元からあった予測符号化を、一般化して適用範囲を広げようとして統一理論を目指した理論だ。適用範囲を広げようとして曖昧さの罠にハマったとされるが、本来の適用範囲はどこまでなのだろうか?

それを確認するには、元の予測符号化に遡れば分かる。しかもそれをすぐに分かる有名論文がすでにある。それはgoogle:Rick Grush The emulation theory of representation: Motor control, imagery, and perceptionだ。これは予測符号化のレビュー論文だけれど、便利なことにタイトルを読むだけで、運動制御・心像・知覚が扱われてると分かる。これに、このレビューが出た頃に既にフリスらによる研究があった自己主体感を加えれば、予測符号化がもともと得意とした研究テーマがだいたい分かる。

予測符号化には信念の書き換えを文字通りに行なうことは、適用範囲内にはない。ならば、適用の拡大が可能だと説明されるべきだが、それを見たことは(少なくとも私は)ない。やはり、用語の曖昧さによる過剰適用だと責められても仕方ないと感じる。

統一理論としての予測処理理論を信じられるか?

自由エネルギー原理に代表される予測処理理論は統一理論を標榜するが、「専制による統一」が示唆するように怪しいところもある。しかも、そのくせ自由エネルギー原理は元の予測符号化には適用範囲に含まれていた心像(imagery)を外すことで、反表象主義におもねっている疑惑が拭えないのは、私には印象が悪い。

ここでは扱わなかったが、「専制による統一」には、後付でもっともらしい話(just-so story)が作られる事の問題や、都合の良い証拠を集めるだけで事足れりとすることの問題(consistency fallacy)など、統一理論としての予測処理理論だけに限らない科学の問題も触れられて、それも興味深い。これらの問題からは、データに基づいた下からの理論形成ではなく、理論が先にあって上から証拠を説明しようとしている点で、専制という訳がまさにしっくりくる。

だがなにより、予測処理理論が統一理論だと信じるには、私は認知科学関連の他の様々な成果や理論を知りすぎてるのはある。それが幸いなことなのか?私自身にはもはやよく分からなくなっている。


  1. ただし、クラークらのレビュー論文が書かれた動機にあるように、知覚でさえ予測処理理論に充分な証拠があると言えるかは疑われている。