自由エネルギー原理にとりあえずの見切りをつけるために考えてみた

自由エネルギー原理には前々からしっくり来るところがなかった。私自身は予測符号化について勉強することから始めたので、自由エネルギー原理には後から接したことになる。自分は予測符号化には好意的だ。 しかし、自由エネルギー原理の源には予測符号化があるはずなのに、自分は自由エネルギー原理にはどうも馴染めなかった

自由エネルギー原理は現在流行っている最中で、認知科学オタクの私としては無視しきることはしがたい。とはいえ、予測符号化の拡張としての予測処理には個人的に興味が持てるのだか、自由エネルギー原理と予測処理との関係にははっきりしないところがあって、ずっとモヤモヤが拭えなかった

Daniel Williams "Is the brain an organ for free energy minimisation?"を読む?

そこで見つけたのが、つい最近出たばかりの次の論文 Daniel Williams「脳は自由エネルギー最小化のための器官なのか?」だ

Daniel Williamsは、私が前に2010年代のベスト3論文に選んだ著者の一人でもある。彼のいいところは他の学者が臆して書かないことを率先して書いてしまうことだ。前にベスト3に選んだ論文でも予測処理に群がるenactivismをくさしていたのが爽快だった。この論文もまだ他の学者が臆しがちな自由エネルギー原理への批判的論評をまるまる一本の論文で行なっている

同じく自由エネルギー原理でも、マルコフブランケットの使用を批判した論文は既にこのブログでも紹介したことがあるが、その後も(マルコフ一元論を含めて)同じテーマについての批判的論文が幾つも書かれている。だが、自由エネルギー原理の本丸である自由エネルギー最小化については、なかなか扱われにくかった

Daniel Williamsの論文にざっと目を通した後に、ブログ記事を書いて考えを整理して自由エネルギー原理に対して区切りをつけよう(わざわざ追うのはやめて様子見に移行しよう)とした。そこでこの記事を書くために改めて論文を読み直してみると、納得しがたいところが目につくようになった。論文の内容にそのまま沿って記事を書くのはどうもマズそうになってきた

自由エネルギー原理の基本を確認する

自由エネルギー原理について本気で説明しだすと大変なことになるので、最小限の説明を引用で済まします

自由エネルギー原理(FEP)を巡る現在の関心と論争の多くは、二つの特徴的な主張から起こっている:(1)それ(FEP)は自己組織化するシステムが存在する可能性の条件を定める、つまり「自由エネルギーを最小化しない自己組織化するシステムは存在できない」。(2)そこ(FEP)には、どのように脳が働くかを我々が理解するための重要な含意があり、「脳の統一理論」(Friston)や「認知科学と生物学のための大統一原理」(Hohwy)が提示されている
Daniel Williams "Is the brain an organ for free energy minimisation?" p.2より

ここで扱うのは主に一つ目の自己組織化システムの主張であり、二つ目の統一理論の主張はせいぜい副次的にしか問題としない。

次に、ここで大きな問題となるのが、自由エネルギー原理と予測処理論との関係だ。これについては以下の引用が参考になる

生物学的なシステムの適応的行動についての自由エネルギー手法(FEA)の見方には、驚き最小化が予測処理論で示されるような階層的モデルによって実行されるべきと要求する何かがあるわけではない…と気づく価値はある。とはいえ、他の予測処理論の文献では自由エネルギー手法と予測処理論の間にはきっちりした関連があるとする論者がいる…と分かっておくのも重要だ
María Jimena Clavel Vázquez "A match made in heaven: predictive approaches to (an unorthodox) sensorimotor enactivism" p.664の注13より

自由エネルギー原理と予測処理論は安易に一緒に語られがちだが、その関係は必ずしも明確なわけではない。上の引用で指摘されていることは、各種の数理モデルを比較した論文からの次の引用が明示している通りだ

自由エネルギー原理(FEP)は正確には何を予測し何を予測しないのか?この話題について語るのは易しくない、なぜなら自由エネルギー原理の適用の基盤に横たわる仮定は従順に変わりうるからだ(異なる適用によって異なる生成モデルや異なるアルゴリズム的な近似や異なる神経的な実装となる)
Samuel J. Gershman "What does the free energy principle tell us about the brain?" p.1

自由エネルギー原理と予測処理論に直接のつながりがある訳ではないことを、Daniel Williamsは「予測処理への高架道はない」("There is no high road to predictive processing")と表現している。Daniel Williamsはそれを示すために、自由エネルギー原理(FEP)を説明的FEPと記述的FEPの二つの可能な解釈に分けて説明している

自由エネルギー原理についての超越論的議論

実はDaniel Williamsの論文は、ここからが肝であると同時に罠だらけでもある。説明的FEPと記述的FEPについて議論する上で、超越論的議論(transcendental argument)にかなり頼ることになる。だが困ったことに、論文中に超越論的議論についてはあまり説明されていない

超越論的議論とは、カントを源としストローソンやストラウドが定式化した議論であり、ある物事が成立するための条件(前提)を問う形の議論だ。ものすごく単純化した分かりやすい例を挙げると…なぜ私達は因果を理解できるのか?それは私達には因果を理解できる能力があるからだ…となる1

では、自由エネルギー原理についての超越論的議論とはどんなものだろうか?

つまり、生きたシステムは驚きを最小化するはずだという主張は、自由エネルギー原理(FEP)そのものと置き換えられる。「非均衡安定状態を達成する全ての『もの』は、基礎的なベイズ推論(要するに自由エネルギー最小化)を成し遂げるかのように説明できる」
Daniel Williams "Is the brain an organ for free energy minimisation?" p.6より

要するに、自由エネルギー原理を前提にすると生きたシステムを上手く理解できます…ということだ。この超越論的議論を軸にして説明的FEPと記述的FEPについて論ずることになる

説明的FEPと記述的FEPを論ずる

説明的FEPと記述的FEPの違いは、自由エネルギー原理をどう解釈するか?にある。簡単に説明すると、自由エネルギー原理がメカニズムを表しているとするのが説明的FEPであり、自由エネルギー原理は説明ではなく現象の再記述だとするのが記述的FEP

ただ問題は、ここからのDaniel Williamsの説明的FEPと記述的FEPついての議論は興味深いが納得しがたい微妙さもあることだ。なので、ここからは私自身の見解を大きく交えることとなる

説明的FEPを吟味する

説明的FEPについては、超越論的議論を持ち出して話がややこしくはなっている。簡単に言えば、自由エネルギー原理はメカニズムを特定しないので説明的FEPには問題があるとなっているだけだ2。どうもDaniel Williamsの議論に切れを感じれない

個人的には、自由エネルギー原理はもともと予測符号化を源にしてるが、予測符号化以外のメカニズムも含みうるのにそれが特定化されていない…という状況が奇妙でしかない。私からすると説明的FEPは間違っているというより、正しいメカニズムがまだ分かってないのに、自由エネルギー原理が前もってメカニズムに限定を与えてるのが余計なお世話にしか見えない

正直、説明的FEPが正しいのかどうか?私には判断しきれないけれど、現時点において研究プログラムとして有効とはあまり思えない。メカニズムの研究は自由エネルギー原理とは独立にやればいいのであって、自由エネルギー原理からのメカニズムへの一方的な制約に意義があるとはどうも思えない

記述的FEPを吟味する

記述的FEPとは、(メカニズムによる説明というよりも)生き物の行動を「自由エネルギーの最小化を含んで再記述できる」(Daniel Williams 2021,p.12)とする解釈だ3

これについては、論文でも挙げられている合理的選択理論や進化生物学で行われているゲーム理論(進化ゲーム)による理論を想定すると分かりやすい。ゲーム理論(進化ゲーム)による説明は、行動のあり方のマクロな動きを説明してるだけで、個々の行動主体の行動決定のメカニズムを特定することはない。同じように、自由エネルギー原理も行動のマクロな描写を数理的にしているだけなのだ。

説明的FEPより記述的FEPの方がまだ説得力がある…とは感じる。ただ問題は、メカニズムと関係ない自由エネルギー原理がどう(メカニズムを扱う)認知科学にとっての統一理論たりうるのか?よく分からなくなることだ。少なくとも、予測処理論への通路は明示な形ではなくなってしまう。結果として、元々の源であった(メカニズムとしての)予測符号化との関係もよく見えなくなる。思ったよりも失うものが多そうだ

これは個人的に気づいたことだが、ゲーム理論とのアナロジー4を見てたら、自由エネルギー原理が本当に非均衡システムなのか?疑いが生じた。もちろんゲーム理論はたいてい均衡システムなのだが、自由エネルギー原理も均衡点がありうる気がする

例えば自由エネルギー原理でも論じられる真っ暗闇問題(dark room problem)とは、刺激がなければ驚き(予測誤差)も起こらないので動く必要がなくなる問題だ。ということは、自由エネルギー原理での振る舞いの複雑さは環境の複雑さを反映してるだけであり、環境が単調なら均衡点が存在しうるはずだ。もしかしたら自由エネルギー原理は偽装した均衡システムかもしれないが、だとしてもそれは予測処理論にも当てはまるのでここではこれ以上は議論しない5

おわりに

ここまで自由エネルギー原理の解釈をいろいろ論じてきたが、正直なところ自由エネルギー原理に見込みがあるのか?は私にはよく分からない。たとえ自由エネルギー原理が間違っているとしても、科学的な研究プログラムとしては(批判も含めて)様々な研究を生み出す点で生産的である可能性もあるので、安易に否定しさることはできない

それより問題は、自由エネルギー原理の解釈が曖昧なことで混乱も起こりうることだ。例えば、自由エネルギー原理にはenactivistも多く関わっている。その中にはラディカルな反表象主義者もいるが、それも自由エネルギー原理が力学的アプローチと友好的に見える解釈をも許してしまう曖昧さに原因がある。自由エネルギー原理は計算主義との関係を明確にするべきだ!と個人的には思う

何が正しいのであれ、どっちにせよ明晰な議論は必要であり、Daniel Williamsはそれを求めてこの論文を書いたのだ。そして、それは私の望むことでもある


  1. これはトートロジーでは?という批判は受け付けない。文句のある奴は自分で勉強しろ!超越論的議論についての説明はここでの主眼ではない

  2. ワットガバナーや境界を持った人工知能を挙げて、それらが変分ベイズが実装されてる訳ではない…とする説明もあるが、そもそもそれらは自己組織化システムとして相応しい事例なの?と疑問しかない

  3. 記述的FEPにとって、必要なデータが行動だけなのか?例えば脳の物理的状態のデータは必要ないのか?いろいろ疑問が湧かなくもないが、話がややこしくなりそうなのでここでは問わない

  4. 自由エネルギー原理でよく見る四対の図が社会学パーソンズAGIL理論と似ていることも均衡システムを思わせたきっかけだが、私は社会システム理論にそこまで詳しくない上に話がややこしくなるので、本文では省略した

  5. 物理学的な均衡とゲーム理論における均衡は違うよ!と言う人はいるかもしれないが、そもそも自由エネルギー原理が物理的レベルの話なのか?情報的レベルの話なのか?(ここまでの議論を見ても)よく分からない。物理的には非均衡システムだが情報的には均衡システムだ…というのは、もしかしたらあり得るのかもしれないが、ならば曖昧にごまかさずにちゃんとそういう議論もしろ!…としか言えない