最近のWIREDのAI記事をお勧めしてみる(一部コメント付き)

ネットにある日本語で読める信頼できる科学記事…というのはお世辞にも多くない。その中でWIREDの翻訳記事は質の高い信頼できる科学的な記事ばかりで当てになる。特に初期の情報が混乱してた中での新型コロナ関連の記事はとても助かった。

WIREDは人工知能(AI)関連の記事も充実していて、読み応えがある。日本でブームで出てきたにわかのミーハー野郎と違って、認知科学の知識のある人が書いた記事もよく見かける。

WIREDのAIについての短期連載はお勧めしておく

そこでまずは、最近まで短期で連載してた人工知能の連続記事をがお勧めなので、全部リンクしておきます。各記事にコメントしたい欲求にもかられるが、ここでは抑える。





人工知能は常識を身につけられるか?

もう一つのお勧めは、この短期連載の直後にWIREDに掲載された記事。これまでのAI研究の内実を凝縮した記事で、ともかくこれをお勧めとコメントをしたくてこれを書いている。特に上の短期連載を読んだあとで読むと味わい深い。

人工知能は常識を身につけられるか?という問題は、数十年前からずっと言われ続けている問題で、ニューラルネットワークが発展した現代でもほぼ解決してない。

詳しくは記事を読んでもらうとして、相関と因果や統計と論理といった対比はこの問題の基底だか、もうずっと解決してない。ただ、AIの常識問題を見かける度に不思議に思うのは、なぜ常識について論ずるときに身体の話題にはあまり触れられないのだろう?ということだ。

常識と身体の関係を考える

常識は人工知能の世界では長らく問題になり続けている。他方で、特に哲学を中心に心の身体化の議論は大いに賑わっている。なのに、工学者は常識を外側から知識で身につけさせようとし続けており、哲学者は身体については喜んで語るのになぜか常識にはあまり触れない。

どう常識を身につけられるか?には科学的には大きく二つのアプローチがある。一つは(素朴物理学などの)素朴理論を生得的と見るコア知識アプローチであり、もう一つは経験からの獲得であるとする構成主義アプローチだ。これらは必ずしも二者択一ではないにしても、どちらにも身体の視点はまだ弱い。

常識の多くには、世界の中での身体を持った上での経験から身につけられることも多いはずだ。なのに、なぜ常識と身体を結びつける議論は少ないのか?

身体と言語(化された知識)とのギャップ

工学者が常識について語るとき、たいてい知識としての常識を相手にすることが主だが、それはだいたい言語化された知識であることが多い(WIREDの記事も参照)。それに対して、哲学者が身体について語るときは、言語化以前の活動する主体としての身体を話題にすることが多い。ここには明らかにギャップがあって、そのままでは向こう側には渡れない。

身体と言語(化された知識)と間には大きな裂け目があって、ここを超えない限り、常識問題はなかなか進展しないと感じる。ロボティクスの構成主義アプローチも知らなくもないが、それはたいてい物事の分類に留まっていることも多く、(ニューラルネットワークを含む)統計的アプローチとの差がどこまであるかどうもよく分からない。

とはいえ、身体と言語の問題は相当の難所なので、そう簡単には解けそうにない。過去にも様々な優れた学者がそこに挑んできているが、そうは成果は出ない。しかし、本当の問題はその難所に本気で挑もうとする人自体が少ないことの方が、深刻な問題な気もしなくもない。

知覚の予測処理モデルの神経生理学的な証拠を調べた論文を自動翻訳を使った手抜きで紹介する

ネットで調べ物をしてたら、記事タイトル通りの知覚の予測処理モデルの神経生理学的な証拠を調べた論文を見つけました。 google:Kevin S. Walsh, David P. McGovern, Andy Clark, and Redmond G. O’Connell Evaluating the neurophysiological evidence for predictive processing as a model of perception

科学的なレビュー論文なのに、いくらその方面のテーマで有名とはいえ、共著者に哲学者のアンディ・クラークがいるのが驚いた。

で…読もうかなとは思ったけど、正直いって神経生理学は得意じゃない。いや、実質は認知神経科学ばかりなのだろうけど、やはり読む自信がない。

そこで、ここではこんな論文があるという紹介に留めて、内容の検討はその方面の専門家にお任せしたいと思う。でも、最小限の紹介はしたいのだが、どうも面倒くさい。

自動翻訳の出力をそのまま載せる実験的記事にする

そこで、今回は論文の要旨と、核となる四つの仮説を提示する引用を、ネットの自動翻訳で訳してそのまま載せようと思います。一応評判のDeepLを使いますが、読めない翻訳であっても、私に文句を言わないでください。

原文とセットで載せるので、自動翻訳のお手並み拝見程度の気軽な気持ちで見ましょう。

論文の要旨

まずは原文

For many years, the dominant theoretical framework guiding research into the neural origins of perceptual experience has been provided by hierarchical feedforward models, in which sensory inputs are passed through a series of increasingly complex feature detectors. However, the long-standing orthodoxy of these accounts has recently been challenged by a radically different set of theories that contend that perception arises from a purely inferential process supported by two distinct classes of neurons: those that transmit predictions about sensory states and those that signal sensory information that deviates from those predictions. Although these predictive processing (PP) models have become increasingly influential in cognitive neuroscience, they are also criticized for lacking the empirical support to justify their status. This limited evidence base partly reflects the considerable methodological challenges that arepresented when trying to test theuniquepredictions of thesemodels. However, aconfluence of technological and theoretical advances has prompted a recent surge in human and nonhuman neurophysiological research seeking to fill this empirical gap. Here, we will review this new research and evaluate the degree to which its findings support the key claims of PP.

そして、DeepLの翻訳。

長年にわたり、知覚経験の神経起源に関する研究を導く支配的な理論的枠組みは、感覚入力が複雑化する一連の特徴検出器を通過する階層的フィードフォワードモデルによって提供されてきた。 しかし、これらの説明の長年の正統性は、知覚は2つの異なるクラスのニューロンによって支えられた純粋な推論的プロセスから生じるとする根本的に異なる理論によって最近挑戦されています:感覚状態に関する予測を伝達するニューロンと、それらの予測から逸脱した感覚情報を信号化するニューロンです。 これらの予測処理(PP)モデルは、認知神経科学においてますます影響力を持つようになってきているが、その状態を正当化するための実証的な裏付けが不足していると批判されている。 このような限られた証拠ベースは、その一部を反映しているが、その理由としては、予測処理モデルを検証する際の方法論的課題が大きいことが挙げられる。 これらのモデルを用いた研究が行われている。 しかし、技術と理論の進歩のaconfluenceは、この実証的なギャップを埋めるために求めてヒトと非ヒトの神経生理学的研究の最近のサージを促している。 ここでは、この新しい研究をレビューし、その結果がどの程度PPの主要な主張を支持しているかを評価する。

まぁ、そこそこ読めるのでいいんじゃないんですかね。

四つの仮説の提示部分の引用

A variety of PP-consistent modelsb have been proposed, but despite this heterogeneity, there are a number of shared, canonical features that clearly dissociate PP from traditional models of perception. To date, neurophysiological investigations of PP have largely centered around testing four key hypotheses:
1. Error-signaling neural responses to sensory stimuli should scale inversely with expectation. 2. Top-down signals represent sensory prediction. 3. At each level of the cortical hierarchy there are two functionally distinct neural subpopulations representing predictions and prediction errors.
4. Prediction error minimization is achieved through reciprocal exchange of error and prediction signals across levels—a process known as “hierarchical inference.”

以上 google:Kevin S. Walsh, David P. McGovern, Andy Clark, and Redmond G. O’Connell Evaluating the neurophysiological evidence for predictive processing as a model of perceptionP.244より。

以下はDeepLによる翻訳。改行はしてますが、あとはそのまま。数字が二回出るのもそのままだが、実はこれはニューラルネットワークによる翻訳の特徴の一つでもある。

様々なPP整合モデルが提案されているが、このような不均一性にもかかわらず、PPを従来の知覚モデルから明確に切り離す共通の特徴がいくつかある。 これまでのところ、PPの神経生理学的研究は、主に4つの重要な仮説を検証することを中心に行われてきた。
1. 1.感覚刺激に対するエラーシグナリングの神経反応は、期待値に反比例する。
2. 2. トップダウン信号は感覚的予測を表す。
3. 大脳皮質階層の各レベルでは、予測と予測エラーを表す2つの機能的に異なる神経小集団が存在する。
4. 予測エラーの最小化は、レベル間のエラーと予測信号の相互交換によって達成されます-"階層的推論 "として知られているプロセス。

知識があれば言いたいことはなんとなく分かるかな。てか、 この程度は自分で訳せ!ってやつだな。

こんなもんじゃないかな?

評価は読者に任せますが、大雑把な内容把握ぐらいなら使えなくもないかな。でも、知識のない領域ではとても使う気がしないな。

ちなみに、今は今年出た統一理論としての予測処理(PP)理論を批判する論文を読んでいて、これがなかなか面白い。ここで紹介した論文とは方向性が真逆だな。これは紹介するかは分からないけど、予測処理についてはもう少し色々と書いても良さそうなことはなくもない(書く約束はできない)。

論文「Is the Free-Energy Principle a Formal Theory of Semantics?」の背景を説明する

ネットを見てたら、自由エネルギー原理で有名なフリストンが共著者の最新論文が紹介されてた。

ツイートを見てたら、この論文がenactivismを否定してるかのような書き込みを見て、気になって論文を眺めてみた。その結果、それは勘違いだと思ったが、その哲学的な背景が分からないと勘違いしても仕方ないかな?とは思った。

以下にするのは、この論文の哲学的な背景だけであって、論文の解説はしません。にしても、共著者に哲学の研究者がいないのに、哲学的な議論をしているという、どこか奇妙な論文だ。

内容を認めない反表象主義としてのradical enactivism

この論文は対立する二つの立場が問題となっている。その一方が最近、流行りのradical enactivismだ。enactivismはもともとヴァレラが提唱した考え方だが、近年になってその考え方をよりラジカルな形で受け継いだのが、radical enactivism。それがオリジナルのenactivismとどう違うのかは省略。

radical enactivismが提示する問題に「内容についての難しい問題」(hard problem of content)がある。内容とは、言葉の意味的な内容と言ったときの内容に近い。radical enactivismでは、内容の難しい問題を解けないので、表象を認める考え方は間違っている…とする反表象主義の立場をとる。その立場は、心的内容を一切認めない行動主義にも近い。

しかし、反表象主義には自由エネルギー原理からは都合の悪い側面がある。

生成モデルによって作り出される予測へのコミットは、radical enactivistを悩ませるが、その理由は予測の考え方には本質的に内容が含まれているからだ。予測される未来はこういう風のものとして予測されるが、予測はときどき真実になりそこねる
google:Tomasz Korbak Unsupervised Learning and the Natural Origins of Content p.4より

生成モデルを表象として理解する構造的表象論

反表象主義に対立する立場として、このような生成モデルをむしろ表象として認めてしまおうという立場がある。

とはいえ、世界の正確な表象を認める考え方はさんざん批判されたのでとれない。そこで現れてきたのが、地図における地形のように、現実と構造的に似ている表象を認めよう…という考え方が出てきた。その構造的表象論が生成モデルと出会うことになった。

詳しくは次の文献がネットでオープンアクセスですぐに読めますので、それを参照してください→google:Representation in Cognitive Science Nicholas Shea

反表象主義と構造的表象論を調停する

自由エネルギー原理を提示するフリストンらは、これらの対立する立場をいいとこどりしたかった。そこでこの論文で提唱されているのが、表象はフィクション(虚構)である説だ。

あと詳しくは論文を読んでほしいが、それなりの説明もあるとはいえ、こうした最近の哲学的な議論の背景が分からないと、理解しにくい論文だな…とは思う。

個人的な評価

これを読んで思ったのは、構造的表象論は別に表象が存在すると言った形而上学的な立場をとっている訳ではないので、表象は虚構だと言われても、痛くも痒くもないだろう…と言うことだ。

radical enactivismの場合は、強烈な反計算主義者もいたりするので、こんな調停は嫌だ!という人もいそうだ。てか、たとえ虚構としてであろうと表象や計算にそれなりの役割を認めてしまった時点で、かなりの譲歩をしてる気もする。

radical enactivismを認めたい動機には、心における身体の重要性を強調したい気持ちがあるのだろう。ただし、生前にフォーダーも言っていたが、認知に身体がいらないと思っている人は(めったに)いない。だから、単に身体!身体!としつこく繰り返されるのも…なんだかなぁ〜と思わなくはない。

まぁ、私は裏事情もそれなりに知っているので、radical enactivismに辛いところはある。だから、二つの対立する立場の評価は各自にお任せします。その上での私的な結論に入る。

表象は虚構説に意義はあるのか?

哲学的にはどうであれ、科学者は表象や計算の形而上学的な位置づけなど全く気にせずとも、科学的な活動にたずさわれる。自然法則を認めるのに、世界を計算する神の存在をわざわざ信じる必要はない。

その点では、この論文が哲学者に向けられてるのか?科学者に向けられてるのか?よく分からない。共著者に哲学の研究者がいないのに、内容が哲学に寄っている。

表象が存在するかどうか?なんて科学者にはどうでも良くて、その前提が含まれる研究プログラム(byラカトシュ)が、科学的な研究を推し進めるかどうかだけが大事だ。

その点では、この論文は研究プログラムとしての自由エネルギー原理論にどの程度に益があるのか?は私にはどうも怪しい。