ディスクレシア(読み書き障害)から考える人類進化の謎

しばらくここに記事をあげてないが、ブログに書きたいことはなくもなかった。

例えばハイエクニューラルネットワークの記事を書くつもりで、めぼしい論文からの引用まではした。感覚秩序の話だけ書いても物足りないのでその先も書こうと計画だけはしたが、そこから進まない。ハイエクの前期と後期を結びつける論文に書けるような話を、軽い気持ちでブログに書こうとしたのに無理があった。他にも、主観と客観(または実証主義構築主義)の話とかギブソン派の話(アフォーダンスは科学ではなく思想の言葉)とか、書きたい話題はあるが書く気が起きてない。

探索と活用のバランスを探る

で、今回書こうとする気が起きたのは、この記事を読んだからだ。

ディスクレシアとは、文字の読み書きに関する障害である。これは珍しい障害ではなくて、実は身近な人や有名人がこの障害である可能性は高い。この障害の人は、学校では苦労することも多いが、社会に出ると案外なんとかやっていけることが多い。(中にはいわゆる成功者もいる)。

地球上に生息するあらゆる動物は、生存のために価値ある情報や資源を探す必要がある。とはいえ、発見したものを活用せずに延々と探索を続けていては非効率だ。
反対に、あらゆるものを利用しても問題解決として最適ではなかったり、変化する環境への適応に失敗する可能性もあったりする。このように、「探索」か「活用」のどちらかに偏りすぎると、動物は生存に必要な資源や知識を得られない。

読み書きが困難な「ディスレクシア」の特性が、人類の文化的漸進に貢献していた:研究結果 | WIRED.jpより

これを読んで、この前ここに上げた記事を思い出した。

関連した説明を、別の論文から引用してみます。

上記のように,期待自由エネルギーは,
認識的価値 (epistemic value)と外在的価値 (extrinsic value) の和
として表現できる.上の関係から,外在的価値が期待効用に対応し,将来期待される世界のエージェントモデルに対する対数証拠と関係しうることを意味する.認識的価値は,将来の成果によって隠れ状態に提供される期待情報ゲイン(相互情報量)である

乾敏郎「自由エネルギー原理―環境との相即不離の主観理論―」p.381より

自由エネルギー原理における認識的価値と外在的価値は、引用したWIREDの記事における「探索」と「活用」に対応しているように見える。しかし、(自分の記事でははっきりとは指摘してはいないが悲観的予測の問題と関連した形で)認識的価値と外在的価値をどう足し合わせて期待自由エネルギーを導き出すのか?は分かりにくい…と思っていた。その私の懸念はどうも間違っていないようだ。

進化の歴史は、ヒトの社会が足りない部分を補完する戦略に特化してきたことを示唆している。このため、問題解決のための「探索」と、社会をうまく回すための資源や情報の「活用」はトレードオフの関係にあると考えられてきた。

読み書きが困難な「ディスレクシア」の特性が、人類の文化的漸進に貢献していた:研究結果 | WIRED.jpより

自由エネルギー原理では、そのトレードオフは個人の中でバランスをとることが目指されている。しかし、WIREDの記事では違う可能性が指摘されている。

自動化の遅れを伴うこのような情報処理方法は、非効率で手間がかかるかもしれない。しかし、そのトレードオフとして新しくより適切な戦略の可能性を模索し、そこで得た知識を既存の情報と統合する時間を提供する、ひいてはイノベーションを促進する可能性が示唆されているのだ。
程度の違いこそあるが、ディスレクシアは人口の約5〜20%を占めると推測されている。「ディスレクシアの代償的な利点がなければ、これほど一般的であるはずがない」と論文が強調する理由は、ディスレクシアの人々には変わりゆく環境のなかでものごとの全貌を把握し、解決法を見出す能力に秀でている可能性があるからだ。

読み書きが困難な「ディスレクシア」の特性が、人類の文化的漸進に貢献していた:研究結果 | WIRED.jpより

つまり、活用と探索のバランスが個人内ではなく集団内でとられることで、人類の環境への総合的な適応性を高めている。ここでいう集団とはpopulationのことであり、集団遺伝学における集団と同じだ。このような個人差を考慮した集団的な思考法は、(正統派)進化心理学における人の普遍性を探る思考法とは異なる(そもそも人類が文字の読み書きができるようになった時期は遅いし、文字のない社会そのものが珍しい訳ではない)。

ということは、認識的価値と外在的価値を足し合わせる普遍的な式があるのではなく、そこには個人差をもたらす変異がある可能性が高いと感じる。もちろん、自由エネルギー原理にはまだそんなことは書かれてないが、私には考慮すべきことに思える。

脳の構造にも表れる認知スタイル

ここまでがWIRED記事の前半の話で、後半はもう少し違う話が続く。それは脳の構造の違いにある。

ディスレクシアの場合、このマイクロカラム回路に関連する生理学的制約が、ローカル結合を“犠牲”にすることでより強いグローバルな結合を可能にしている。なお、自閉症の人たちは、これとは真逆の構造をもつことがわかっている。
このようなカラム構造の違いが、全体的な志向バイアスをもつ人(ディスレクシアの人)から細部志向のバイアスをもつ人(自閉症の人)までの認知スタイルのスペクトラムを生じさせる可能性がある。

読み書きが困難な「ディスレクシア」の特性が、人類の文化的漸進に貢献していた:研究結果 | WIRED.jpより

詳しくは元の記事を読んでもらうとして、ここで注目するのは前半との違いだ。前半は「活用と探索」の対に対して、探索に特化したディスクレシアの特徴が語られていた。それに対して、後半では脳の構造から、全体を見るディスクレシアと細部を見る自閉症の対が語られている。ここで前半と後半とで話題になっている対には対応関係はないように思える。自閉症は活用が得意だ…と考えるのは不自然だからだ。「活用と探索」の対と「全体と細部」の対は次元が違うと考える方がしっくりくる。


ラカン精神分析における自閉症

ここからは、(事実レベルの嘘はないはずだが)私の勝手な見解が多く含まれます。

最近、ラカン精神分析における自閉症論をいくつか読む機会があった。私の感想としてはお話としては面白いと思うけど、ラカン自身が自閉症を診た気配があまりないのと、ラカンが亡くなった後の自閉症研究の進展を考えると、あまり本気で受け取らない方がいいと感じる。読んだ論文も(もはや時代遅れの)アームチェア精神病理学の印象を強く感じるものばかりだった。

ラカン精神分析神経症と精神病(統合失調症)との対を基盤に据えた理論だが、そこに自閉症を位置づけるのに無理を感じる。ラカンの理論は言語(シニフィアン)1の理論だが、そこに位置づけようとすると自閉症を言語の障害として捉える必要がある。次の論文がその典型だろう。

詳しくは各自で読んで判断してほしいが、私は無理を感じる。次の論文は、同じような現代思想的な説明も多く含まれるが、むしろそれをも批判する構想力の観点に注目してる点ではより興味深い。

google:隠喩としての自閉症 構想力の盗用をめぐる試論

自閉症のより科学的な説明では、バロン=コーエンによる心の理論の障害説がある。これは社会性に注目した視点だが、他にも見えてる向こう側が想像できない事例も指摘される2。ここに共通するのは、逆問題を直観的に(無意識的に)解くことの困難だ。逆問題についてはこのブログでも前に触れた。

逆問題を解くとは、大雑把に言えばデータに知識を付け加えることだ。この場合の知識は認識できる世界を広くもしてくれるが、世界に偏見を加える点ではバイアスでもありうる。ここには、(ディスクレシアと同様に)自閉症の持つ人類の適応性への貢献の秘密がある気がする。3


  1. ただし、現代思想的なこの言語観は私には狭くも感じる。これだと言語は身体的でない…とみなされやすいが、実際には言語の中には身体的な要素は様々な形で含まれている(例えば認知言語学を参照)。私自身は言語は思考や身体や社会性など複数の心的な要素の交差点だと思っている

  2. 単に想像そのものができないアファンタジアという障害もあるが、これは別物。この障害は(イメージ-命題論争における)イメージ派を支持する私には衝撃なのだが、その話はここではしない

  3. ごめん。この辺りで記事を書くのが面倒になった。でもここからは、主観客観問題にもギブソン派(特に直接知覚説)問題にも繋げられるのだが、すでに切りがない。精神分析では人類の多数派とされる神経症こそが「活用」の側では?とも思ってたが、根拠のない妄想なので本文に書くのはやめた。

書評 ファニーハフ「おしゃべりな脳の研究」

おしゃべりな脳の研究――内言・聴声・対話的思考

人の内なる声について、科学的成果を交えながら、それを研究する心理学者が分かりやすく伝えてくれる著作

内言や聴声について、専門に研究してる心理学者が、科学的な成果や様々な文献を参照ながら、一般向けに分かりやすく語った著作。前半は思考時に起きる心の中の言葉(内言)について、後半は実際には存在しない声がリアルに聞こえる現象(聴声)について、科学や文学からの色んな事例を取り上げて説明してくれている。ただし、内言と聴声を結びつける著者独自の考え方に基づいているが、そこは当人も認めるように証拠はまだ十分ではない。とはいえ、日本語で内言や聴声について科学的に扱った著作は珍しいので、興味を持ったならお勧め。

原題は「内なる声 どのように私達は自分自身と話すかの歴史と科学」。外からは分からない心の中で生じる声について、心理学や脳科学を参照する科学的な章と、文学や歴史を参照する人文的な章と、がだいたい交互に置かれて説明されている。

前半は内言研究の紹介。内言とは人が思考するときに心の中で話す言葉のことであり、ロシアの心理学者ヴィゴツキーが取り上げたことでよく知られている。内言は外からは分からないので研究は難しそうだが、元からは独り言(私的発話)の研究として、近年は脳画像の研究として、調べられている。この著作では特に、著者自身も関わった経験サンプリング法と呼ばれる、突然にブザーがなった時間にすぐに内的経験を聞く手法に基づく記述が多いのが特徴だ。科学書としてみた場合、この前半が断然に面白い。

後半は聞こえないはずの声が現実と同じように聞こえる聴声がテーマとなる。聴声は幻聴とも呼ばれて異常扱いされがちだが、必ずしもそうではないことが説明されている。ただ後半は精神病理学的な側面が強く、前半とはちょっと様子が違う。著者独自の理論によって内言と聴声には関連があるとされて、それによって前半と後半がつながっている。

内言であれ聴声であれ、まとまって日本語で読める科学的な著作は他にないので、貴重な翻訳である。科学的な視点からみると物足りない所がなくもないが、そもそも発展途上の研究テーマなのだ。最終章を見ると、この研究テーマについて課題と共に語られていて、それ自体が興味深い章となっている。

あまりハードルを上げずに気軽に読めばいい本だと思うが、気になるところがなくもない。聴声を内言と結びつけるのは著作独自の理論だが、これは本文でも描かれているように当の聴声者による反発に合っているが、確かに無理がなくもない。(作業記憶と結びついて)制御可能な内言と制御不可の聴声を関連付けるのは厳しいと感じる。

疑問に感じる部分も少しなくもないが、そこも含めてこの本は読む価値がある。翻訳も良好で全体的に読みやすい。なにより内言と聴声について科学的な成果に触れながら分かりやすく書かれた日本語の著作は今のところ他に見当たらない。そして、この本には著者自身の関心と専門に基づいているからこその良さに溢れている。

おしゃべりな脳の研究――内言・聴声・対話的思考


書評の本文から抜いた詳しい批判

実は私自身も若い頃に近い状態(軽めの言語性幻聴)になったことがあるが、その経験からも内言と聴声の関連については無理を感じる。本文でも指摘されているが、聴声は解離での説明の方が適切だと感じる。つまり、つらい現実の自分から無理やり心を引き離すのが解離であり、解離こそが幻聴(聴声)を生み出すはずだ。

解離が聴声と内言を結びつけるとする著者の説明はいまいち説得力がない(著者も薄々気づいている)。厳しい環境を生きた古代人の例も考慮すれば、環境からの強すぎるストレスが本人の持つ信念・道徳・信仰・世界観と結びついて、聴声が起こるのであり、そこに内言の入る余地があるか?怪しい(予測処理論を持ち出しても、説明できるのは声の帰属までであり声の発生までは説明できない)。

著作全体としては著者自身の関心と研究履歴に沿った内容であり、そうなのは正しいと思う。だが、やはり前半の内言と後半の聴声は、それぞれが興味深い内容なのだが、内容としてきれいに繋がっているとは言いがたい。聴声に合うように内言モデルを広げることが正しいのか?疑問に感じる。

とはいえ、聴声を精神的な異常としてではなく、正常な心的な防衛機能として捉えようとする本書の試みは素晴らしいと思う。そのような著作は日本ではまだ珍しいので、その点でもこの本はお薦めできる。

自由エネルギー原理の予測処理的な大枠を自分なりに理解してみる

自由エネルギー原理については、このブログでは既に何度か批判的な議論を紹介している。フリストンブランケットやメカニズムとの関係についてはすでに記事をあげたが、私自身の自由エネルギー原理への印象は相変わらず良くならない。他に気にしてる話題がなくもないのだが、自由エネルギー原理は最近ネットに上がっている関連論文の数が多く出てきており、どうしても気になってしまう。

もちろん詳しい議論は専門の学者にやってもらうしかなく、私としてはそれに期待している。ただ幾本も文献を読んでも自由エネルギー原理への基本的理解があまり定まらない。例えばある日本の有名学者は論文で運動や主体感はactive inferenceでこそ扱えるかのような書き方をしているが、運動も主体感も自由エネルギー原理が影も形もない頃から予測符号化で扱えることが知られている(運動はWolpertら、主体感はFrithらの研究があった)。

自由エネルギー原理について数式がたくさん書いてある論文は日本語でもいくつもある。だが私のこれまでの経験上、(この件に限らず)数式を論文や記事にたくさん書いてる人がその数式の意味をちゃんと理解している訳では必ずしもないことは承知している(分かってるなら数式の説明しろよ!)。結局は自分で努力して理解するしかない(いつものことだ)。

この記事は、元々は自由エネルギー原理の核となるactive inferenceについて自分なりの見解を書く予定だった。しかし、フリストンらが今年出したばかりのある論文をつい最近見つけて、そこにかなり詳しく説明されていたので、ここでは抑えめに書くことにした。てか、active interenceが実は思ってた以上に未完成の発展中なのに驚いた。

予測処理の説明を引用して私が注釈する

以下は、ある論文からの引用を翻訳して、そこに私が注釈します。書くのは完全に私なりの理解なので、正確に知りたい人は自分で確かめてください。

自由エネルギー原理(予測処理) = 予測符号化 + 能動的推論

予測処理の見方の元では、生成モデルの予測が実際の観察と比較されて、モデルと観察との間の違い(予測誤差、形式的には自由エネルギーと同等)は階層の中で上へと送られる。神経システムの目的は階層の各段階を通してその予測誤差を最小化することである。これは二つの方法で達成される:つまり、実際の観察と合う確率(the probability of the observation)を最大化するように世界の状態を推測することによってであり、これは知覚に相当し予測符号化の枠組みで典型的にモデル化される;または、その予測を実現させる機会(the chance of meeting those predictions)を増やすために世界の中でデータをとったり(sampling)行動を起こしたり(acting)することによってでもある。この後者の形を想定するモデルは能動的推論(active inference)モデルと呼ぶことにする。

Martina G. Vilas , Ryszard Auksztulewicz & Lucia Melloni "Active Inference as a Computational Framework for Consciousness"pdf版のp.5より翻訳

自由エネルギー原理と予測処理との関係が曖昧なのは以前の記事で触れたが、ここでは共通部分だけが説明されてます。自由エネルギー原理は独自に拡大しており、例えば一般的にフリストンブランケットは予測処理理論の中には含まれなく、自由エネルギー原理に独自に付け加わっていると考えていいと思う。

私自身の自由エネルギー原理への元々の理解は、予測符号化に階層化とactive inferenceを加えたものだった。 しかし、予測符号化を階層化するだけではあまりオリジナリティがない。それよりはこの引用にあるように、自由エネルギー原理を予測符号化とactive interenceを組み合わせたものと理解する方が分かりやすい。予測符号化とactive interenceはそれなりに独立してるので、個人的には予測符号化はそれだけで完成度が高いので先に勉強してしまうのがお勧め

ここまでactive interenceをわざと訳さないできた。それは理由がある。日本語の文献で定訳となっている「能動的推論」に疑問があるからだ。なぜならactive interenceは、予測符号化のperceptual inference(知覚的推論) と対照となる用語だからだ。知覚に対応させるなら行為の方が相応しい1。「能動的」の訳語は、身体化(特にenactivism)を思わせるが、それは必ずしも実態と合わない。この後で説明するように、(能動的にする)新たなデータの取得は、active interenceの目的の一つであるが、それは唯一の目的ではない。かと言って、行為的推論と訳しても分かりにくいので、ここでは定訳に従う。

既にあった予測符号化とは異なり、active interence(能動的推論)こそが自由エネルギー原理の革新であり、これを説明するのが上の引用のすぐ後に続く次の引用だ。

能動的推論の核心は期待される自由エネルギーにあり

能動的推論(active inference)モデルはこのようなことを含意している:システムは今ここでの驚きを最小化するだけでなく、行為の連鎖としての方策(policy)を選ぶ過程を通して期待される驚き(expected suprise)も最小化する。この最小化は二つの方法で達成されうる:つまり、事前設定によって定められた報酬(rewards)を得られる可能性を最大化するような実際的な(pragmatic)行為を行なうことによってである。またもう一つは、探索によって得られる情報を最大化するような認識を高める(epistemic)行為を行なうことによってだ。すなわち、未来の状態についての信念と何らかの状態についての可能性を表した仮想的な(counterfactual)信念と特定の方策を選んだ時にあったはずのその結果とを生成モデルは持っていなければならない。階層上の各段階での状態の間での変化は上の階層によって定められることになる(contextualized)。

Martina G. Vilas , Ryszard Auksztulewicz & Lucia Melloni "Active Inference as a Computational Framework for Consciousness"pdf版のp.5より翻訳

予測符号化が今ここでの驚きを最小化するのに対して、能動的推論は未来における驚きを最小化する。未来における驚きは期待される驚きとここでは呼ばれ、日本語訳で期待自由エネルギーと呼ばれるのと同じである。(引用では説明されてないが)行為の連鎖のことを方策(policy)と呼び、期待される驚きを最小化するような方策が選ばれる。

期待される自由エネルギー(驚き)は二つの項を持った数式に分解できる

EFE(期待される自由エネルギー)には色んな分解法がありうるが、等式3.1で示されたのは最も重要である。なぜなら、EFEは外在的、目的指向型の項(文献によっては道具的値とも呼ばれる)と内在的、情報探求型の項とに分けられるからだ

Beren Millidge,Alexander Tschantz&Christopher L. Buckley "Whence the Expected Free Energy?" p.454より翻訳

ここにある外在的項が実際的行為に対応し、内在的項が認識を高める行為に対応する。つまり、将来的に報酬を得ようとするか?新しい情報を得ようとするか?を総合的に判断しようとする2RPGのゲームで説明すると、今の街の周辺で経験値や金を貯めるか?マップの先を探索して新しい街を探すか?を選ぶことに値する。または、今の会社に残って働き続けるか?今の会社を辞めて転職や起業をするか?を選ぶのにも近い。起業して一時的に収入が減ったとしても将来的に大金持ちになれるならそれを選ぶだろう。

ちなみに、能動的推論で説明できる現象としてよく挙げられるのは、目立つ所に注意が向くこと。ただ、極端な例(報酬なしであからさまに顕著な情報がある)なので、説明できてる感があまりしない。

能動的推論に私が何となく感じる疑問

ある行為を選んだ時にどんな状態になるか?の計算は、マルコフ過程(直前の状態によって次の状態が決まる時系列の計算)によって行なわれるらしい^3。具体的な計算は今の私にはまだよく分からないが、何となく感じる疑問はある。

最も極端な例を挙げると、どうせ将来のいつか人は必ず死ぬのだから、何をしても無駄だ!という鬱的な判断をそもそも避けられるのだろうか?(ある所で悲観的予測の問題と呼ばれていたのと同じ)。これはケインズがした古典的な経済学理論(均衡システム)への指摘と等しい。真っ暗闇問題(dark room problem)も、きっとこの暗闇から脱出したら良いことがあるんだ!という知識と欲望に従って脱することができるのだ。つまり時間的な先の計算がいまいちよく分からない。最も悲惨な将来を想定して何もしない(途中経過を計算するまでもない)ような悲観的予測はありうる(今のままの生活を続けるだけなので珍しい選択とは言えない)。こうしたことを本当に数式化できてるのか?

もう一つ意地悪な疑問を挙げると、能動的推論が行動を起こす前に全てを計画するプランニングのモデルに見えることだ。このプランニングモデルは人類学者サッチマンが批判した古典的認知科学で採用されていたモデルだ。プランニングモデル(世界を正しく表象して前もって正しい行動を決める)に反対するような形で現れたのが、AIのサブサンプションモデル(ブルックス)とも言える。つまり、自由エネルギー原理は身体化に与してるように言われるが、(表面的な数式的な洗練化にも関わらず)能動的推論が採用してるようにも見えるプランニングモデルが身体化以前の古臭いものに見えなくもない。古臭いモデルだからいけない訳ではないが、身体化に与しているかのような言説と合っていないのは問題だと思う(そんなことは始めから言わなければいい。それで能動的推論の価値は下がらない)。

こうした私の現時点での疑問が正しいのか?よく分からない。それは各自で確かめてください。


  1. 知覚のトップダウン効果は、知覚が単なる感覚からの受動ではない点では能動的である。しかし、これは予測符号化で説明できる事態であり、active inferenceとは関係ない

  2. 期待される自由エネルギーを下げる方法としては、他にニッチ構築のように環境を変えることが指摘されることもある。ただ理屈としては分かるが、どうやって数理的にモデル化するのか?どうもよく分からない。