画像生成プログラムDALL-Eから人の知性を考える

WIREDの記事はいつも楽しみに読んでいるが、最近はこんな記事が面白かった。

AIは人の知性とは異なる道を歩む

この記事を見てあらためて思うのは、現在の人工知能は生きた知性とは全く違う道を歩んでいるということだ。そこで思い出すのは、スタニスラフ・レム「砂漠の惑星」だ。

私はそこまでのSF好きではないが、私の読んだことのある中で最も好きなSF作家はスタニスラフ・レムだ。レムほどに生命やAIについて科学的な洞察に富んでいるSF作家を私は知らない。その中でも「砂漠の惑星」はかなり好きな作品だ。

粗筋の紹介はここでは省くが、この作品の洞察の一つが、生命やAIを私達の想像の範囲内に収めることへの批判だ。よくあるAI脅威論とは、AIを私達の想像の延長にある脅威として描いている安っぽいSF的想像に過ぎない。

しかし、それはAIが私達とは全く異なる知性へと発展する可能性に目をつぶることにしかならない。そして、今回の記事も現在の人工知能が、生きた人間の知性とは別の方向に向かっていることを示している。

画像生成プログラムを人の知性と比べる

この技術は「CLIP」と呼ばれ、人間の脳が学習する仕組みに着想を得て考え出された人工ニューラルネットワークというアルゴリズムで構成されている。そして、ネット上にある何億もの画像とそれに付随するキャプションを使って学習し、それぞれの画像の正しいラベルを予測するように訓練されている。

http://https://wired.jp/2021/02/11/ai-go-art-steering-self-driving-car/」より

現在のニューラルネットワークが、(着想と元ではあるが)現実の人の脳にあまり似ていないことは前にも指摘した。そして、WIREDの記事で紹介されている「DALL-E」もやはり、話題になった「GPT-3」と同じく生きた人の知性とは似ていない。その理由は刺激の貧困問題にある。

刺激の貧困問題(別名はプラトン問題)とは、チョムスキーが指摘した有名な問題だ。つまり、人はなぜそこまで多くの(言語)刺激に触れていないのに文法(規則性)を理解できるのか?という問題だ。しかも、この指摘の背景にはスキナー流の行動主義への批判があった。(心理学的)行動主義とニューラルネットワークとの関係を考えれば、これは興味深い問題だ。

引用から分かるように、今回発表されたプログラムもネットからの大量のデータセットを用いている1。もちろん、これは実際の人の知性が行なっていることとは異なるし、似てもいない

今のAIが人の知性と似ていないもう一つの理由

リンク先にある「スパゲティでつくられた騎士」の画像を見ると圧倒されてしまうが、これを生み出したアルゴリズムは、現実の人の知性とは似ていない。最近自然な文を生成することで話題になった、同じくOpenAIによって開発されたGPT-3も事情は同じだ。

GPT-3もDALL-Eと同じく、大量のデータセットを用いていてニューラルネットワークに学習させているのは共通だ。だが、人の知性との違いはDALL-EよりGPT-3の方が説明しやすい。

人の想像する「スパゲティでつくられた騎士」とDALL-Eの生成する画像を比較して説明するのは難しい。しかし、GPT-3の生成する文の問題は既に指摘されており、GPT-3が意味を理解していないのは明らかである。

世界を理解していないAI(ただしそれは欠点ではない)

GPT-3を単純に説明すると、語同士の高度な連想ゲームである。連想ゲームもあそこまで高度になると文法的な文を生み出す…と分かったのは大きな発見ではある。しかし、現実の世界ではありえない意味内容の文を平気で生成するので、現実的な存在論(オントロジー)を持っているとはとても思えない。

つまり、GPT-3もDALL-Eも高度な相関や(パターンの)類似を学んでいるだけであり、向こう側にある世界の因果や構造まで学んでいる訳ではない。

しかし、これは逆から捉えることもできる。現実の人間は、世界の因果や構造を前もって想定することで少ないデータからでも規則性を学べる。だが逆から見れば、世界についての想定が邪魔をして、学べる規則性に限界があるとも言える。人のバイアスとはそういうものだ。

おわり

AIを人の知性と似せる汎用人工知能の研究もあり、それはそれで興味深い。だが、現在急速にに発展しているのは、人の知性とは異なる道を歩むAIの方だ。

AIを人の知性と同じ基準で測って、超える超えないで騒ぐシンギュラリティなんて下らない。人とは異なる方向に知性が発展していくAIにもっと想像を巡らすべきだ。


  1. ただし、WIREDの記事には混乱がある。『カーシック・ナラシマンは、DALL-EもCLIPも、どちらも「すごい技術だ」と興奮を隠せない』とあり、まるでDALL-EとCLIPを同等の技術として並べている。記事を読んだ私の印象では、画像を生成するプログラムの名前がDALL-Eで、そこで用いられている技術の名前がCLIPな気がする。CLIPを自動運転のプログラムにも応用できるはず…という内容なので、これが正しい理解だと私は思うが、正確には各自で確認してください。どうであれ、DALL-Eは大量のデータセットを使っているはずなので、このブログ記事の本文には影響はない

なぜ陰謀論を信じるのか?の説明を説明する

最近相次いでラジオで、なぜ陰謀論を信じるのか?を学者が説明するのを聞いた。その説明がどのくらい説得的か?は色々だった。だが、それらを聞いていて何より感じたのは、これは単一の要因で説明できるような代物ではない…という強い感覚だった。

なぜ陰謀論を信じるか?のラジオで聞いた説明を順不同で挙げると、心理学者による認知バイアス政治学者による動機づけられた推論説宮台真司による権威主義的パーソナリティ説、があった1

このうち、認知バイアスと動機づけられた推論は人の一般的特性による説明宮台真司による説明は人の類型的特性による説明で、世の中で聞く説明にはこのどちらかに当てはまるものが多い。

動機づけられた推論について

この中で私が最も感心したのは、動機づけられた推論説だ。このブログでも前に注で動機づけられた認知として触れたのと同じ現象だか、(認知バイアスに比べて有名ではないので)知ってる事自体に驚いた(ただし、これに言及してる翻訳書は最近出てた)。

動機づけられた推論(motivated reasoning)とは、動機が推論に影響を与える現象だ。例えば、動画でスポーツの審判をさせると、同じ場面を見ていても自分のひいきするチームを有利な判定を下しがちになる。これは意図的にそうしてる訳ではない(本人は公正なつもり)なのが重要だ。

陰謀論を信じる心性を説明するには、認知バイアス説よりも動機づけられた推論説の方がよくできてる。なぜなら、単にすべての人に当てはまる認知バイアスより、その人の動機や欲求によって説明する方が、陰謀論を信じる人と信じない人の両者がいる事をうまく説明できるからだ(ただし元々の動機までは説明できない)。

個人の性格による説明

陰謀論を信じる人と信じない人の両者がいる事を説明できる点では、権威主義的パーソナリティ説は悪くない。ただ、これはナチス支持者を調査したフロムらによる研究が元なので、古い感は拭えない。しかし、目の付け所は悪くない。

おそらく現代でこれに当たる説明は、性格のビッグファイブの援用だろう。ビッグファイブはあのケンブリッジアナリティカにも用いられた心理学理論で、まさにフェイク(嘘)を信じ込ませるのに利用された。なぜもっと取り上げる人がいないのか?よく分からない。

とはいえ、人の一般的特性であれ類型的特性であれ、今だけでなく普遍的に人に当てはまることが前提なので、なぜ現在に陰謀論がこんなにも影響があるのか?には答えられていない2

フィルターバブルの影響

人の特性だけでは説明できないなら、その環境や社会にも説明を求めることになる。そんな説明の代表の一つがフィルターバブル説だ。

しかし、フィルターバブルは陰謀論を信じる維持をする役割は果たすが、そもそも陰謀論を信じるきっかけにはならない(なぜならきっかけはまだ情報がフィルタリングされる前だからだ)。

それから、ネットで異なる見解に触れてると意見が穏健になるとする人もいるが、これは根拠がない。まず、意見が中間的3なのは穏健のせいか?無関心のせいか?区別がつかない。なにより、集団分極化現象によって、反対の見解に触れることで、かえって元の見解を強めることが知られている。

メディアの限定効果説について

これもまた宮台真司がラジオで挙げていたのが、メディアの限定効果説だ4。メディアの影響を直接受けるとする弾丸効果説に対して、周りの人の評価を介してメディアは影響するとするのが、限定効果説だ。確かに、これは現代における個々人が別々にコンテンツに触れる状況に対応していて、(つまり誤りが他人に指摘されにくいので)納得できる所はある

ただこれも、たまに聞く最近自分の年配の親がYouTubeを見てネトウヨ化したという話があるが、結局は息子や娘のそれは間違っているとする意見を聞かなかったりする。弾丸効果説がそのままでは正しくないとしても、限定効果説がどう成り立っているのか?もよく分からない。

とりあえず終わり

他にも、なぜ陰謀論を信じるのか?の説明はあるかもしれないが、ラジオで聞いたのを含めて思いつく説明はだいたい書いてみた。

はっきり言えるのは、単一で説明できるこれだ!という説はなさそうなことだ。別の決定的な説明がある可能性もあるが、それよりも考えられるのは、いくつかの要因が重なっていることだ。

しかし、現代においてそうした知識が複数の分野にわたる説明をするのは難しい。各専門分野が専門分化されており、それらを正しく知るのも大変だが5、ましてやそれらをどう組み合わせるべきか?はもっと難しい。


  1. 認知的不協和理論による説明も聞いた覚えがある。認知的不協和理論では、例えば、作業をした後にもらった報酬が少ないと、その作業は楽しかった(役に立った)とすることで、心の不協和を直すとされる。だが、どう不協和を直すと陰謀論を信じるようになるのか?イマイチよく分からない

  2. もう一つ思いついた説明に、存在脅威管理理論もある。だが、単なる不安ではなく死の脅威を感じたときだけに現れる現象というのは、説明としてとても使いにくい。現代の人々に日々死の脅威を感じてる人が多くいるとでも?もしそういう研究結果が出たなら、この説明は採用します(それまでは保留)

  3. ここはあえて中立的とは書かない。両極端の真ん中が中立とするのは完全な幻想だ。両極端がズレれば、真ん中は簡単に移動する。だいたい、事実と嘘の中間が中立的だと思ってるとしたら、その人はむしろどうかしてる。客観的な証拠に基づいて事実を確定する方が、中立的のはずだ

  4. ただし、私は最近のメディア研究についてはあまり知らない。だから、この説が現在、どれくらい検証されているか?もよく分からない

  5. 私はネットで日本語で認知科学について調べているときに、他分野の学者の論文を読むこともよくある。単なる知識のひけらかしは論外としても、それおかしくない?という記述は幾度か見たことがある。学者とされてる人でも、そんな人はいる。本文では触れなかったが、知性が低いから陰謀論を信じる訳ではない。実際に賢い人が陰謀論を信じる現実もある。賢い人はもっともらしく情報を組み合わせるのが得意なので、かえって陰謀論を信じて続けるようだ(その場合は、事実に反してるのは論外としても、情報の選択や重み付けがおかしい場合がよくある)

トランプ問題とプラットフォーム問題は分けなきゃ駄目でしょ!

以前、このブログで人工知能の偏り問題についての記事を書いたことがある。

そこではAIの偏りの原因を因果(回帰分析)とサンプリング(データセット)の二つに分けて論じた。最近、データセットの偏りによって生じるAIの問題を論じた記事があがっていた。

この前の人工知能ブームには、ブームに乗って適当なことを書くミーハーが沢山出てきたくせに、いざこういう問題が表面化するとマトモに語れる人が日本にはろくにいないのに気づかざるをえない。頭痛くなってくる!

トランプのアカウント停止問題を考える

実は似たことが、この前のトランプのtwitterアカウント停止問題の際にも起こっている。それは、トランプ問題とプラットフォーム問題が安易にごっちゃに語られていることである。

私はこのブログでも、プラットフォームにAI的なアルゴリズムが使われていることを示唆したことがある程度には知識がある。そして、前からネット上で謎のtwitterアカウントの停止問題は聞いていたので、二つの問題が一緒にされがちなのはマズいと思うようになった。

トランプのアカウント停止問題へのよくある勘違い

まず、トランプのアカウント停止問題についてよくある勘違いに触れておく。

表現の自由が問題なのか?

一つ目はこれは表現の自由の問題だという主張。表現の自由は政府による規制が本来の問題なので、今回の民間企業の決定とは分けて話すべきだ。

例えば、雑誌でどんな記事を載せるか?はその雑誌の編集の問題であって、特定の記事が載らないからと言ってある雑誌を非難するのはおかしい。なぜなら別の雑誌にその記事が掲載されればいいだけだからだ。

雑誌とプラットフォームは違うというかもしれないが、その違いを日本で明確に論じているのを私は見たことがない。そして、私がこれから論じたいのは、そのプラットフォームとは何か?の問題だ。

メルケルの発言はヨーロッパ的な発想

もう一つはトランプのアカウント停止問題へのメルケルの発言だ。これは表現の自由についてのアメリカとヨーロッパでの考え方の違いが分かっていないと誤解する。

ヨーロッパ方式とアメリカ方式の違いは、許される表現の基準が行政を介して決まるか?民間で決まるか?の違いにある。どちらが正しいとはそう簡単には言い難い。

アメリカ方式の問題は見えているので、ヨーロッパ方式だけを扱う。手短に批判すると、ヨーロッパ方式はナチス礼賛は駄目だけどイスラム批判は良い…といった恣意的な基準が設けられており、未だにたまにそこで揉める。ヨーロッパ方式は別に必ずしも褒められる方式ではない。

トランプ問題とプラットフォーム問題は分けよう

ここで主張したいことはただ一つ、アカウント停止のトランプ問題とプラットフォーム問題は分けて論ずるべきだ!ということだ。これら二つの問題はごっちゃにされがちだが、安易に一緒にすると問題の本質を見逃す。

私が愛読してるブログに、その辺りの問題を示唆してる、日本語で読める数少ない記事がある。

Twitter、Facebookが大統領を黙らせ、ユーザーを不安にさせる理由

ダートマス大学教授の ブレンダン・ナイアン氏も、トランプ氏への永久停止は正しい判断だとしても、プラットフォームが行使するパワーには不安を覚えるとし、ツイートでこう述べている。

「[https://kaztaira.wordpress.com/2021/01/12/twitter_facebook_locked_out_president/: title]」より

トランプ問題とプラットフォーム問題はどう違うのか?

まず大きな違いは、アカウント停止が意図的かつ人為的であるかどうか?だ。トランプのアカウント停止は意図的になされたもので、その責任の所在がはっきりしている。対して、プラットフォーム問題の場合は、そのアカウントの多くが(AI的な)アルゴリズム1で勝手に管理されるので、責任の所在がはっきりしない。

もう一つの違いは、トランプ問題はアカウントが停止された事情が人々の目に見えていることだ。トランプのアカウント停止の理由は問えば答えられるはずだし、そこに潜む問題も直接に議論することができる。しかし、プラットフォームで日常的に行われているアルゴリズム的なアカウント停止は、その理由はよく分からないし、プラットフォーマー側でさえ答えることも難しい。

たまに、政治的なつぶやきをしたからアカウント停止された?と疑われることもある。そのくせ、なんでヘイトを垂れ流すアカウントが停止されないのか?疑問だらけなこともよくある。背景が目に見えるトランプのアカウント停止なんて、こんな日々行われているアカウント停止に比べれば、全然かわいいものに思える。

プラットフォーム問題とは何か?

プラットフォームは民間企業なので、どんなアカウント停止をしようが自由だ!という意見もなくもない。しかし、これは必ずしも間違ってはいないが、プラットフォーム問題を甘く見てる感は拭えない。

メディア問題としてのプラットフォーム

これは既に表現の自由問題で触れた、雑誌の例と比較すると分かりやすい。ある雑誌に自分の書いた記事が採用されなかったとしても、別の雑誌に応募したり、何なら自分で雑誌を作ってもいい。プラットフォームにこれと同じことが言えるのか?

雑誌と違って、プラットフォームがそんなに簡単に作れて乱立する訳がない。その点ではむしろ、雑誌を発行する出版社の方が近いかもしれない。雑誌がコンテンツの集まりだとしたら、出版社はそのコンテンツをメディアに載せて配る役割を果たす。こっちの方がプラットフォームのイメージにむしろ近い。

つまり、コンテンツの層とメディアの層はきちんと分けるべきなのだ2。コンテンツを配るメディアを司る装置として、以前なら新聞やテレビのようなマスメディアが優勢だったが、今やプラットフォームが多大な影響力を持っている。

おわり

多大な影響力を持ったプラットフォームが、責任の所在も曖昧なままに、偏りをも含みうるアルゴリズムで、理由も分からないままにアカウントを管理する…という状況をもっと本気で考えてほしい。

上にリンクしたのは、ケンブリッジアナリティカを告発したワイリーの本の書評だ。ケンブリッジアナリティカは意図的に情報を操作した3が、プラットフォーマーは意図せずに似た操作を行ないうるのだ。

トランプのアカウント停止という目に付きやすい分かりやすい問題に目を眩ませてはいけない。本当の深い問題はその奥にある。


  1. アルゴリズムがAI的かどうか?は二次的な問題で重要ではない。だいたい、あるアルゴリズムがAI的かどうか?の基準そのものが必ずしも明確な訳ではない。

  2. ただし、マスメディア時代はメディア管理とコンテンツ制作が結びついていて、その違いは明瞭ではなかった。たまに、(今と違って)昔のニュース番組は中立的で良かった!という人を見るが、昔は少数のマスメディアが多大な影響を握っていただけであり、それが中立的だったとするのは単なる幻想でしかない(ジャーナリスト論を勉強してね)。ただ、プラットフォームの中には特定のコンテンツと結びついてるのもあるので、そこはややこしい。コンテンツ層とメディア層の間にエディット層も加えた方がいいのかもしれない

  3. ただし、ケンブリッジアナリティカの選挙への影響力が過大評価されているという指摘もある。確かに、トランプの支持層を考えるとその指摘も分からなくもない。一部の過激化が目立ちやすいせいで、ネットの影響力が過大評価されてる気配がなくもない。でも逆に言えば、今でさえこれなのだから、この先どうなるのか?もう少し考えてほしい