最近ラジオであるニュース番組を聞いていたら、ある人が専門家の間で見解が異なる場合はどうしたら良いのか?に答えていた。

その人が言うには、専門家から直接に聞くのではなくリスクコミュニケーターを介せばよくて、マスメディアがその役割を果たすべきだとしていた。間違ってはないとは思うが、マスメディアへの不信が専門家から直接に聞こうとする原因でもあるはずと考えると、ちょっと理想論に過ぎるように感じた。

そりゃあ、信用できる仲介者がいるならその人を頼ればいいと思うが、まともに科学ジャーナリズムが成立してない日本でそんな都合のいい人がすぐに出てくる訳がない。普段から科学を軽視してきた報いが今になって来ただけだ。

さらに、その論者は、専門家は狭い専門を持っていて狭い条件の元で語っているから…みたいに言っていたが、お前もリスクコミュニケーションの専門家じゃねぇのかよ!と突っ込みたくなった。俺には専門家の語る条件が分かるぜ!的な傲慢と紙一重で感心できる発言ではない。仲介者として名乗り出てるのがこんな人なのかと思うと頭を抱える。

ポストトゥルースとは異なる事態

今回の新型コロナ騒ぎで起こった新しい事態の一つは、専門家同士で見解が異なる事態に一般の人が直面した事だ(しかも日本だけで起きてる事態ではない)。これまでのポストトゥルース(真実以後)の時代とされる中では、事実と異なる間違った情報(misinformation)が話題になり、特にブレグジットやトランプ当選においては悪意のある虚偽情報(disinformation)が問題とされた。

もちろん、今回も(不安に乗じて)事実として間違っている情報は流れているし、それは気をつけてもらうしかない。しかし、今回改めて生じたのは

  1. 専門家が語っている(悪意はない)
  2. 見解の違いが晒されている(事実が焦点ではない)

であり、いわゆるポストトゥルースとは問題が別になっている。これはどういうことなのか?

ここで専門家と一つに括られているが、これは誤解を招く。ある領域に詳しいジャーナリスト(評論家)と専門分野を持った研究者とは、メディアに出ると同じように専門家と括られてしまうが、その内実は全く異なる。前者は既にある事実や知識に詳しい人だが、後者はまだ未知の領域を研究している人であり、同じく専門家と括るには違いがあまりに大きい。今回問題になっているのは、単に事実や知識を披露するだけでは済まない科学者の問題だ。

一般社会に現れない科学の営みが噴出する

ものすごく大雑把に語ると、科学には既に成果の確定した知識の領域と多くの研究者によって今現在進行形で調べられている探究の領域とがある。実際にはこれらをきれいに分けることはできないが、都合上これで話を進める。

普段メディアに出る科学は確定された知識の領域で済む事が多く、未知の探究の領域は科学番組の他ではあまり話題にならない。探究の領域では研究者の間で日々議論が交わされる先端の戦場である。時々、科学で何でも分かる訳ではない!と物知り顔で論ずる奴がいるが、研究者の側からは科学は分からない事があるから成立してるのであり、何が分かっていないのかを知ること自体が重要でもある。

つまり、メディアなどの表に出てくる科学はきれいに整った結晶だが、先端となる科学の本体はもっと混沌とした状態なのだ。今回は、新型コロナという全く新しい事態によって、本来は科学者の間で済んでいたドロドロな混沌が、一般市民の目にも顕わになってしまったのだ。

一般市民の科学観との乖離

本来なら、科学者の間で議論が交わされその結果が表に晒される…が正しい順番だ。しかし、今回はそうなる余裕がなかった。事態の緊急性と高度になったネット社会が組み合わされて、科学者間の議論をろくに経ずに一般社会にその混沌部分が加工されずに表に出てこざるをえなくなった。

今回は、本来の専門でないことにまで口を出す専門家も出てきているので、話がややこしいが、専門家も専門外については素人と考えた方がよい。本当の問題は、本来の専門に近くても見解が異なるところが表に出てしまったことだ。科学の中ではそこは単に議論すべき論点でしかないが、科学の営みを知らない一般市民には混乱を招いただけだった。

分かりやすくするために、科学を知識の領域と探究の領域に分けたが、実際はもっとややこしい。そもそも科学は一枚岩で語れるものではなく、もっと多様で複雑なものだ。当の科学者でさえその多様さをよく分かってないこともあるのに、科学を批判してれば深遠に聞こえるとでも思っている人文学者の科学観がいい加減に古臭すぎる(最近見たものだとマルスク・ガブリエルのがひどかった。あの人の本来の専門は科学とは関係ない)。

結論は出したいが…

どうしたらいいのか?との問いに処方箋や結論は出したいが、正直私自身がどうすればいいのか困っている。


なに偉そうに助言しとるんじゃ…で本文からは削除

ただ言えるのは、俺の言ってることが正しいぜ!的なのに頼るのは危険(確信の高さと真偽は関係ない)、情報量が多すぎるのは混乱しか招かないので信頼できる情報源に絞る、下手に論争には手を出さない(冷静な議論など期待できないので労力の無駄)…とかかな。

それでもどうしても情報が欲しい…との人にはっきり言えるのは、専門家の話を聞くべきなのは当たり前として、誰が正しいのかという択一の問題にはせずに、なぜその見解をとったのかという理由に遡って比較検討するしかないことだ。例えばマスクをすべきかも、「ウイルスが小さいので防げない」「手が顔に触るのを防げる」「飛沫が飛ぶのを防ぐ」と(ただの見解ではなく)理由を集めればおのずとそれなりの像は結べる…かもしれない。

ちなみに、私自身はタブレット(アンドロイド)にRSSリーダーのアプリを導入したら、ニュースサイトの記名記事を見るのにすごい便利。学者やジャーナリストのブログも登録してるので、一括で管理できて助かる。いくら専門家が書いていても、理由の説明にまで触れられる長めの記事でないともはや使えない。ただサイトとアプリで相性があって、必ずしも最新RSSに対応できないこともある。私は、メインはReadを使っているが、現代ビジネスと論座だけはFeederを使ってる。

認知科学そのものについては、何をどこから記事に書けばよいのやら途方に暮れつつあり、どうも書く気が起こらない。そもそも最近は認知科学そのものよりも別のところに興味を持ってしまい、その内容を自分のための整理とメモも兼ねて記事に書いてもいいかな〜と思う一方、それを公開してどうする感もなくもない。

学習機関における統計力学の位置

一つは、まだアイデアの域はそれほど超えないが、学習機関における統計力学の話題がある。

ニューラルネットワークや自由エネルギー原理のように統計力学の考え方が生物や機械の学習機関に適用されている。しかし、もし学習機関に文字通りに統計力学が当てはまるなら、もともと統計力学が適用されている外部の物理的な環境との差がなくなってしまう。

もちろん生物と環境には振る舞いに違いが観察されるので、どこかに問題があるはずだ。それは学習機関は文字通りの統計力学そのものが当てはまるのではないことだ。だが、それをうまく指摘してくれる文章がないので、自分で勝手に考えてみた。

統計力学エントロピーと結びついた考え方をする。基本の考え方は、どんな整理された部屋も放っておくと散らかり続けることだ。集められた熱を留め続けることはできないとすると、世の中に完全な断熱装置はないと結論できる。

統計力学情報理論との関連性も強く、ここでの話題ではこれが重要だ。情報理論は情報の圧縮はどのくらい可能か?でも語られるが、ここでは記録(記憶)と関連付ける。部屋は放っておくと散らかり続けて、長い時間が経つほど散らかし具合が激しくなり、もとの部屋の状態は分からなくなる。これは情報理論的には、記録に雑音が入り続けて元の記録が分からなくなる感じに似ている。「元の状態を保つ=元の情報を残す」には余分なエネルギーが必要なのだ。

外部の物理的な環境には統計力学的には記憶機能はないが、学習機関としての生物には学習状態を保持する意味での最小限の記憶機能はある。状態を保持するだけでエネルギーは必要になるので、統計力学的にはそれはそれは無駄でしかない。学習機関としての生物になぜそんな記憶機能が必要かと言えば、それは生物は生存(と生殖)という目的を持っているからだ。生物と環境の境界は目的によって定められている。生物を目的によって捉えるのは、哲学では目的論として昔からある。

生物が目的を果たすためには記憶機能が必要だが、そのために無限の記憶能力を持つのは単なるエネルギーの無駄でしかない。目的論と統計力学との間のバランスをとるのが、汎化能力であり、これこそが学習機関そのものだ。汎化能力とは、目的を果たすために最小限のエネルギー消費で済ますための原理だ。

とりあえず、最初の話題では書けるのはこの辺りまでかな。

二つの統計的因果推論を共通項から見渡す

もう一つは統計的因果推論だけど、実は途中まで記事は書いたが、無作為化比較試験(RCT)と相関と因果の関係のような基礎知識をざっと簡潔に説明しただけで長くなってしまい、本番となるルービン流とパール流の因果推論に入る前に力尽きた。ただでさえSNSをやりすぎて文章を読む集中力も読解力も失われてるともされるのに、あまり長い記事はどうせ読まれないと思うと書く気が失せる(この文章も長いが読まれなくとも気にならない…ような気楽な書き方をしてる)。

以下は、私流の統計的因果推論への個人的な理解であって、これが本当に正しいかどうかは(これを取っ掛かりにして)自分で確かめてください。

ルービン流とパール流の因果推論に共通の考え方は、相関だけから因果は導けないので交絡を補正して因果を推論することだ。要するに、要因(変数)同士がぐちゃぐちゃに絡んでるのを統計処理上で解きほぐすことで因果を導くのだ(相関→補正→因果)。

ルービン流

ルービン流の因果推論では、RCTにおける対象のランダムな割り当てを統計上で実現させる。例えば一方の条件に男が多い時に条件ごとに性別の影響が均等になるように数値を補正するが、これは傾向スコアの方法だ(交絡の補正)。

ルービン流では、属性(性別や学歴など)を持った対象が条件に割り振られるとそれに対応する効果が現れるとする(対象[属性]→条件→効果 ;潜在結果フレームワーク)。ここからSUTVAの説明もできる(例えば条件に割り当てた後の要因は扱えない)。

パール流

パール流の因果推論は、パス解析(構造方程式)とグラフィカルモデル(因果ネットワーク)からなるが、これらの間の関係がうまく説明されない。構造方程式は単に要因(変数)間の関係を見るだけで相関のレベルに留まる。可能な構造方程式から描かれる複数のパス図(因果ネットワーク)の内どれが正しいのかは分からないので、グラフィカルモデルを使って要因間の絡まりを解きほぐして、正しい因果ネットワークを選び出す必要がある。

例えば、必ずしも測定した要因(共変量)を全て用いて分析していい訳でなく、そうすると余計な交絡が生じてしまうこともあり、影響関係を過大または過小評価したりする原因となる。場合によっては、せっかく測った要因を分析から外す必要もある(交絡の補正)。そういったことを判定するのがグラフィカルモデルの役割だ。

パール流の場合は、要因間の関係を直接に探るのが特徴だが、正しい因果ネットワークを選ぶのは困難も多く、その点ではルービン流の方が実用的。ただ、それまでのパス解析にあった、これで分かるのは選ばれた要因の間の相対的な影響関係だけであって、因果推論と呼ぶには相応しくないのでは?(所詮、分かるのは相関に過ぎない)、という疑問にパールが答えてくれてるのは大きな功績だと思う。

ちなみに、パール流でのグラフィカルモデルは、(ルービン流での)潜在結果モデルを扱うことはできる(含んでいる)が別に前提ではない…と思う。

他に気づいたこと

統計的因果推論を理解することの長所は、エビデンスベースにも活かせる因果への深い理解に達するのにも便利なところにもある。だが、今はまだテクニカルな話ばかりが目立って、そういう考え方に突っ込んだ説明が日本では見当たらないのは残念。パールが近年書いた因果推論の一般向け解説書が訳されれば状況はマシになるのかな(内容は確認してないので私にはよく分からない)。

他にも、反事実(counterfactual)は本来は形而上学的な概念な故にそもそも観察自体が不可能なのに、統計的因果推論の説明ではその辺りが分かりにくくなってる(反事実が観察不可ゆえにランダムな割り当てを用いる)。この辺りは哲学の知識を持った人が語らないと誤解を与えやすいと感じる。

折り返しものさしによる分極化指数への批判は正しいのか?

以前にここで書いた記事「記事「ネットは社会を分断しない」を分析する」と似た内容を、さらなるデータと分析によって徹底的に論じた記事があったので、お勧めします

分断と分極化の違いをはっきりと書いてくれてない1などの欠点もあるが、私にも賛同できる点も多く、詳しくはリンク先の記事を読んでもらいたい。ただ一箇所だけ…あれ?とどうしても思う部分があったので、そこだけメモ的に指摘しておきます。

第五節「ミスリーディングな分極化指数」を分析する

それは、この記事の第五節の「ミスリーディングな分極化指数」なのだか、冒頭を長くなるがそのまま引用しよう。

最後に取りあげる問題点は、そもそも田中氏らの分析が、[3]ミスリーディングな「分断」度の測り方――分極化指数――に依拠していることだ。その測り方とは、次のようなものである。
まず、保守的だとプラス(+)に、リベラルだとマイナス(-)の値をとるような、政治意識の「ものさし」をつくる。さしあたって仮に、このものさしで測ると、きわめて保守的な人は+3、きわめてリベラルな人は-3になるとしよう。保守でもリベラルでもない穏健派は、真ん中の0である。
次に、このものさしで測った値を絶対値に変える。そうすると、-3(きわめてリベラル)も+3(きわめて保守的)も、同じく3になる。言ってみれば、ものさしの目盛りを中間の0で折り返して、マイナスの測定値をプラスに付け替えるようなものだ。

こうして田中氏らの分極化指数が折り返しものさしとして批判されることになる。

保守/リベラルのものさしの問題点

上の引用では、政治意識のものさしは作れるものと端的に前提されているが、復習も込みで私の批判は書いておく。

オリジナルの記事でははっきり質問を保守とリベラルに分けたとある。政治的なものさしを作る上では、私の前の批判記事でも指摘した保守とリベラルへの質問の恣意的な分類が問題になることには変わりがない。現在は政治的な左右観が混乱した時代なので、この分類は難しい問題のはずだ。

前に挙げた質問別分析が難しいなら、せめて因子分析で保守とリベラルの軸が出るかを調べて、もし軸が出たならその結果を使って分析するのか一番妥当な分析だと思う。ちなみに、私はそんな軸はうまく出ないと予想する。

絶対値を使った折り返しものさしは本当に信頼できないのか?

ここで本当に論じたいのは絶対値を使った折り返しものさしの方なので、ものさしの問題はこの程度で済ませます。別に左右が政治意識の唯一のものさしでもないので、適当に都合の良いものさしを持って来れば良いだけの話だ。

しかし、絶対値を用いた折り返しものさしに関するこの記事の議論は私にはどうもしっくりこないので、そもそもの批判対象の田中氏らによる元の分析との関連は抜きにして、折り返しものさしの部分を集中的に取り上げます。

折り返しものさしは分極化を測ってないのか?

これも記事から該当部分をまるまる引用します。参照されてる図については元の記事にあるので、それを見てください。

比較的わかりやすい例を、図bに示そう。100人の政治意識の分布が、ネットの利用によって、パターン(i)から(ii)に変化したとする。それぞれの分極化指数を計算すると、分布パターン(i)が1.18、(ii)が1.17になる。つまり、(i)から(ii)に変化することで、分極化指数は低下し、「穏健化」したことになってしまうのだ。
分布パターン(ii)は、明らかに(i)よりも保守に偏っている。確かに両極に分かれているわけではないが、少なくともこれを「穏健化」とみなすには無理があるだろう。また逆に、(ii)から(i)に変化した場合には指数値が上がるため、0の穏健層が増え、保守とリベラルが均等化しているにもかかわらず、「分極化」が進んだことになってしまう。このように、分極化指数は多分に誤った解釈を導きかねず、信頼性に乏しいのである。

ここで二つのグラフが参照されているが、どちらのグラフもいわゆる正規分布(二項分布)に近い山型の分布になっている。目立つ違いは、上のグラフ(i)は真ん中のゼロを中心に分布してるが、下のグラフ(ii)は中心が少し保守に寄って分布している。これを根拠に上の引用部分の指摘があるのだが、どうもここには分極化に対する誤解があると思われる。

どんな分布なら分極化してると言えるのか?

著者は山型分布の中心が保守にズレているのを分極化とみなしているが、これは間違っている。分極化とは、見解が両側に極端に分かれることを言う。山型分布の中心が移動しただけでは、両端の割合が増えたことにはならない。その場合は全体の見解が以前より偏った事にはなるが、その事態は穏当化とは確かに呼べないが、別に分極化とも呼べない。

分極化したとはっきりと言えるのは、分布が凹型に中心がへこんだ場合だ。分布による分極化具合を横に並べるとすると、一方が凸型(山型)になり、他方が凹型になる。すると真ん中が意見が均等に分かれた平たい分布になる。この横の直線の中を、凸型から出発して平たい分布を経て凹型へと向かう分極化が激しくなる道をたどるとする(凸→口→凹)。

分布が山型(凸型)から平ら型への道をたどるのは、平ら型から凹型へ向かう道と同じで、分極化が強くなる傾向を辿っている。では、分布が山型と平ら型の途中はどうなっているだろう。想像してもられば分かるが、山型と平ら型の中間点では山型の中心(最頻値)が低くなってるはずだ。つまり、同じ山型分布なら中心が低い方が分極化は高いことになる

分布パターンと折り返しものさしの指数を比較する

ここで元記事にある二つの分布に戻ろう。まず、山型の中心がずれたことは分極化とは関係がない。そこで次は山型分布の中心の高さを見ると、上の分布(i)の中心26より、下の分布(ii)の中心30の方が大きく、山が高い。既に見たように山が高い方が(見解が集まってる分だけ)分極化はむしろ低い

それぞれの分極化指数を計算すると、分布パターン(i)が1.18、(ii)が1.17になる。

この分極化指数(折り返しものさしによる指数)でも、分布(i)の1.18より分布(ii)の1.17が数値が少しだけ低いので、分布(ii)の方が分極化が低いと出ている。少なくともこの例では、分布パターンによる分極化評価と折り返しものさしの指数による分極化評価はほぼ一致している。

ここではっきりと言えるのは、記事の著者による分布パターンからの分極化具合の推測が間違っているのであり、折り返しものさしによる指数が分極化を反映してないという結論には大きな疑問があるということだ。

ただし、折り返しものさしによる指数がどのくらい分極化を正しく表しているかどうかは、きちんとした数理的な分析が必要なので、ここでは結論は出しません。2


  1. 正確には書いてなくもないが、文章の中に埋め込まれてるので読解力がないと気づけない。分断と分極化の違いはこの記事にとって重要な部分なので、始めにその定義をきちんと書いておくべきだった。

  2. 記事の説明から推測すると、極端な保守とリベラルとに半々に真っ二つに分かれている場合と、極端な保守(またはリベラル)の一方に全てが集まっている場合では、絶対値の平均値が同じになるが、前者は分極化してるが後者はしてない。まぁ、後者の場合はそもそもものさしに問題があるような気もする。もし分極化だけを純粋に測りたいなら、単に真ん中の項目で折らずに、中央値で折れるように数値を変換する方がマシかもしれない。