統計について勘違いしやすい注意点を並べてみた(私家版)

この前、ツイッター上で統計に主義はいらないか?でもめてるのを見た。結果としては大した議論にはならなかったのだが、実はそれと同じ内容を日本の学者が主張しているのを既に見ていて、違和感はあった。海外の学者がそんな主張をしているのを見たことはない。

統計に主義はいらない論は、日本の一部の統計学者が主張している。その学者たちは赤池弘次からの影響を主張しているのも見たことがある。しかし、赤池弘次が確率の解釈や統計のパラダイムを論じている論文1を見つけて読んだら、その影響がどんなものか?かなり怪しく感じた。

正直、日本の学者が非標準的な話を注釈なしで平気でするのには慣れてる(仕方ないので海外の学者を参照する)ので、そこは(直してはほしいが)あまり気にしてない。しかし、統計に関しては海外も含めてそもそも整理されていない所が多すぎる。

統計について私が気づいた注意点

という訳で、私が今のところ気づいた統計の話についての注意点を羅列してみた。私の勘違いが混ざってる可能性はゼロではないので、そこは各自でご確認ください。個々の議論はそのうちやる気が出れば別の記事でやるかもしれません。

  • 頻度主義vs.ベイズ主義における、「頻度主義」の安易な使用はやめてほしい。頻度主義は本来は確率の解釈の用語なのに、統計のパラダイムにも同じ用語を使うのはややこしい。古典的統計を使う方が妥当

  • 「頻度主義」を使うにしても、そこにネイマン&ピアソンだけでなく、フィッシャーをも含むのはやめてほしい。ネイマン&ピアソンは試行の無限繰り返しを前提にしてるからまだ許せるが、フィッシャーはその前提を受け入れていないので、頻度主義と呼ぶには相応しくない

  • 統計的検定において、p値を信頼区間に変えれば問題が解決するかのような主張はよく見るが、どっちを使ってもやってることにあまり変わりはない。google:大久保祐作 會場健大 p値とは何だったのかのAppendixを参照

  • 統計的検定において、古典的統計をベイジアン(特にベイズファクター)にすれば問題が解決する…とする主張はよく見る。しかし、解決するのは主に停止規則の問題ぐらいで、どうすれば有意であると言えるか?の基準が必要なのはどっちみち変わらない

  • ベイジアン2における事前確率(事前分布;どっちも英語ならprior)の問題は今でも解決してない。ベイジアンが普及したのは、このprior問題の解決とは関係ない。だから、主観的確率がいらないなんてことはありえないし、実際に主観的確率を採用してる学者は現在でもいる。

  • 事前分布に無情報事前分布を採用すれば問題は解決する…とするのは誤り。特に無情報事前分布の代表である一様分布を採用すれば構わないと思ってる人は多い。しかし、一様分布は変数を変換すれば無情報ではなくなるが、どの変換が正しいかは自明ではない;google:山村光司 統計の哲学 RD基準の背景について]も参照。これは論理的確率の問題に遡れる問題でもある;[google:高尾克也 無差別の原理とBertrandのパラドックスを参照。

こうやって書いてて思ったけど、確率の解釈と統計のパラダイムがごっちゃに語られるのは混乱の元でしかないと思う。

例えば、確率の解釈としての頻度主義とネイマン&ピアソンの頻度主義は同じ名で呼ばれがちだが、無限試行の他にどのくらい共通点があるかよく分からない。確率の解釈としての頻度主義では極限が注目されるが、ネイマン&ピアソンの頻度主義ではむしろ分散や誤差が問題になる。

他にも、ベイズ主義として一緒くたに論じられがちだが、無情報事前分布は論理的確率と本当は結びついている(ハロルド・ジェフリーズ)が、主観的確率と一緒にされがちなのはややこしいだけ。論理的確率と主観的確率は一応分けてほしい。少数とはいえ、論理的確率を採用する学者も海外にはいる。

以下は、完全に個人的な見解

最後に、完全に個人的な見解を述べます。統計は尤度を中心にして教えられるべきだと思う。歴史的には、尤度主義は古典的統計よりもベイジアンよりも後に登場したが、歴史的な順とは逆に教える方が効率的だと思う。

ベイジアンはもちろん、古典的統計でも尤度の考え方は活用されている。ただし、古典的統計では尤度原理が採用されてないので気づかれにくいだけだと思う。私にはp値が尤度と全く無関係には見えないし、実際にp値を提唱したフィッシャーは尤度の重要性を提示した学者としても有名だ(ちなみにp値と信頼区間が交換可能なのは既に触れた)。

尤度を単に高めるのを目標にするとモデルの過剰適合(overfitting)が起こる。各種の統計パラダイムはこれを修正する(しない)のが目的だ。古典的統計とベイジアンの最大の違いは、事前確率の想定と共に尤度原理が成り立つかどうか?にある。最近は尤度原理は成り立つ方が良いと信じられがちだが、赤池弘次によってそれは批判されている;google:赤池弘次 確率の解釈における困難についても参照。各統計パラダイムを反映したAICBICの式を見ると、これらが尤度への修正なことがより分かりやすい。

尤度は過剰適合を考慮すると、ニューラルネットワークともむすびつけられる予感はするが、まだ私にはよく分からない。


  1. google:赤池弘次 確率の解釈における困難について]や[google:赤池弘次 統計的推論のパラダイム変遷について。これらの論文の内容にはここでは触れないが、今でも読む価値のある論文なのでお薦め。ここから統計に主義はいらない論を導くのは無理がある。

  2. ここで「ベイジアン」との用語を使っていて、ベイズ主義でもベイズ統計でもないことに深い他意はない。統計のパラダイムとしてのベイズ主義と分けたのと、ベイズ統計とするとベイジアンネットワークや合理的選択理論を外してるように見えるので、中立的な用語としてベイジアンを使っているだけ。

科学は泥沼が面白い?

今年に入ってから、予測処理論への本格的な批判が目立ちつつある。前に紹介したMiłkowskibらの論文("Unification by Fiat")や、既に軽く触れたDaniel Williamsの草稿1、まだここでは紹介してない暗い部屋問題を扱った文章での行動主義理論との比較も興味深い。マルコフブランケットを数理的に批判した論文も見かけた。予測誤差最小化で有名なJakob Hohwyでさえ、最終的には擁護するとはいえ、自由エネルギー原理に不可解で曖昧なところがあることを認めている google:Jakob Hohwy Self-supervision, normativity and the free energy principle

しかし、こうした批判が増えてきていることは予測処理論にとって不幸なことでなく、それだけ注目されてる証拠でもある。ここを乗り越えられれば、予測処理論は科学理論としてより広く認められるだろう。Daniel Williamsが最近の論文2で、ベイジアン精神医学の事を魅力的だが問題含みだと指摘してるが、これは予測処理論そのものにもそのまま当てはまる。

科学とは一般にイメージされるようなスマートなものでは必ずしもなく、論争が生じるような泥沼こそが科学の面白いところだ―と個人的には思う。リアルタイムでそれが起こりつつある予測処理論は今こそが旬かもしれない3


  1. 「Is the Brain an Organ for Prediction Error Minimization?」

  2. google:Daniel Williams Marcella Montagnese Bayesian Psychiatry and the Social Focus of Delusions] 。この論文はベイジアン精神医学に社会的視点を取り入れようとしている。そういえば、最近の社会的視点を扱った自由エネルギー原理の論文としては [google:Samuel P. L. Veissière Axel Constant Maxwell J. D. Ramstead Karl J. Friston Laurence J. Kirmayer Thinking Through Other Minds: A Variational Approach to Cognition and Cultureがあった。この論文にはゴフマンやブルデューなどの社会学の文献が参照されてて専門外への目配りに感心する一方、その雑な扱いには不満しか感じない。他にも色んな分野の文献が参照されてるが、全般的に扱いが表面的。こんなんが統一理論だと提唱してる一端かと思うと頭痛い。欠点が反表象主義と似てきてる懸念が拭えない。

  3. (認知科学に限らないかもしれないが)興味深い研究は他にも色々とあると思うが、議論が集中するほどに注目される研究が出てくることは多くない感じがする。特に現代は世界中から研究者も論文も大量発生に出てきていて、領域を限定しても追っていくのは相当に大変だ。ましてや、理論以前の問題として再現性や一般化も問題になっており、成果を共有すること自体に困難がある。

なぜお役立ち野郎が資本主義の敵なのか?(注つき)

最近、役に立たない科学はいらない!的な発言をする人を日本でもよく見かける。そういう奴を見かけるたびに、資本主義の本質を理解してない馬鹿な奴らだなぁ〜と軽蔑せざるを得ない。既成のお役立ちという閉じた価値観の中にいては、資本主義の中での発展はありえない。

以下には、私が独自にまとめた資本主義への理解を書きます。ちゃんとした理解をしたい人はちゃんとした学者から話を聞いてください。

資本主義の基本としての市場原理

今の政権は、一方で国民に自助を第一に勧めておきながら、他方で携帯電話料金の設定に介入しようとしていて、市場の力などちっとも信じていない。こんな政治家どもはもはや新自由主義(ネオリベ)ですらなく、私には軽蔑の対象でしかない(ハイエクぐらい読めば?)。

情報の分散的な処理としての市場

市場原理の優れたところは、その情報の分散的な処理による効率の良さにある。市場原理と対照的な中央集権では、全ての情報を中央に集めて最適化を目指す処理をする。しかし、こうした中央集権的な国家はすでに失敗している。それは旧ソ連だ。

旧ソ連の計画経済を実施していたが、結局は失敗した。歴史的な分析は専門的な書籍を読んでもらいたいが、その失敗の原因は中央集権的な手法の効率の悪さにある。わざわざ情報を一箇所に集めて処理するという方法は、時間的にも空間的にもまどろっこしいものでとても効率が悪い。各個人が欲しい商品を見つけ値段を比べるという、市場による情報の分散的処理の方が明らかに効率が良い。

分散的な処理が効率的な他の事例

東日本大震災のときに、自治体や組織ごとにお金を集めて活動すれば良い…とする議論に対して、それではお金の行き渡り方に不平等が生じるから国が一括でお金を集めて分配すべきだ!との意見が出た。それは時間に余裕があるなら構わないが、緊急時にそんなことしてたら効率悪いわ!と思った。まぁ、実際に国が集めたお金が必要な人に届くのに多くの時間がかかった。分散的な処理の優位性を理解できてないことは恐ろしいことだ…と思った覚えがある。

もちろん、市場は完璧なシステムではない。全ての人を満足させる均衡状態に向かうには様々な試行錯誤が必要だ。しかし、分散的な処理の持つその中央集権的な手法に対する優位性は理解しておくべきだ。

なぜ資本主義には市場の他に外部が必要か?

しかし、市場だけでは資本主義の発展はありえない。市場は数理的には均衡システムに喩えられる。市場は既存の情報に沿って物事を最適に向かって整理してるに過ぎない。資本主義には、エネルギーや物質をやり取りする環境や、これまでにないアイデアや商品を生み出す革新(イノベーション)、といった外部が必要である。

部屋のお片付けとしての市場とその外部

ここにグチャグチャに散らかった部屋があるとする。市場原理とは、この散らかった部屋を片付けて使える空間を空けることである。だが、あくまで部屋の中の物をあっちにやったりこっちに持ってきたりして整頓してるだけだ。空く空間には限界がある。もちろん部屋を広げることもできる(海外への市場の開拓)が、それが唯一の方法ではない。

例えば、部屋からいらないゴミが溜まってきたらどうしようか?もちろんゴミは部屋の外に出して捨ててしまえば良い。ただ調子に乗ってそれをやりすぎると、部屋の外がゴミだらけになる(エコロジー問題)。もし部屋の外に人が住んでいれば揉めることになるが、それも人のいない文句を言ってこないところに捨ててしまえば済む(市場の外部性)。

市場を活性化させる外部を必要とする資本主義

ここまでは、部屋の中の物を比喩として語ってきたが、物をアイデアを変えても同じことである。物であれアイデアであれ市場でやり取りされれば同じく商品価値を持つ。しかし、前半でした市場の説明は新しい商品が生み出されない、閉じた均衡システムを想定していた。だが、閉じた部屋の片付けはいつか終わるように、閉じたシステムは均衡状態に陥ったらそこで終わりだ。

市場を再び活性化させるには、商品価値のある新しい製品やアイテムが必要だ。その際に、既にある既存の価値観の中に閉じていては、新しい価値は生まれない。むしろ、誰もが思っても見なかった新しさこそが市場を活性化させる。しかし、新しさのためには試行錯誤が必要であり、試行錯誤の過程で多くの無駄が出るのは避けることはできない。

お役立ち野郎が資本主義の敵である理由

役に立たないとされてきた科学研究が、後に商品化された例は挙げると切りがない。役に立たないの典型とされた数論でさえ、今や暗号理論として役立っている。画期的な発明がされた時に、泥縄で一から研究を始めてたら明らかに手遅れ。それを理解してないお役立ち野郎は日本を世界で貧しい国にしたいとんでもない奴でしかない。

外から叩かず内から叩く戦法の勧め

科学が推奨され表向きの理由は、世界の真実の探求である。そこからお役立ち野郎を批判することもできるが、そもそもの前提を共有してないので、それではろくにダメージを与えられない。

むしろここは、彼らでさえ共有できる目的から叩く方が効果的だ。彼らが資本主義さえ否定するなら、お前のお役立ち思想ってなんの意味があるの?と問い返してみましょう。新自由主義としてさえ一貫できない御都合主義は葬ってあげよう。

それから一応指摘しておくが、この記事は資本主義の擁護が目的ではありません(その辺りの皮肉は察してください)。それからここでの議論が人文学には当てはまらない…とする懸念に対しては、人文学的教養の行く末という別のアイデアもあるので、気が向いたら記事を書きます。

お薦め

市場の均衡システムについては、経済学の文献を探せば書かれているものは多いので、ここでは特にお薦めはしないでおきます。ただ個人的には、ハイエクの経済思想ぐらいは知ってほしいが、適切な文献を思いつかないので省略。


斎藤幸平はマルクスの「資本論」からエコロジー思想を読み取った研究で世界的に知られるようになった。記事では軽くしか言及しなかったその辺りのことはそちらで読んでほしい。


人間社会の外部環境とのエネルギーのやり取りを、エントロピーの視点から説明した論文。これに限らず、システム的な考え方はもっと広がってほしいと願う。


これは今、私が最も楽しみにして読んでいるネット連載。資本主義に抵抗したはずのカウンターカルチャーによって作られた外部でさえ、資本主義に回収されてしまう悪夢を資本主義リアリズムとして指摘したマーク・フィッシャーを軸にして、カウンターカルチャーのあり得た未来を探る連載。単独で読んでも面白そうなところにリンクした。