あまり確信の持てない軽めの思いつきの話はこれまではだいたいはてなハイクに書いてきたのだが、はてなハイクが無くなるということでもう書く気が起きない。いつの頃からかブログの方は比較的きちんとした記事を出すことになってしまっていたが、かといってツイッターのようなSNSは嫌いで書く気もしないし、どうせこのブログは相当な過疎地になってしまったようなのでこっちで適当な一人言も書くことにした。面倒なので怪しめの独り言はタイトルをつけないで出すので、まぁ区別はつくだろう。

はてなハイクの時と同じで適当な独り言のときは必ずしも認知科学や哲学に限らず気ままに好きなテーマで書くつもりだが、最初なのでまずは認知科学関連の話から。最近の認知科学は二十年近く前に私が好きなった認知科学とはかなり姿が異なってしまい、今でも自分が認知科学を好きなのかもうよく分からない。

哲学者デネットが最近翻訳された本で自分のことを素人だと言っていたが、お前が素人なのか〜と突っこみたくもなるが、現在の激しい専門分化を考えるとそう言いたくなるのも仕方がないかもしれない。黎明期の認知科学を知っているデネットのような人からすれば、プロなど誰もいないまさに素人だらけで始まった中で自分の好きな話題について自由に幅広く議論できた記憶があるのだ。しかし、今のような細分化されたテーマでなく、それを超えて大きな話をしていた時代は過ぎ去り、そうした細分化されたテーマを超えた話をしていた学者もほとんど亡くなってしまい、デネットはその数少ない生き残りになってしまった感は拭えない。

かといってたまにいる専門分化の否定論も間違いで、そりゃあ学問の進んでいなかったルネサンス時代ならまだしも、各専門分野の中ですごく賢い研究者が切磋琢磨している現在において、安易に壮大な話をするやつはただの無知でしかない可能性のほうがよっぽど高い。とはいえ、分野やテーマを超えた議論をする人がいなくなってしまうのも寂しい。私は認知科学における既存の研究テーマを超えた大きな理論に惹かれた面もあるので残念と言ったら残念だが、学問の進歩という点では仕方がないと言われれば仕方がない。

もともと予定していた話をする前に長くなってしまったのでおしまい。次回以降も気が向いたら出します。

書評 O.A.ハサウェイ&S.J.シャピーロ「逆転の大戦争史」

逆転の大戦争史

法学者が戦争の違法性を巡る歴史を描いた読みやすい一般書

本書は原題は「国際主義者たち」で副題は「いかにして法外な戦争へのラディカルな計画が世界を形成したのか」だ。国際主義とは力の均衡を謳うリアリズムと対になる交際関係論の用語で、世界中の国家の協調を主張する考え方だ。著者らは基本的に国際主義を擁護する立場だが、その部分は最後に主張されるだけで、本文の大部分は戦争の合法/違法を巡る歴史について読みやすく書かれている。全体としては、国際関係論 (国際法)についての一般書として読む価値はあるが、やはりこのテーマに興味のある人以外にもお勧めできるかは微妙(知識ゼロだと流石にきつい)というところだろうか。本に対する評価が厳しい私でもこれが良書であることは認めざるを得ない。

この本は全体の流れとしては、第一部が近代ヨーロッパ成立期の旧世界秩序・第二部で世界大戦期の移行期・第三部が戦後の新世界秩序となっており、大きく歴史的な流れに沿って構成されている。先に各部についての私の評価を述べると、第一部は本書の白眉、第二部はいいところも悪いところも半々、第三部は各章の話は興味深いがまとまりに欠ける…といったところだろうか。全体としては、厳密な歴史書にありがちな事実の淡々とした記述でもなく、事実や知識に無頓着の評論家や雑な学者が書きがちな大味な歴史観披露とも異なり、文献に基づきながらもその時代の傾向を適切に示したバランスの取れた著作となっている。

一般的に、交際関係論はウェストファリア条約から語られることが多い。しかしこの本の特徴は、近代ヨーロッパの作り上げた旧世界秩序をウェストファリア条約より前の法学者グロティウスにまで遡って論じていることで、そのことで旧世界秩序の隠された目的を明らかにしていることだ。一般的には平和主義者とされていたグロティウスを、その若き頃の文書にまで立ち返ってその本意を明らかにする第一部はこの著作の白眉と言って構わない。旧世界秩序において、いかに戦争が合法化され、それがどのような目的で為されたのかを見事に描いていており、読んでいて感心することしきりであった。この部分だけのためでもこの著作は読む価値はあるかもしれない。

この著作のもう一つの特徴は、それまで注目されることのなかったパリ不戦条約に注目することで、旧世界秩序と新世界秩序との闘争から新世界秩序の成立へと向かう過程を描いていることだ。特に第二部の前半は明治維新から世界大戦期に至る国際的な日本の動きを描いており、日本で生きる人なら興味を持って読みやすい。大きな特色としては、欧米では第二次世界大戦に突入する日本は否定的に描かれがちだけれど、この本では旧世界秩序に学んだ日本がその後の新世界秩序への動きに抗するという図式で書かれており、当時の日本に理解を示した描かれ方をしている。ただし、そうした理解ある態度は日本と同じ枢軸国であるドイツには示されず、第二部後半における世界大戦期のドイツを生きた著名な法学者カール・シュミットについての論述はナチスに協力した御用学者という旧態依然とした描かれ方をしている。その結果、世界を都合よく分割した連合国が(侵略)戦争を違法化する新世界秩序を形成しようとしたという視点が(気づいているにも関わらず)弱くなってしまっているのは否めない。そしてその視点が欠けているせいで、なぜ世界大戦の終戦後に連合国側が植民地を手放すポストコロニアル時代がやってきたのかが見えにくくなっているのはこの本の大きな欠点だと思われる。

第三部は第二次世界大戦が終わった後の、戦争が違法化された新世界秩序がどのような世界か?が描かれている。小国家の増大やその結果としての失敗国家の発生など各章の話自体は興味深いのだが、いかんせん第三部全体にまとまりがあまりない。その理由はすでに述べた理由もあるしそもそもまだ歴史的に近すぎて客観化できないせいもあるだろうが、いくら紙数の問題もあるだろうが東西冷戦にほとんど触れていないのはいくらなんでも不自然に感じる。とはいえ、個々の章の話題は面白いのでそれは勝手な無い物ねだりかもしれない。最後は国際主義賛美で終わるが、そうした思想的主張はほぼここだけで抑えらているのも好感が持てる。

国際関係(国際法)の歴史についての一般向け書籍としてバランスの取れた読みやすい本となっている。本文において思想的偏見はかなり抑えらているので、国際主義への賛否に関わりなくお勧めできる。

逆転の大戦争史

逆転の大戦争史

勘違いしやすい統計の基礎用語を整理する

ベイジアンについては、認知科学の理解にとっても重要だし統計的検定にも関心があるしで、相変わらず勉強中なのだが、その過程で困ったことがある。実は、頻度主義とベイズ主義の比較に興味を持ってネットにあった日本語の論文やスライドを幾つか見たのだが、そこで困惑する事態に出会った。

それは、それらの文献や資料において使われている用語についての定義の仕方が互いに整合性が取れないことだ。困ったことに、どの文献や資料も内容はもっともらしくてどの用語の定義を信用していいのかよく分からない。こういう場合は仕方がないので、英語の論文を含めてより広く文献を探すことにしている。そうこうしているうちになんとなく理解できるようになったので、あくまで勉強中の素人による理解として聞いてください。

頻度主義は本来は確率論の用語である

頻度主義とベイズ主義を比較した文章を読むと、仮説検定や推定についての話が出てくる。仮説検定法には後で詳しく論じるが、仮設検定法を主題とした文章をそうした比較を主題とした文章と照らし合わせると、どうも言っていることに違いがある。その違いがうまく解消できなくて困ってしまった。そこで英語の文献に頼ったのだが、そこで分かったが、頻度主義とベイズ主義を仮説検定や推定に関わる用語として直接に用いている人は多いが、これは正確には問題があるということだ。頻度主義というのは本来は確率論の用語であり、確率論として頻度主義を採用した立場が頻度論の統計や推論であるということだ。ベイズ主義とベイズ統計・ベイズ推論とを全く同じ意味として用いることは少なくとも誤解を招く原因である。

ただややこしいのは、確率論の基礎的な考え方として頻度主義(frequentist)とベイズ主義(bayesianism)があるという言い方はしないわけではないが、もっと一般的には別の分類法を用いる。確率論の立場としては、論理説、主観説、頻度説、傾向説 1と大きく四つに分けられ、その中でも前者二つは認識的確率 2、後者二つは9偶然的(客観的)確率と呼ばれる(「リスコミでの確率による不確実性伝達の課題」を参照)。些細なことを言うと、主観説とベイズ主義はたいてい一致するが、必ず一致するわけではない。細かい話は別にしても、はっきりと言えることは頻度主義(ベイズ主義も?)はあくまで確率論の用語であって、確率論としてそれらの立場に立った統計学が構築されていると考えるのが妥当だ。

頻度主義に基づいたのがネイマン-ピアソン流の統計的推論だ

頻度主義の説明として仮説検定法や推定法が挙げられることは多い。この説明に問題があることはすでに述べたが、実はこの説明の仕方に問題があることは始めは別の方面から気づいていた。なぜなら、頻度主義とベイズ主義の比較について調べるよりも前に、統計的推論におけるフィッシャー流とネイマン-ピアソン流の違いに触れた論文を先に読んでいたからだ。頻度主義の説明として二者択一的な仮説検定法が挙げられることがあるが、これは大間違いとまでは言わないが、正確にはネイマン-ピアソン流の統計的検定法の特徴だとするのが正しい。私のような素人にはネイマン-ピアソン流以外に頻度主義に基づいた統計学があるのかどうかよく分からないが、少なくともそれが誤解を招く言い方なのは確かだ。好意的に見れば、頻度主義として二者択一的な仮説検定法を挙げるのは一般に普及した主流の仮説検定法を批判する目的であることは理解できる。しかし、実はここにもう一つの罠がある。

普及した仮説検定法は純血のネイマン-ピアソン流か?

一般に普及した主流の仮説検定法がネイマン-ピアソン流の仮説検定法だとはよく言われる。しかし、それも正確には正しくないらしい。それに気づいたのはそれを主題にした論文を見つけて読んだせいだが、実はそれ以前から違和感を感じていた。統計学者のフィッシャーとネイマンの間の論争を論じた論文を読んでいたときに、フィッシャーについての説明の中でp値が触れられているのを読んで不思議に思った。なぜなら、最近の再現性問題で話題にされたのがp値の誤用だったからだ。もちろんp値の誤用は主流の仮説検定法の元に行なわれた誤りだ。つまり、主流の仮説検定法にはネイマン-ピアソン流の二者択一の仮説検定とフィッシャー由来のp値がともに含まれていることになる。このことには薄々気づいていたのだが誤魔化していたところで、「機能的ツールとしての統計的仮説検定」を読んで疑いが確信に変わった。一般に普及した仮説検定法はフィッシャー流とネイマン-ピアソン流が混ざったハイブリッド仮説検定法だったのだ。

主流の仮説検定法の問題がネイマン-ピアソン流の仮説検定法の問題として語られることは多いが、実のところこれは正確には異なる。例えば再現性問題において、有意差を出すために標本数を事後的に変えることでp値を調整することが問題としてあげられた。しかし、これは主流のハイブリッド仮説検定法だからこそ生じる誤りであり、ネイマン-ピアソン流の仮説検定法の問題ではない。純粋なネイマン-ピアソン流では前もって標本の大きさを決める過程があるのに主流の方法ではそれは必須になっていない。標本数が増えるほど有意差は出やすくなる(小さな差でも有意になる)ことは知られているが、それを考慮すれば標本数を前もって決めるべきなのは当たり前だ。いくらなんでもネイマンやピアソンがそこに気づかないほどまでの馬鹿ではなかった。むしろ馬鹿なのは仮説検定を無理矢理ハイブリッドにしてしまった側の学者たちだ。

あなたは仮説検定における二つの過誤を本当に理解しているのか?

仮説検定法については標本数の他にも効果力や検定力の問題もあるが、詳しくはリンクした論文を読んでください。実はこの論文を読んで気づいた大事なことがもう一つある。それは統計学の授業や教科書で必ず触れられる二つの過誤についてだ。私は心理学科の出身だが、統計の授業で二つの過誤がよく理解できなかった。その後も、稀に気が向いた時に統計の教科書を見てみても、どうしても第一の過誤と第二の過誤の話がよく分からなかった。それは私に頭が悪いからだと長らく思っていたが、そうもそれだけが原因ではなかったらしい。

つまり、学校で習った主流の(ハイブリッド)仮説検定法では二つの過誤の考え方があまり生かされていないのが、私が理解できなかった理由だったのだ。というのは、本来のネイマン-ピアソン流にはあった検定力(検出力)への配慮が主流の仮説検定法では必須ではないせいだ。その結果として、二つの過誤を説明する意義が失われてしまっている。要するに、一方で標本数が定まらないことで有意差が出やすくなり、他方で検定力(検出力)が低いせいで誤って差がないとされてしまうことだ。本当は両側から別々の過誤を防ぐ必要があるが、主流の仮説検定法ではそれが為されていない。主流の仮説検定法の枠組みでは、私のような論理的整合性で物事を理解する人間には二つの過誤が理解しにくいのも仕方がないと思えてきた。

批判されがちなネイマン-ピアソン…が勘違いの始まり

再現性問題によって主流の仮説検定法に批判が集まり、その源がネイマン-ピアソンにあるとされることは多い。しかし、それが勘違いなことはすでに説明した。本来のネイマン-ピアソン流の仮説検定法では標本数と効果量(から導かれる検定力)を前もって決めておく必要がある。考えてみれば効果量、つまり二つの群の間にどのくらいの違いがあってほしいのかという期待による基準がなければ、そこから導かれる確率に何の意味があるのかは私にはよく分からない。主流の仮説検定法は表向きに客観主義を装うことで、本来必要な研究者の側がこうあってほしいという主観的な期待を消し去ってしまったのだ 3。その結果が論理的に整合性がないとされる主流の仮説検定法だとしたら、それは不幸なことでしかない。


  1. 傾向性説と訳されることもあるが、これだと私のように心の哲学に慣れた人間にはdispotisionの訳だと勘違いしてしまうが、実際はpropensityが原語のようだ。訳し分けは難しい。

  2. epistemic probabilityは認識論的確率とよく訳されるが、認識論的はepistemologicalの訳語なのでややこしい。もちろんlogicalの部分が「論」の意味を持っている。

  3. それでも謎として残るのは、本文でリンクした論文「機能的ツールとしての統計的仮説検定」p.19を見ると、なぜネイマン-ピアソン流の仮説検定法では標本の大きさの決定が先で検定力(検出力)による検討が後なのかよく理解できない。どう考えても期待される効果量を先に決めてから標本数を決めるほうが合理的だ。同論文p.31にあるガイドラインの第一項を見ると効果量を見積もってから標本の大きさを決定するというプロセスが示されているので、やはり私の考え方のほうが妥当な気がする。「p値は臨床研究データ解析結果報告に有用な 優れたモノサシである」も参照。