素人による統計についての私的メモ
はじめに
ネットで統計について調べていると、(特に日本語のサイトや文献で)言われていることがバラバラな事柄がよくあることに気に付いた。それは主にテクニカルな議論にではなくて、それ以外の説明でその傾向がよく見られた。しかも、書き手が統計の専門家であってもその傾向は変わらない。おそらくその原因は、(専門家もいるので)知識の不足ではなく、用語や定義に無頓着なせいで起こっていることが多いようだ。そこで(英語も含めた)複数の自分が参照できた資料を元に用語の整理をしてみた。なので、統計についてのサイトや文献によってはここにある整理と必ずしも訳語や意味が一致している訳ではありません。複数の資料を精査した個人的な結論なので、正しいかどうかの最終判断は個々人でお願いします。
確率の主要説についての整理
確率の分類 | 確率の解釈 | 代表的学者 | 統計への応用 | 補足 |
古典説 classial |
ラプラス | ジェフリーズ 客観ベイズ |
不十分な理由の原理 | |
認識的確率 epistemic |
論理説 logical |
ケインズ カルナップ |
無差別の原理 | |
主観説 subjective |
ラムジー デ フィネッティ |
サヴェジ ベイズ統計 |
尤度原理 | |
偶発的確率 aleatory |
頻度説 frequency |
ミーゼス ライヘンバッハ |
ネイマン 信頼区間 |
帰無仮説検定 | 傾向説 propensity |
ポパー |
信用説 fiducial |
フィッシャー | 最尤法 | 経験ベイズ |
訳し分けるための、この整理での用語法
aleatory | chance | fiducial | confidence |
---|---|---|---|
偶発 | 偶然 | 信用 | 信頼 |
整理についての注釈
epistemicはここでは認識的と訳したが、一般的には認識論的と訳されることが多い。しかし、これだとepistemologyと区別がつかない。logyが論の意味なのでこう訳した。
aleatoryはここでは偶発的と訳したが、一般的には偶然と訳されることが多い。しかし他方で、probability(蓋然性)と対比されるchanceも偶然と訳されることが多い。この先chanceに触れる可能性はゼロではないので一応訳し分けた。
認識的確率と偶発的確率は、主観的確率と客観的確率に分類されることもある。ただ、これだと確率の主観的解釈との区別が付きにくくなるので、ここでは採用しなかった。
フィッシャーはネイマンやピアソンと共に頻度説に分類されることも多いが、当のフィッシャー自身は頻度説を批判している。フィッシャーを主題にした文献ではたいてい頻度主義とは別枠になっている。
フィッシャーのfiducialは信頼と訳されがちだが、それだと信頼区間と訳されるconfidenceと区別が付きにくいという欠点がある。信頼区間は頻度主義的に定義されるので分ける方が妥当。 fiducialは推測とも訳されるが、原語の意味とはズレる。 だが、フィッシャーの統計観にはよく分からない所も多い。
無情報事前確率で知られるジェフリーズは、一般的には論理説に分類されるが、「無知ゆえの等確率」という点から古典説と比されることもある。また、事後確率の解釈の点から論理説と主観説の間とされることもある。
整理上は、論理説に無差別の原理を適用したが、場合によっては古典説にも無差別の原理が適用されることがある。古典説は「理由が不十分なので無差別」つまり「無知ゆえの等確率」だが、論理説は根拠を持った無差別である点で違いがある。
ネイマンは頻度主義に分類されるが、その際には帰無仮説検定とごっちゃにされがちである。しかし、厳密には信頼区間の定義に頻度主義が使われているのであって、帰無仮説検定はそれとは一応分けておく方が、ネイマンとフィッシャーとの対比を理解するには妥当。
経験ベイズは頻度主義と関連付けられことも多いが、フィッシャーの立場を分けたこの整理では、最尤推定との関係を優先させた。とはいえ、はっきり言って経験ベイズについてはまだ私にはよく分かってません。
統計的因果推論で用いられる傾向スコアにおける傾向はpropensityの訳だが、確率論との関係はよく分からない。