科学的分析の道具としてのニューラルネットワークを勝手に考えてみる(追記つき)

しばらくの間、このブログが放置状態になっているのは気になっていた。前に触れた、アブダクションとIBE(最良の説明への推論)との関係については、関連論文からめぼしい部分を見つけて引用のためにそれを翻訳したりと、準備は進めているがまだ記事を書く段階には至っていない。この辺りについては日本語で読める解説があまりないようなので、あれば便利なので記事にしておきたい気もするが、それなりにちゃんと書こうとすると案外大変。まぁ、無理せずマイペースでやっていきます。

私は同時並行的にあちこちに関心が移るが、ここに書けるほどのものは今はない。過去に遡ればいろいろなくもないが、わざわざ書こうとする気が起こるテーマがある訳でもない。そこで今回は、ネットや論文でここのところ見て気になったテーマを、面倒なのでサイトや文献への参照なしで書きます。気になる人は自分で調べて確認してください。

ニューラルネットワークをどう使う?

ニューラルネットワークは、一時の(第三次)人工知能ブームを経て、今や有望な道具(アルゴリズム)としての認識が広まりつつあり、人間への脅威の段階からどう使っていこうか?という本格的な実用段階に入っている。

そうしたニューラルネットワークの実用化には、商品(商業)化可能な工学的な応用も多いが、科学の世界でもニューラルネットワークは注目されている。そこに過去のニューラルネットワークの見方とは異なっているところが目につく。

過去におけるニューラルネットワークの捉え方は、今回のブームでも指摘されていたように、脳のモデルとしてであり、第二次までの過去の人工知能ブームではそうであった。しかし、前にも指摘したことがあるが、最近のニューラルネットワークは脳とはあまり似ていないし、似せようともしていない。この辺りについても色々と突っこんだことは書ける(AIを心に似せるか?)が、今回はそれが書きたいのではない。

脳のモデルから科学的分析の道具へ

最近、科学の世界で注目されているニューラルネットワークの用い方は、(脳のモデルとしてではなく)科学研究の道具としてニューラルネットワークを使うことだ。つまり、統計で人為的に行っていた分析を、ニューラルネットワークに全面的に任せてしまおうという動きだ。

ニューラルネットワークを科学的分析に用いることには、例えば次のような特徴がある。
- 統計モデリングと違って、中のモデルが分からない
- データ間の相関的な関係だけしか見ない(因果ではない)

ニューラルネットワークの特徴は、外側から人為的な設定をすることなく、データに沿った非線形な(分類などの)モデルを学習によって自動的に作ってくれることだ1

科学的分析におけるニューラルネットワークについて、人為的な(モデルの)設定がいらないことがよく強調される。だが、実際には細かい事前の調整は人がやるしかないので、その辺りの事情がよく分からないので、ここについては私の判断は保留。

モデルが分からなくても科学なの?

やはり最大の特徴は、ニューラルネットワークでは中のモデルが分からないことだ。たまにニューラルネットワークブラックボックスだとされて、まるで中が全く見えないかに勘違いされそうだが、正確には中は見れるけどグチャグチャで人が見ても何がなんだか分からないだけだ。どっちにせよ、ニューラルネットワークの中に出来上がったモデルが分からないことに変わりがないし、分かるようになる目処もほぼない。

違いを分かってもらうには、脳の研究にニューラルネットワークを道具として使うとしたらどう使うか?を想像すればよい。例えば、脳のデータと見てる画像とをニューラルネットワークで学習させれば、脳のデータだけから見てる画像が分かるはずだ(近い研究は既にあった気がする)。まず、このニューラルネットワークは脳のモデルではない(そもそも脳のデータを入力にする生物はいない)。しかも、研究が成功したとして、その中身(モデル)を知ることはできない。

複雑な相関を導く道具としてのニューラルネットワーク

モデルが分からないのに科学と呼べるのか?問題は、ここでは省略する。研究手法が多様になるのは歓迎だが、ただし議論は続けるべき…が私の見解だ。この問題を脇においても、まだ問題はある。

前に因果推論の記事で、相関と因果は違うという話をした。これは実はニューラルネットワークとも関係がある。代表的な研究者であるパールがもともと人工知能の研究者であるが、彼はデータ間の相関的な関係しか見ない人工知能では知的な機械としては限界があるとしている。ニューラルネットワークは相関しか見れないの典型であり、既に現実の偏りをそのまま学習してしまうことはよく指摘されている。

皮肉なことに、ニューラルネットワークは複雑な関係を扱うのに都合が良いが、社会科学や生態学のような複雑な関係を扱う科学に限って、偏りが避けがたい。ニューラルネットワークの適用範囲には気をつけるべきかもしれない。

科学にニューラルネットワークを道具として用いるのに、モデルが分からないのは許すとしても、(複雑な)相関しか分からない問題は解決されない。そして、相関と因果を媒介するのがモデルであるので、この二つの問題は実は無関係とは言いきれない。

追記(2020/07/15)

この記事をあげた後で、関連してそうなネット記事を見つけたのでリンクしておきます。

リンク先の記事で言われてる機械学習ニューラルネットワークかどうかは分からない。だが、ハイパーパラメータをベイズ最適化で調整できる…としているのは、私がここでした事前の調整をどうするか?の疑問に対する答えになっているような気もする。

ただ、この場合はR因子という調整のための基準があったからうまくいったが、一般的には必ずしも都合のいい基準が見つかる訳ではない。それに、もともと複雑なデータ解析していたのを機械学習に置き換えた例なので、モデルが分かるかどうかは始めから問題になってない。

そう考えると、この例は医療における検査画像の分析に機械学習を用いる場合に近くて、私がここで問題にした科学的分析とはちょっと違うかもしれない。


  1. 生成モデルの話は今回は無視。敵対的生成ネットワークが科学的分析に使えるのか私にはよく分からない。