脳と心の科学の「ミッドライフクライシス」(京都大学情報学研究科 教授、ATR脳情報研究所 客員室長:神谷之康) #その心理学ホント?
私が学生だった1990年代前半、脳と心の科学の未来は輝いて見えた。80年代末から続いていた(第2次)ニューラルネットワークブームや、当時NatureやScienceに頻繁に掲載されていたサルの電気生理学研究の印象は強烈だった。「認知科学」や「認知心理学」の「認知」という言葉に、旧来の「心理学」や「生理学」にはない軽やかな響きを感じた。当時は、行動主義から認知科学への移行(「認知革命」)によって、観察可能な行動だけでなく、行動の背後にある認知プロセスについて研究できるようになったと言われていた(が、これが単純化された「建国神話」であることが後に分かってきた)(1)。90年代半ば以降、ニューラルネットワークブームは一時下火になる一方、脳イメージング技術の進展を背景に認知神経科学が生まれる。認知ロボティクス、比較認知科学、進化心理学などの分野も立ち上がり、心のデザインについて議論が活発化した。人文学や臨床的アプローチが主流だった心の研究に、自然科学や数理科学が参入し、学際研究が展開することにより、脳と心の理解にもとづいた人工知能(AI)の開発や精神疾患の科学的理解が進展すると期待した。
それから30年が経った。脳と心の科学はずっと「まだ若い学問だから」「in its infancy」と言ってきたが、もういい歳である。期待通り成長しただろうか。
AIに貢献したか
今、AIブームである。現代のAIの基盤には、深層学習と呼ばれるニューラルネットワーク技術がある(30年前、「人工知能(AI)」は記号計算による論理的な推論システムを主に指す言葉で、ニューラルネットワークとは対立する概念だった)。ニューラルネットワークは生物の脳の構造や機能を抽象化したモデルで、教科書的には1940年代のマカロック-ピッツや50年代ローゼンブラットに遡る。脳の理解が現代のAIの源流にあるとは言えるだろう。深層学習の父と言われるジェフリー・ヒントンは、もともとの実験心理学の専攻で、計算神経科学分野でニューラルネットワークの研究を続けてきた。「ニューラルネットワークの冬の時代」を経て、成果が花咲いた。革新的なAIを次々と生み出しているDeepMindのデミス・ハサビスは、大学院時代は認知神経科学の専攻で、私のブレイン・デコーディングを海馬に応用する研究もしていた(2)。当時私は「デミスくん、よく頑張っとるな」と思っていたが、今ちょっと頑張り過ぎである。現在のAIの重要なインフラである画像データベース(ImageNet)を作ったスタンフォード大学のフェイフェイ・リは、私の大学院の後輩で、当時は、コンピュータビジョンと並行して心理学的研究も行っていて、認知心理学の代表的テーマであった注意の特徴統合理論に挑んでいた(3)。彼らの脳や心に対する関心がAIに結びついたことは確かだろう。ハサビスはNeuroscience-inspired AIという論文も書いている(4)。
しかし、神経科学・心理学がもたらした過去30年の脳と心の理解が、現代のAIのブレークスルーを生み出したと言えるだろうか。強化学習の創始者の一人、リチャード・サットンは、2019年の「苦い教訓」と題するエッセーで、次のように述べている(5)。
実際、コンピュータチェスでは、1997年に世界チャンピオン、カスパロフを破った方法は、大規模な深層探索にもとづくもので、人間による理解の仕組みを生かした手法はかなわなかった。囲碁も同様である。音声認識やコンピュータビジョンでも、人間の理解を生かした方法よりも、大規模データに対して適応する(「スケールする」)汎用的な計算手法が優れたパフォーマンスを発揮している。エッセーは以下のように締めくくられる。
心のはたらきについて仮説やモデルを立てて検証するアプローチを規範としてきた中年の研究者にとっては、「ミッドライフクライシス」を誘発しそうな厳しい言葉だ。「システム1・システム2」「ビッグ・ファイブ・パーソナリティ」「感情の円環モデル」「心の理論」など、心理学者が説明のために使う「符牒」にすぎないものを実在物であるかのようにロボットやAIに実装しようというのは、いまだに大型研究費の申請書によく見られるスローガンだ。文理融合・学際研究という点で審査員の受けはいいが、がっかりな成果に終わることが多い。
サットンに対する反論はいろいろ考えられる。たとえば、現代のAIのブレークスルーとなった画像認識に使われた畳み込みニューラルネットワークの起源は、ヒューベルとウィーゼルがネコやサルの視覚野で見つけた方位選択性ニューロン(6)と、これにインスパイアされて福島邦彦先生が考案したネオコグニトロンである(7)。注意などの心理学的概念からヒントを得た汎用的計算手法もある。一方で、近年のAIの進展を受けて、深層ニューラルネットワークと脳の関係を調べる分野が形成され「ニューロAI」などと呼ばれている(8)。汎用的な計算手法として研究されてきた深層ニューラルネットワークが、再び神経科学と接近している。人間のような知性を実現したいという研究者の知的探究心やドライブを抜きに、AIのブレークスルーが起こるのも想像しにくいだろう。
再現性の危機
先日Twitterで、イエール大学の心理学者、ポール・ブルームが、「過去数十年での心理学の大発見は何か」について心理学者に意見を求めた(9)。目立ったのは「過去の大発見はほとんどが間違いだとわかったこと」といった回答だ。周知のように、2015年に発表された大規模追試研究(10)を始め、教科書に登場する著名な研究を含む多くの過去の知見に再現性がないことが明らかになった。心理学では現在、信頼性・透明性を高めるための取り組みが進められている。
神経科学では、実験の追試が難しいこともあり、過去の研究の再現性を大規模に検証する動きはないが、研究者の間では、とくに行動実験の再現が取れないことがよく話題に上る。認知神経科学の論文の記述から推定される効果量・検出力から、統計的に有意な結果の半数以上は偽陽性と見積もられている(11)。精神医学における30年にわたる脳イメージング研究にもかかわらず、どのような精神疾患に対しても神経生物学的な説明はまだなされていないし、臨床的な意思決定においてほとんど何の役割も果たしていない(12)。MRIで計測される脳構造や安静時脳活動パターンと個人特性の相関を調べる研究も盛んに行われてきたが、数千人の被験者がいないと信頼性のある結果は得られなことが指摘され、これまでの研究(被験者数の中央値は25人程度)の信頼性が揺らいでいる(13)。数千人の被験者で母集団の推定ができるようになったとしても、個人差の効果量は極めて小さく(トップ1%の表現型でも相関係数が0.06程度)、個人向けのバイオマーカーとしてはあまり期待できない。
過去の知見の再現性を確認することは科学の健全なプロセスであり、大規模で体系的な追試が明らかにしたことは極めて重要な発見である。しかし、過去数十年、みんな知らなかったのだろうか。私の個人的な経験にもとづくが、心理学も神経科学も、再現性がないことに驚くほど寛容だった。Pハッキング(実験手続きやデータを操作して統計検定のP値を低くする行為)やHARKing(Hypothesizing After the Results are Known; 結果を見た後に仮説を作り、その仮説を事前仮説であるかのように装って検定結果を論文に記載すること)など、「疑わしい研究慣行(Questionable Research Practices, QRPs)」は当たり前のように行われていた。後づけのきれいなストーリーを作る能力は称賛された。行動データはばらついて当然だとよくいわれたが、同じような行動実験を用いる分野でも、経済学や実験哲学では再現率はずっと高い(14, 15)。再現性のない研究ほど引用され(16)、ジャーナルの「ランク」が高いほど信頼性が低い(17)。われわれは、身内だけにしか伝わらないハイコンテクストなゲームに興じていただけではないのか。あからさまな研究不正より、こちらのほうが深刻な問題かもしれない。
認知科学の認知バイアス
心理学では、PハッキングやHARKingなど、研究実践の「研究者自由度」がもたらす偽陽性について議論が進んだ。データ取得前に仮説やデータ取得法・解析法を決定し、タイムスタンプ付きで第三者機関に記録する事前登録(preregistration; プレレジ)や査読付き事前登録(registered reports; レジレポ)が国際的には広まりつつある。最近、Nature誌が、認知神経科学と行動科学の分野について、レジレポ論文を受け付ける方針を示し、話題となった(18)。
このように従来の枠組みの中で透明性・厳密性を高めることは重要であるが、これまでの研究の枠組み自体にも信頼性の低さの一因があったのかもしれない(19)。従来の認知神経科学では「心の基本要素」と思われる認知概念(構成概念)のパラメータを操作する課題をデザインして脳活動を計測する。私の世代の心理学者や認知神経科学者は、実験的コントロールの重要性を尊重するように訓練され、解釈可能な一握りの変数を交絡因子から分離する課題の「エレガントさ」が賞賛された(20)。そのエレガントな課題の認知変数と相関するニューロンや脳部位が見つかれば、それこそが心的機能の「本質」であるかのように見えてしまう(21)。心理本質主義という認知バイアスに陥ると、再現性の欠如は「本質がノイズに隠れただけ」と些細なことになってしまうのかもしれない。
よく知られる「ワーキングメモリ」ですらその概念は曖昧である(22)。遅延課題中の前頭前野の持続的神経活動がワーキングメモリーの正体であると考えられてきたが、最近では、そのような持続的神経活動は、単純な課題を繰り返したときの平均では見られるが、単一試行や複雑な課題ではあまり見られないといわれている(23)。ワーキングメモリは一般的な知能とも関連付けられ、前頭前野を活性化させる「エレガントな」認知トレーニングで知能を高めることが期待された。しかし、効果は限定的で、トレーニングした課題や類似の課題を超えて転移しないことが明らかになってきた(22)。
神経科学の金字塔といえる視覚一次野のエッジ検出やドーパミンニューロンによる報酬予測誤差の表現の発見ですら、研究者が想定した構成概念とかならずしも一致しないことが議論されている(24, 25)。Olshausenらは、視覚一次野が実際にどのように動作するかについて我々は10–20%しか理解していないと述べ、その要因として、偏った刺激サンプリングや解釈しやすいモデルに依存するバイアスを挙げている(24)。
現場の研究者は「そういうことは分かった上で単なる『ラベル』として認知概念を使っているにすぎない」と言うかもしれない。脳や心のモデルの提案・検証を繰り返すことで、真実に近づいていくという立場もあるだろう。しかし、人が解釈しやすいモデルで本質を理解した気になってしまうバイアスから、研究者は自由だっただろうか。Nastaseら(20)の「脳は必ずしも人間が解釈できるような単純な変数に依存するように設計されているわけではなく、変数を信号とノイズにきれいに分離するわけでもなく、実験計画によって課された理論的境界を必ずしも尊重するわけでもない」という言葉は、私には重く響く。
このようなバイアスを回避する試みはすでに存在する。上記のニューロAIでは、汎用的なアーキテクチャをもつ深層ニューラルネットワークに大規模データや課題を与えて訓練したときに現れる「名もなき」ユニットの情報表現と脳の関係を、解釈しやすい概念や脳マップに頼らずに特徴づける(8, 26)。記憶や注意など日常言語から派生した認知概念に代えて、進化の過程で生じた一連の変化にもとづいて行動概念を再定義する方法も提案されている(27)。感情概念については、クラウドソーシングなどを利用して大規模データからデータ駆動的に再分類する試みが議論を呼んでいる(28, 29)。行動課題、自己報告式調査、および、実世界におけるアウトカムからデータ駆動的に心理学的オントロジー(概念の分類体系)を導出した研究では、自己制御という認知概念に一貫性がないことが示されている(30)。2000年代半ばに提案された自然主義的脳計測アプローチ(31)や機械学習にもとづく脳データの予測モデル解析(32)は、人が解釈しやすい脳と心の対応関係を前提としないアプローチの源流といえる。また、オプトジェネティクスをはじめとする新しい生物学的介入手法は、コントロールされた認知実験とは異なる形で、脳と行動の関係を明らかにしてきた。これらの動向は、認知概念による説明よりも予測と制御を重視する点では、バラス・スキナーの徹底的行動主義とも通じる(33, 34)。
おわりに
脳と心の科学は、「心を理解する」「精神疾患の解明・治療」など、誰もそのテーマ自体の重要性は否定できないお題目を掲げ、社会の期待を集め、研究費の面でも優遇されてきた。30年前には予期できなかった飛躍的な技術的進歩があったものの、当初の期待に応えたとはいい難いだろう。とくに日本では、研究慣行の改革は一部を除いて進んでおらず、昔ながらのスローガンを掲げたプロジェクトに選択と集中が続けられている。「認知革命」の延長で脳や心を理解し、AIをデザインするといった30年前のアジェンダをまずは批判的に再検討するべきだろう。私自身、社会の期待の恩恵を受けつつ、アカデミアの自己欺瞞にたいして忸怩たる思いを持ち続けてきた。研究の透明性や信頼性の改善に取り組む人々や新しい方法論を開拓する同世代の研究者の存在が支えとなって、なんとか研究を続けることができた。
心理学の研究改革は、メタサイエンスと研究実践が交錯する刺激的な議論の場である。神経科学の最前線では、計測・介入技術の進歩に伴い、堅固で大規模なデータが得られるようになった。近年のAIのブレークスルーを受け、また新たな展開が待っているようでワクワクする。「次の単語を予測する」大規模言語モデルがあのような知的な振る舞いをすることを誰が予測できただろうか。大規模言語モデルを脳や心のモデルとして採用すべきというのではない。しかし、「自由エネルギー原理」(35)や「グローバルワークスペース理論」(36)など大上段に構えたもっともらしい理論よりも、ひょっとしたら知性に迫っているかもしれないと思うと楽しい。
科学の目的の一つは、観察や実験からの帰納を通して世界を構成する対象について知識を獲得することである(37)。しかし、帰納がもたらす知識は経験を超えている。哲学者のウィラード・ヴァン・オーマン・クワインは世界の中の自然種(人間の認識とは独立に成立し、本質を備えた物事のグループ)をおおまかに識別する能力が生得的に備わっているために、多くの場合に帰納が成功すると考えた(38)。しかし、この能力は、「皮膚の内側の出来事」(スキナー)をうまく識別できず、心理的本質主義としてバイアスの源となり、脳と心の理解を妨げてきたのかもしれない。
認知概念や既存の数理理論のアナロジーにもとづく脳と心のモデルは、データが希少であった時代においては、有効なアプローチだったのかもしれない。しかし、サットンの「苦い教訓」にあるように、「私たちが発見したもの」が脳に存在すると仮定するのはナイーブだろう。まずは、利用可能となった多様な計測技術や生物学的介入によって得られるデータに耳を傾け、また、高度な課題を遂行できるようになったAIを参照しながら、認知概念と脳の対応関係を見直し、再構築することから始めてはどうだろうか。ドメインを絞りつつ自然な条件下で予測と制御の精度を地道に上げていくのが現実的なアプローチだと思う。大規模化するデータにたいしてスケールする仕組みも必要だろう。その先にシンプルな本質が見つかり理論化や検証ができるかもしれないし、本質はシンプルではないことがわかるかもしれない。本質がわからなくても、予測や制御はできることがあるし、実世界で役立つこともあるだろう。
謝辞
本稿の執筆にあたり、ReproducibiliTea Tokyo (https://twitter.com/repTeaTokyo)での議論から有益な示唆を得ました。メンバーの方々に感謝いたします。