はじめに
本書は興味を持っていたのだが、積読になっていたので、今回ようやく読了した。感覚、運動、感情、精神疾患といった一見バラバラに見える脳活動を、自由エネルギーという観点から統一を試みるという観点が面白いと感じた本。
以下備忘録を記載。
本書『脳の大統一理論 自由エネルギー原理とはなにか』は、私たちの脳がどのように外界を認識し、適応し、学習しているのかを、自由エネルギー原理という視点から解説した一冊。この理論は、従来の脳科学の枠組みを超え、感覚、運動、感情、そして精神疾患にまで統一的に適用できる点が斬新。また、ボトムアップ処理とトップダウン処理が循環する仕組みが描かれており、脳の柔軟で動的な性質について触れている。
自由エネルギー原理とは何か
自由エネルギー原理の中心的なアイデアは、「脳は自由エネルギーを最小化することで環境に適応する」というもの。これは、19世紀の物理学者ヘルムホルツが提唱したエネルギー効率の法則を応用した考え方。脳は外界の状況を予測し、その予測と実際の観測とのズレ(予測誤差)を最小化することで、自身のモデルを更新し続ける。
このプロセスは、単に感覚刺激を受け取って処理するボトムアップな方法だけではない。むしろ、脳はトップダウンの処理、つまり「予測」に基づいて感覚入力を解釈していると考えている。
基本的な考え方は、「脳は感覚信号そのものを理解しようとするのではなく、その感覚信号を引き起こした外環境の原因や構造を推論しようとする」というもの。この推論は、以下の要素に基づいて行われる
事前確率分布 (Prior Probability)
外環境の状態について脳があらかじめ持っている知識や仮定(予測モデル)。例えば、「朝に鳥の鳴き声が聞こえるのは鳥が近くにいるからだ」というような経験に基づいた知識。
条件付き確率分布 (Likelihood)
ある外部環境の状態が特定の感覚信号を生じさせる確率。たとえば、「鳥が鳴いているなら特定の周波数の音が聞こえる」という関連性。
事後確率分布 (Posterior Probability)
上記2つの情報を掛け合わせることで得られる「現在の感覚信号から外環境をどのように推測すべきか」という脳の解釈。事前の知識と感覚信号から得られるデータを組み合わせることで、環境の最も可能性の高い状態を推測する。
予測と予測誤差の更新プロセス
脳は、感覚信号と予測モデルを基に、以下のプロセスで環境を理解していく
予測モデルの生成
脳は事前の確率分布と条件付き確率分布を使って、感覚信号を予測する。これは、トップダウン処理として働く。
感覚信号の受容
外界からの感覚信号(ボトムアップ処理)を受け取りる。この信号はノイズ(誤差)を含むことがある。
予測誤差の計算
実際に受け取った感覚信号と予測信号を比較し、そのズレ(予測誤差)を計算する。
誤差の修正とモデルの更新
予測誤差に基づき、脳は予測モデルを修正する。この修正は繰り返され、予測誤差が最小化されると、外環境に対する理解が「知覚」として安定する。
ノイズと信号精度の影響
予測信号も感覚信号も、それぞれノイズを含んでおり、このノイズが予測誤差に影響する。誤差がどの程度重視されるかは、信号の精度によって変化する。
感覚信号の精度が高い場合
感覚信号が明確でノイズが少ない場合、予測誤差の計算において感覚信号がより重視される。これにより、予測モデルは感覚信号に基づいて修正されやすくなる。
予測信号の精度が高い場合
予測モデルが非常に精度の高いものであれば、感覚信号よりも予測信号が優先され、予測誤差が大きくても修正の必要性が低いと判断される。
注意と信号精度
注意を向けるという行為は、感覚信号の精度を向上させるプロセスと考えられる。具体的には、以下のような効果がある。
注意が向けられた感覚信号は、ノイズが抑制され、より明確に処理される。これにより、予測誤差の計算精度が向上する。
感覚信号の精度が高くなると、予測誤差の修正がより正確になる。これにより、予測モデルが感覚信号に対して適切に更新される。一方で、予測信号の精度が高い場合には、感覚信号のズレが多少あっても無視される。
これだけだと分かりにくいので、日常生活での具体例で記載してみる
感覚信号の精度が高い例:新しい経験や環境
初めて見る動物や食べ物を目にしたとき、脳にはそれに関する強い予測モデルはない。そのため、感覚信号(視覚や触覚)の詳細を元に理解を構築する。たとえば、初めてドラゴンフルーツを見たとき、脳はその形や色、質感のデータを取り入れ、予測モデルをアップデートする。
予測信号の精度が高い例:既知の環境や状況
長年通勤している道で、視界が悪い雨の日でも、脳は「この角を曲がれば駅があるはず」という予測を維持する。感覚信号が曖昧であっても、予測モデルの精度が高いため、感覚信号のズレはあまり考慮されない。このため、実際には駅が工事中で見え方が少し違っていても、脳は駅がそこにあると判断する。
知覚とは予測誤差が最小化された段階で成立するもの
最終的に、予測モデルが感覚信号に完全に一致し、予測誤差が0に近づいた段階で、私たちはその外界の状態を「知覚」する。知覚は、感覚信号そのものを単に受け取る行為ではなく、脳が外環境の原因や構造を推論し、その推論が感覚信号と一致することで成立するものと本著では説いている。
自由エネルギー原理が示す「予測誤差が最小化された段階で知覚が成立する」という点は、一般的な直感に反するように感じられるが、この点が新規性になっている。人間の感覚では、「目で見たものがそのままリアルタイムに脳に伝わり、即座に像を結んでいる」と認識しがちだが、この「リアルタイム性」は、脳が非常に高速かつ効率的に予測誤差を最小化するプロセスを経ている結果であるという説を本著では唱えている。
視覚情報が脳に到達して処理されるまでには数十ミリ秒の遅延があり、この遅延の間に脳が予測と誤差の修正を行っていると考えられる。
感覚から運動、感情、精神疾患へ
自由エネルギー原理が特に面白いのは、その適用範囲の広さ。本書では、感覚の処理だけでなく、運動、感情、さらには精神疾患までをこの理論で統一的に説明している。
例えば、運動は「予測の実現」として解釈される。脳は特定の動作を予測し、その予測を実現するために身体を動かす。一方、感情は内臓感覚の変化に基づく予測誤差の処理として説明されており、従来の感情理論に新たな視点を提供している。
また、統合失調症や自閉症といった精神疾患も、予測誤差の処理の異常として理解できるとしている。統合失調症では予測モデルが硬直し、自閉症では予測モデルが過剰に硬直しているとされている。
統合失調症は感覚信号の抑制が十分に行われないため、感覚信号が予測信号よりも支配的になり、結果として予測誤差信号の修正が行われにくくなる。
結果として、自分自身の内的な思考が「外部の声」として知覚される幻覚幻聴や、脳は事前の信念にのみ頼るようにった結果、現実の状況から乖離した妄想や歪んだ知覚が形成される。
脳と睡眠の関係
脳が予測モデルを常に更新し続けるプロセスにおいて、睡眠の役割は非常に重要。本書では、睡眠中にシナプスの刈り込みが行われることが説明されている。この過程では、日中の活動で蓄積した不要なシナプスが整理され、重要な情報のみが保持される。結果として、脳の予測モデルがリセットされ、効率が向上する。
覚醒中は様々な経験をすることで、正確なモデルを作ろうとするが、その過程で過度に複雑なモデルを構築してしまうため、睡眠中にシナプスの刈り込みを行って、モデルを単純化している。
おわりに:人間の脳の推論を活用したLLMの推論の未来
これは、本著では述べられていなくて、私の勝手な推測なのだが、現時点のLLMは基本的に「学習」と「推論」が分離されており、LLMで行われている推論と、本著で述べられている脳の推論(=常に外界の予測を行い、実際のデータとの予測誤差を最小化する)とは意味合いが異なる。
現在のLLMは事前に大量のデータで学習し、推論時には固定されたモデルを用いており、推論時には、新しい経験をモデルに取り込むことはできない(通常のLLMは追加の再学習が必要)。モデルが推論中に誤差を検出しても、その誤差を即座に学習(モデル更新)に反映できない。
今回の自由エネルギー理論をLLMに組み込んで、LLMがリアルタイムで動的にモデルを更新する(=推論)を進めることで、さらにLLMが発展する可能性はあるのではないかと感じた。
リアルタイム推論ができるようになると、LLMは現在の「固定的な知識ベースの応答」から、動的で適応的なインタラクションを行う「リアルタイム知能」へ進化し、下記のようなことができるようになると考えられる。
- 個別学習アシスタント:AIがリアルタイムで学習者の反応(表情、声のトーン、答え方)を分析し、理解度や混乱している箇所を検出し、その場で説明を変更したり、質問の難易度を調整
- 医療診断アシスタント:AIが患者と医師の対話をリアルタイムでモニタリングし、新たな情報(患者の発言や表情、検査結果の更新)を逐次反映して診断を進化させる
- パーソナルアシスタント:アシスタントがユーザーの声のトーン、速度、キーボード入力の遅延などからストレスや感情をリアルタイムで察知し、適切な対応をする