期待・結果・差分による意思決定と学習のモデル

――主観・評価・学習を統一的に説明する差分モデル――

1. はじめに

人間は日々、無数の判断と意思決定を行っている。
仕事、投資、人間関係、学習、人生の選択――これらはすべて「結果」をもとに評価されているように見える。

しかし実際には、人間は結果そのものを評価しているのではない。
人間が評価しているのは、結果と自分の予測との差分である。

本稿では、主観、評価、感情、学習、意思決定を、
「予測と結果の差分」という統一的なモデルで説明する。

2. 人間は結果ではなく差分を評価している

同じ結果でも、人によって評価は大きく変わる。

期待	結果	主観
100	80	失敗
50	80	成功
80	80	普通

結果はすべて80で同じである。
しかし評価は全く異なる。

評価 = 結果 − 期待

つまり人間は結果そのものではなく、
期待（予測）と結果の差分を評価している。

3. 主観・感情の正体

この差分は、感情や主観として現れる。

結果 − 期待	感情
大きくプラス	喜び・成功
少しプラス	満足
0	普通
マイナス	失望
大きくマイナス	苦痛・怒り

感情 = 結果 − 期待

幸福や不幸ですら、この差分で説明できる。

同じ年収でも
期待1000万円 → 実際500万円 → 不幸
期待300万円 → 実際500万円 → 幸福

現実は同じでも、主観は全く異なる。

4. 投資における期待値と差分

投資の世界では「期待」は感情ではなく数学で扱われる。

期待値 = Σ（確率 × 利益）

投資家は結果ではなく期待値で意思決定を行う。
しかし最終的な満足・失望はやはり差分で決まる。

投資の主観 = 実際の利益 − 期待値

つまり投資は

予測 → 結果 → 差分 → 評価

という構造が非常に分かりやすく現れる分野である。

5. 学習とは何か

差分は評価で終わらない。
差分は学習に使われる。

予測
↓
行動
↓
結果
↓
差分
↓
評価
↓
学習
↓
予測更新

学習 = 差分を使って予測モデルを修正すること

これは人間だけではない。

・機械学習
・強化学習
・ベイズ推定
・脳の予測モデル
・進化
・経営
・投資

すべてこの構造を持っている。

6. 人間の認識と行動のループ

ここまでを統合すると、人間の認識と行動は次のループになる。

内部モデル（知識・経験・基準）
↓
予測・期待
↓
行動
↓
結果（現実）
↓
差分（予測誤差）
↓
主観・感情
↓
評価
↓
学習
↓
内部モデル更新
↓
予測

人間はこのループを一生繰り返している。

7. 人生・社会・経営への適用

この差分モデルは非常に広い分野に適用できる。

人生

幸福 = 現実 − 期待

勉強

理解度 = 結果 − 理解しているつもり

仕事

評価 = 成果 − 上司の期待

経営

利益 = 実績 − 計画

科学

理論 = 予測
実験 = 結果
差分 = 新発見

進化

環境 = 現実
遺伝子 = 予測モデル
差分 = 淘汰・進化

ほぼすべて同じ構造で説明できる。

8. 結論

人間は結果を評価しているのではない。
予測と結果の差分を評価している。

主観 = 現実 − 予測
感情 = 現実 − 期待
学習 = 差分による内部モデル更新

人生とは、予測と現実の差分を修正し続ける過程である。

9. この論考の位置づけ

このモデルは次の領域をつなぐ。

・クオリア（内部基準）
・主観の発生
・思考
・意思決定
・投資
・学習
・進化
・人工知能
・人生

つまり、

感覚 → 主観 → 思考 → 予測 → 行動 → 結果 → 学習

という一つの循環モデルとして、人間の認識と行動を統一的に説明できる可能性がある。

この差分モデルは、人間の主観・感情・意思決定・学習を一つの原理で説明しようとする試みである。