期待・結果・差分による意思決定と学習のモデル

――主観・評価・学習を統一的に説明する差分モデル――

1. はじめに

人間は日々、無数の判断と意思決定を行っている。
仕事、投資、人間関係、学習、人生の選択――これらはすべて「結果」をもとに評価されているように見える。

しかし実際には、人間は結果そのものを評価しているのではない。
人間が評価しているのは、結果と自分の予測との差分である。

本稿では、主観、評価、感情、学習、意思決定を、
「予測と結果の差分」という統一的なモデルで説明する。


2. 人間は結果ではなく差分を評価している

同じ結果でも、人によって評価は大きく変わる。

期待 結果 主観
100 80 失敗
50 80 成功
80 80 普通

結果はすべて80で同じである。
しかし評価は全く異なる。

評価 = 結果 − 期待

つまり人間は結果そのものではなく、
期待(予測)と結果の差分を評価している。


3. 主観・感情の正体

この差分は、感情や主観として現れる。

結果 − 期待 感情
大きくプラス 喜び・成功
少しプラス 満足
0 普通
マイナス 失望
大きくマイナス 苦痛・怒り

感情 = 結果 − 期待

幸福や不幸ですら、この差分で説明できる。

同じ年収でも
期待1000万円 → 実際500万円 → 不幸
期待300万円 → 実際500万円 → 幸福

現実は同じでも、主観は全く異なる。


4. 投資における期待値と差分

投資の世界では「期待」は感情ではなく数学で扱われる。

期待値 = Σ(確率 × 利益)

投資家は結果ではなく期待値で意思決定を行う。
しかし最終的な満足・失望はやはり差分で決まる。

投資の主観 = 実際の利益 − 期待値

つまり投資は

予測 → 結果 → 差分 → 評価

という構造が非常に分かりやすく現れる分野である。


5. 学習とは何か

差分は評価で終わらない。
差分は学習に使われる。

予測

行動

結果

差分

評価

学習

予測更新

学習 = 差分を使って予測モデルを修正すること

これは人間だけではない。

・機械学習
・強化学習
・ベイズ推定
・脳の予測モデル
・進化
・経営
・投資

すべてこの構造を持っている。


6. 人間の認識と行動のループ

ここまでを統合すると、人間の認識と行動は次のループになる。

内部モデル(知識・経験・基準)

予測・期待

行動

結果(現実)

差分(予測誤差)

主観・感情

評価

学習

内部モデル更新

予測

人間はこのループを一生繰り返している。


7. 人生・社会・経営への適用

この差分モデルは非常に広い分野に適用できる。

人生

幸福 = 現実 − 期待

勉強

理解度 = 結果 − 理解しているつもり

仕事

評価 = 成果 − 上司の期待

経営

利益 = 実績 − 計画

科学

理論 = 予測
実験 = 結果
差分 = 新発見

進化

環境 = 現実
遺伝子 = 予測モデル
差分 = 淘汰・進化

ほぼすべて同じ構造で説明できる。


8. 結論

人間は結果を評価しているのではない。
予測と結果の差分を評価している。

主観 = 現実 − 予測
感情 = 現実 − 期待
学習 = 差分による内部モデル更新

人生とは、予測と現実の差分を修正し続ける過程である。


9. この論考の位置づけ

このモデルは次の領域をつなぐ。

・クオリア(内部基準)
・主観の発生
・思考
・意思決定
・投資
・学習
・進化
・人工知能
・人生

つまり、

感覚 → 主観 → 思考 → 予測 → 行動 → 結果 → 学習

という一つの循環モデルとして、人間の認識と行動を統一的に説明できる可能性がある。

この差分モデルは、人間の主観・感情・意思決定・学習を一つの原理で説明しようとする試みである。