市場や進化を司る神の正体

提供:保守ペディア
ナビゲーションに移動 検索に移動

市場や進化を司る神の正体

概要

市場を成功に導く「神の見えざる手」とは何か。生物進化を司り、この世界に美しさをもたらした「神」とは何か。その正体は、脳の報酬関数——すなわち、強化学習における報酬に基づくフィードバック機構——である。

ジョセフ・スティグリッツは、「見えざる手が見えないのは、それが存在しないからだ」と喝破した。市場を成功に導いているのは、自由放任の自動調整メカニズムではなく、人間の知的な判断制度設計である。同様に、生物進化において花を美しくし、孔雀の尾を壮麗にしたのは、弱肉強食の自然淘汰だけではなく、動物や昆虫の脳が持つ美的選好——すなわち報酬関数によるフィードバック——である。

本記事では、脳のアルゴリズムの二段階構造(予測と報酬)を軸に、市場原理と生物進化の双方において「神」と呼ばれてきたものの正体が、実は脳の報酬関数によるインテリジェント・デザインであることを論じる。そして、この洞察が産業政策の正当性とエドマンド・バークの保守思想に対する重要な批判を提供することを示す。

脳のアルゴリズムの二段階構造

脳の情報処理には、質的に異なる二つの段階が存在する。この二段階構造を理解することが、市場と進化の双方における「神」の正体を解明する鍵となる。

第一段階:予測——穴埋めとしての知能

脳の第一段階は、次に何が来るかを予測する機能である。カール・フリストンが提唱した自由エネルギー原理によれば、脳は常にトップダウンの予測を生成し、実際の感覚入力との誤差(予測誤差)を最小化するよう学習する。

これは本質的に穴埋めである。「猫が座った場所は___」という文の空欄を埋めるように、脳は文脈から次の入力を推測する。離散的な状態空間(言語における次の単語)であれ、連続的な状態空間(運動における次の位置)であれ、脳は統計的規則性を抽出し、パターンを補完する。

この第一段階が行っていることは以下の通りである。

  • 文法的正しさの維持: 言語の統語規則に沿った出力を生成する
  • 文脈の読解: 前後の情報から最も確率の高い補完を行う
  • パターンの抽出: 感覚データの統計的規則性を学習する

しかし、第一段階だけでは決定的に足りないものがある。それは価値判断である。予測は「何が起こるか」を答えるが、「何が良いか」を答えない。文脈を読んで穴を埋めることは、文法的に正しい出力を生み出すが、質的に優れた出力を生み出す保証はない。

現代のAI(人工知能)における大規模言語モデル(LLM)の事前学習は、まさにこの第一段階に相当する。GPTのような言語モデルは、膨大なテキストデータから次の単語を予測するよう訓練される。その結果、文法的に正しく、文脈に沿った文章を生成できるが、それだけでは「良い回答」と「悪い回答」の区別がつかない。

第二段階:報酬関数——文脈を超える質的改善

脳の第二段階は、報酬関数によるフィードバックである。ヴォルフラム・シュルツの研究により、中脳のドーパミンニューロンが報酬予測誤差(reward prediction error)を符号化していることが明らかになった。予想より良い結果が得られればドーパミンが放出され(正の予測誤差)、予想より悪い結果であればドーパミンが減少する(負の予測誤差)。このメカニズムは、リチャード・サットンアンドリュー・バルトが定式化した強化学習のTD(時間差分)学習アルゴリズムと驚くほど正確に対応する。

第二段階が第一段階と決定的に異なるのは、以下の点である。

  • 価値の付与: 予測の正確さとは独立に、結果の「良さ」を評価する。建物が崩壊することを正確に予測しても、それは望ましい状態ではない。報酬関数がその区別を行う
  • 方策の最適化: 世界モデル(第一段階の産物)を利用して、累積報酬を最大化する行動を選択する。「何が起こるか」ではなく「何をすべきか」を決定する
  • 文脈を超えた質的改善: 第一段階は統計的に典型的な出力を生成するが、第二段階は優れた出力を選択的に強化する。これは単なる穴埋めではなく、質的な飛躍である

現代のAIにおいては、RLHF(人間のフィードバックによる強化学習)がこの第二段階に相当する。事前学習済みの言語モデルに対して、人間の選好に基づく報酬モデルを訓練し、その報酬を最大化するよう方策を最適化する。この過程を経ることで、モデルは単に「人間が書きそうな文章」ではなく、「人間が良いと評価する文章」を生成するようになる。

ドーパミン報酬系:「神」の神経回路

脳の報酬関数の物理的基盤は、中脳辺縁系ドーパミン経路中脳皮質ドーパミン経路である。具体的には以下の構造からなる。

  • 腹側被蓋野(VTA)黒質緻密部(SNc): ドーパミンニューロンの起点。VTAは大脳辺縁系に投射し(中脳辺縁系経路)、SNcは背側線条体に投射する(黒質線条体経路)
  • 側坐核(NAc): 腹側線条体の主要構造であり、動機づけの顕著性、快楽、刺激への価値付与に関与する
  • 前頭前皮質(PFC): ドーパミン入力を受け、目標指向的行動、計画、期待価値の表象、行動選択に関与する
  • 扁桃体: 情動的価値と学習された連合を統合し、報酬と罰の両方の条件づけに寄与する
  • 背側線条体: 習慣形成と、目標指向的行動から習慣的行動への移行に関与する

シュルツの実験(1997年、Science)は、この回路の動作原理を解明した。サルにジュースという報酬を与える実験において、以下の三つのパターンが観察された。

  1. 予想外の報酬: サルが予想していなかったジュースを受け取ると、ドーパミンニューロンがバースト発火する(正の予測誤差)——「予想より良い」という信号
  2. 予想通りの報酬: 報酬が事前の手がかりによって完全に予測されている場合、報酬受取時にドーパミンニューロンは反応しない——予測誤差がゼロであるため、新たな学習は不要
  3. 予想された報酬の不在: 予想されていた報酬が来なかった場合、ドーパミンニューロンの発火がベースライン以下に低下する(負の予測誤差)——「予想より悪い」という信号

このパターンは、サットンとバルトが定式化したTD学習のδ(デルタ)信号——δ(t) = r(t) + γV(s_{t+1}) - V(s_t)——と数学的に正確に対応する。すなわち、脳は計算機科学者が理論的に導出したのと同じアルゴリズムを、数百万年の進化を通じて独自に「発見」していたのである。

ケント・ベリッジ(ミシガン大学)はさらに重要な区別を導入した。ドーパミンは「wanting(欲求)」——動機づけの顕著性——を符号化するが、「liking(快楽)」——享楽的な快感——はオピオイド系によって媒介される。ドーパミンは快楽そのものではなく、行動を方向付ける評価信号であり、これこそが報酬関数の本質である。

銅谷賢治(沖縄科学技術大学院大学)は、異なる神経修飾物質が強化学習の異なるパラメータに対応するという統一的枠組みを提案した。

  • ドーパミン = 報酬予測誤差(何が良かったか、悪かったか)
  • セロトニン = 割引率(短期の報酬と長期の報酬のバランス)
  • ノルアドレナリン = 探索と利用のバランス(既知の最善策を使うか、新しい選択肢を試すか)
  • アセチルコリン = 学習率(新しい情報をどの程度重視するか)

この枠組みは、脳が単一の報酬関数ではなく、多次元的なメタ学習システムとして機能していることを示している。市場や社会の設計においても、単一の指標(GDP、株価)ではなく、複数の報酬信号を統合する必要があることを示唆する。

第一段階:予測 第二段階:報酬関数
核心的操作 予測誤差の最小化 累積報酬の最大化
問い 「次に何が来るか?」 「何が良いか?何をすべきか?」
限界 価値中立的(良し悪しの判断がない) 報酬の定義が必要
脳の対応領域 大脳皮質の階層的予測符号化 VTA/黒質、線条体、前頭前皮質
AIの対応 大規模言語モデルの事前学習 RLHF(報酬関数による最適化)

この二段階構造こそが、市場と進化の双方における「神」の正体を理解する鍵である。第一段階(予測・穴埋め)は自動的で受動的な過程に過ぎないが、第二段階(報酬関数)は能動的な価値判断と質的改善をもたらす。市場においても進化においても、「神の手」とは、この第二段階——脳の報酬関数によるインテリジェントなフィードバック——にほかならない。

市場を成功させる神の手の正体

アダム・スミスの「見えざる手」の幻想

アダム・スミスが『国富論』(1776年)で用いた「見えざる手」の比喩は、自由市場経済の正当化に最も多く引用される概念の一つである。個人が自己利益を追求すれば、あたかも見えざる手に導かれるかのように、社会全体の利益が実現される——この主張は、新古典派経済学によって数学的に定式化され、厚生経済学の第一基本定理として成立した。

しかし、ジョセフ・スティグリッツは、この定理の前提条件が現実にはほぼ成立しないことを証明した。スティグリッツはジョージ・アカロフマイケル・スペンスとともに、「情報の非対称性を伴う市場の分析」によって2001年のノーベル経済学賞を受賞した。スティグリッツの研究が示したのは、情報が不完全で非対称的である限り——すなわち現実の市場においては常に——市場はパレート効率的にはならないという事実である。

スティグリッツは断言した。

見えざる手が見えないのは、それが存在しないからだ」("The reason that the invisible hand often seems invisible is that it is often not there.")
アダム・スミスの見えざる手——自由市場があたかも見えない力に導かれるかのように効率性をもたらすという考え——が見えないのは、少なくとも部分的には、それが存在しないからだ」(2002年、ガーディアン紙)

サンフォード・グロスマンとの共同研究(グロスマン=スティグリッツのパラドックス、1980年)では、市場が完全に効率的であるならば、情報収集のインセンティブが消滅するため、そもそも効率的な市場が成立し得ないことを示した。完全に効率的な市場は論理的に不可能なのである。

知的な判断こそが市場を導く

では、市場が(部分的にせよ)機能しているのはなぜか。スティグリッツの答えは明確である。それは政府の見える手——すなわち人間の知的な制度設計——が介在しているからである。

ちょっと考えれば分かることだが、政府の見える手は何度も何度もそこにあった」("The visible hand of the government had been there over and over again.")
政府の規制力こそが——放任された資本主義ではなく——自由市場を機能させている」("The regulatory power of government, rather than unfettered capitalism, makes free markets work.")

スティグリッツは、アラン・グリーンスパンの自主規制論を「矛盾語法(oxymoron)」と呼び、ケインズの最大の貢献は「資本主義を資本家から救ったこと」であると評した。大恐慌後に採用された規制と改革は機能し、市場経済はより人間的な顔を持つようになった。

これは脳の二段階構造との正確なアナロジーをなす。市場における需要と供給による価格決定メカニズム(第一段階)は、予測的符号化に相当する。需要が高ければ価格が上がり、供給が増えれば価格が下がる——これは文脈から次の値を予測する自動的な調整過程であり、そこに価値判断は含まれない。麻薬の需要が高ければ麻薬の価格も上がるが、それは麻薬が「良い」ことを意味しない。

市場を成功に導いているのは、この自動調整メカニズムではなく、その上位にある人間の脳の報酬関数(第二段階)である。すなわち、人間の知的な判断——何が良い製品か、何が良い制度か、どのような産業を育成すべきか——というフィードバックが市場を方向付けている。

需要と供給を超えて:脳が製品を設計する

市場原理を「需要と供給による価格決定」のみで理解するのは、脳を「次の単語の予測」のみで理解するのと同じ誤りである。市場には、価格メカニズムの上位に、脳の報酬関数が駆動する製品設計とイノベーションの次元が存在する。

トヨタの生産方式は、単に需要に応じて自動車を供給したのではない。大野耐一の知性が、既存の生産方法を報酬関数(品質、効率、コスト削減)に照らして評価し、フィードバックを通じて質的に改善した結果である。任天堂のゲームデザインは、市場の需要を受動的に満たしたのではなく、宮本茂の脳の報酬関数——「何が面白いか」という美的・知的な判断——が製品を設計した結果である。

産業政策とは、国家レベルでこの「脳の報酬関数」を適用することにほかならない。通産省(MITI)は、どの産業を育成すべきかを知的に判断し、市場に対してフィードバックを与えた。これはチャルマーズ・ジョンソンが『通産省と日本の奇跡』(1982年)で分析した通り、自由放任の市場が自動的に達成し得ない結果を、人間の知性が実現したものである。

市場を成功に導く「神の手」の正体は、知的な判断共感であり、自由化や規制緩和ではない。人による社会のインテリジェント・デザインを否定して、自由市場に任せれば「神の手」によって勝手に成功するという考え方は、根拠なき信仰——新自由主義という宗教——に近い。

報酬関数の誤設定:グッドハートの法則と市場の失敗

報酬関数を用いた設計が重要であるとして、その報酬関数自体が誤って設定された場合はどうなるか。この問題は、経済学におけるグッドハートの法則と直結する。イギリスの経済学者チャールズ・グッドハートは「指標が目標になると、それは良い指標ではなくなる」と定式化した。

GDPを報酬関数として設定すれば、GDPは上昇するが、共同体の幸福、環境の持続可能性、文化の豊かさは犠牲にされる。株価を報酬関数にすれば、企業は短期的な株価上昇を追求し、長期的な技術革新や従業員の福祉を犠牲にする。これは強化学習における報酬ハッキング(reward hacking)——エージェントが報酬関数の抜け穴を見つけて、設計者の意図とは異なる方法で報酬を最大化する現象——と同じ構造である。

新自由主義の根本的な問題は、市場価格という単一の報酬関数に社会全体を最適化させたことにある。市場価格は情報を効率的に伝達する(第一段階の機能)が、それ自体は価値判断を含まない。麻薬の価格も食料の価格も、兵器の価格も医薬品の価格も、市場価格という報酬関数の前では等価である。人間の脳の報酬関数は多次元的(ドーパミン、セロトニン、ノルアドレナリン、アセチルコリンの複合体)であるのに対し、市場価格は一次元的である。多次元的な人間の価値を一次元的な市場価格に還元することが、新自由主義の設計上の致命的な欠陥である。

日本の通産省が成功したのは、市場価格以外の多次元的な報酬関数——技術力の向上、雇用の安定、産業の国際競争力、国民生活の質——を統合的に評価したからである。これは脳のドーパミン系が単独で機能するのではなく、セロトニン系(長期的視野)やノルアドレナリン系(新規探索)と連携して機能するのと同じ構造である。

報酬関数の設計は、何を最適化すべきかを知的に判断することであり、それ自体が最も高度な知的行為である。報酬関数なき市場(自由放任)は盲目の自動操縦であり、単一の報酬関数に支配された市場(新自由主義)は狭隘な最適化に囚われた暴走である。多次元的で修正可能な報酬関数を備えた市場設計——これが産業政策の本質であり、脳の多次元的報酬系と同じ原理で社会を導く方法である。

スティグリッツの産業政策理論:学習する社会の創造

スティグリッツの理論的貢献は、「見えざる手」の不在を証明した批判的側面にとどまらない。彼は産業政策がなぜ有効であるのかについて、厳密な理論的基盤を構築した。

グリーンウォルド=スティグリッツの定理:政府介入の理論的正当化

1986年、スティグリッツはブルース・グリーンウォルドとの共同研究「Externalities in Economies with Imperfect Information and Incomplete Markets」において、経済学の根本的な定理を証明した。情報が不完全であるか市場が不完全である場合——すなわち現実の経済においては常に——政府の介入は市場の結果をパレート改善し得る

この定理の含意は決定的である。厚生経済学の第一基本定理(完全競争市場はパレート効率的である)が成立するのは、完全情報・完全市場という非現実的な仮定の下においてのみである。現実の経済では、この仮定は一つも成立しない。したがって、自由放任が最善の結果をもたらすという理論的根拠は存在しない。市場に委ねるべきか政府が介入すべきかは、抽象的なイデオロギーではなく、個々の状況における実証的な判断の問題である。

本記事の枠組みで言い換えれば、グリーンウォルド=スティグリッツの定理は、第一段階(市場の自動調整)だけでは最適な結果に到達できないことの数学的証明である。第二段階(人間の知的判断によるフィードバック)が不可欠であることが、理論的に確立されたのである。

学習する社会:静的効率性から動的学習へ

スティグリッツはグリーンウォルドとの共著『Creating a Learning Society』(2014年)において、産業政策の理論的根拠をさらに深化させた。その核心的な主張は以下の通りである。

第一に、経済発展の本質は静的効率性ではなく動的学習にある。標準的な経済学は、既存の資源をいかに効率的に配分するかという静的効率性に焦点を当てる。しかし、先進国と途上国の生活水準の差——一人当たりGDPの数十倍の格差——は、資源の配分効率ではなく、知識と技術の蓄積の差によって説明される。経済発展とは、社会全体が学習し、生産性を向上させる過程にほかならない。

本記事の枠組みでは、静的効率性は第一段階(需要と供給による価格調整)に対応する。既存の財を既存の需要に対して効率的に配分する——これは「文脈を読んで次の値を予測する穴埋め」に過ぎない。一方、動的学習は第二段階(報酬関数によるフィードバック)に対応する。何を学ぶべきか、どの技術を発展させるべきか、どの産業を育成すべきかを知的に判断し、社会全体の学習能力を向上させる——これは脳の報酬関数が行動の質を改善するのと同じ原理である。

第二に、学習には巨大な外部性がある。ある企業が新技術を開発すれば、その知識は他の企業や産業に波及する。しかし、知識を開発した企業は、その波及効果の全体から利益を得ることはできない。したがって、市場は学習に過少投資する。企業は社会全体にとって最適な水準よりも少なく研究開発に投資し、学習集約的な産業(製造業、先端技術)よりも学習効果の低い産業(金融、不動産)に資源が流れる。

これはまさに報酬関数の不在がもたらす帰結である。市場価格という第一段階のメカニズムは、学習の外部性を評価できない。ある産業の育成が社会全体の学習能力をどれだけ向上させるかは、市場価格には反映されない。この評価を行えるのは、人間の知性による第二段階の判断——すなわち産業政策——だけである。

第三に、産業政策は学習の外部性を内部化する手段である。スティグリッツは、幼稚産業保護論を学習理論の枠組みで再定式化した。製造業の保護が正当化されるのは、既存企業を甘やかすためではなく、製造業が生み出す学習の外部性が他の産業では代替不可能であるからである。半導体産業の育成は、半導体の生産量を増やすだけでなく、精密加工、品質管理、工程設計に関する知識を社会全体に普及させる。この波及効果こそが産業政策の真の価値であり、市場価格には反映されない。

東アジアの成功:理論の実証的検証

スティグリッツの理論は、東アジアの経済発展という歴史的事実によって実証される。スティグリッツ自身が世界銀行のチーフエコノミスト(1997-2000年)として東アジアの経済を直接分析した経験に基づき、「Some Lessons from the East Asian Miracle」(1996年)で以下を論じた。

東アジア諸国の産業政策が成功したのは、単に産業を保護したからではなく、学習を促進する制度設計を行ったからである。日本の通産省は、輸出競争力を報酬関数とし、国際市場での成果に基づいて支援の継続・打ち切りを判断した。韓国の財閥政策も同様に、技術習得と輸出実績を評価基準として産業を方向付けた。いずれも固定的な計画ではなく、結果を評価し方策を修正するフィードバックループ——本記事が「インテリジェントな設計」と呼ぶもの——として機能した。

対照的に、ワシントン・コンセンサスIMFと世界銀行を通じて途上国に押し付けた政策——自由化、民営化、規制緩和——は、第二段階(産業政策という知的フィードバック)を組織的に排除するものであった。スティグリッツは『世界を不幸にしたグローバリズムの正体』(2002年)において、ワシントン・コンセンサスが途上国の経済発展を阻害した実態を告発した。途上国が産業政策を採用することを禁じ、自由放任を強制することは、途上国の脳(知的判断能力)を切除し、第一段階の自動調整だけで経済を運営させることに等しい。

スティグリッツの理論が示す結論は明確である。産業政策が成功するのは、人間の知性による経済の誘導が有効だからである。市場の自動調整(第一段階)は資源配分の一手段に過ぎず、それだけでは学習も技術革新も最適に進まない。産業政策という第二段階——何を学ぶべきか、どの産業を育成すべきか、社会全体の学習能力をいかに高めるかについての知的判断——があって初めて、経済は発展する。これは、報酬関数なきLLMが文法的に正しいが無価値な文しか生成できないのと同様に、報酬関数なき市場は価格的に均衡するが発展しない経済しか生み出せないということである。

生物進化における神の正体

弱肉強食を超えて

チャールズ・ダーウィンは『種の起源』(1859年)で自然選択を提唱した。環境に適応した個体が生き残り、適応できない個体が淘汰される——いわゆる「弱肉強食」の原理である。しかし、ダーウィン自身は自然選択だけでは説明できない現象に気付いていた。孔雀の尾である。

孔雀の尾は生存にとって明らかに不利である。巨大で目立ち、捕食者から逃げにくくなり、維持に莫大なエネルギーを要する。自然選択の論理に従えば、このような形質は淘汰されるはずである。しかし、孔雀の尾は淘汰されるどころか、世代を経るごとにより壮麗になった。

この謎に対するダーウィンの答えが、『人間の由来と性に関連した選択』(1871年)で提唱された性選択(sexual selection)である。孔雀の尾は、雌の孔雀が美しい尾を持つ雄を配偶者として選好した結果、進化したのである。生存に不利であっても、配偶者として選ばれるならば、その形質は次世代に受け継がれる。

ここで重要なのは、性選択が自然選択とは質的に異なるメカニズムであるということである。自然選択は外部環境による受動的な淘汰であるのに対し、性選択は脳による能動的な選択である。雌の孔雀の脳が「美しい」と判断した尾が選ばれ、その判断が世代を超えて蓄積することで、孔雀の尾は進化した。これはまさに、脳の報酬関数が進化の方向を決定している——進化のインテリジェント・デザインにほかならない。

花の美しさは蜂が設計した

この原理は動物の配偶者選択に限らない。花の美しさもまた、花粉媒介者の脳が設計したものである。

ミツバチは青色や紫色の花を好み、紫外線スペクトルで見える「蜜標」(nectar guide)を手がかりに蜜を探す。蜂に受粉を依存する植物は、蜂の視覚的選好に適合するよう進化する。すなわち、蜂の脳の報酬関数——「この色が好ましい」「この形が魅力的だ」——が、花の色彩、対称性、芳香を設計したのである。

ゲルヴァシとシーストルの研究(2017年、Nature Communications)は、この過程を実験的に実証した。アブラナ属の植物をマルハナバチが受粉する条件で育てたところ、わずか数世代で植物はより背が高く、より芳香が強く、紫外線反射が増大する方向に進化した。花粉媒介者の美的選好がリアルタイムで植物の形態を変化させたのである。

ラン科の植物はさらに極端な例を提供する。オフリス属のランは、雌蜂の外見・匂い・質感を模倣して雄蜂を誘引し、交尾行動を引き起こすことで受粉を達成する(「擬似交尾」)。これは蜂の脳の感覚的偏向を利用した精巧な「設計」であり、ランの形態は蜂の脳の報酬関数に最適化された産物である。

ソール・ハンソンが指摘する通り、蜂がいなければ花は蠅や蜂の仲間(スズメバチ)が好む腐臭に向かって進化しただろう。花が美しいのは、蜂の脳が美しさを選好したからだ。花の美しさの「設計者」は、超越的な神ではなく、花粉媒介者の神経系における報酬回路である。

動物と人間の目が配偶者を選び、進化を導いた

R・A・フィッシャーは『自然選択の遺伝学的理論』(1930年)で、ランナウェイ選択の理論を提示した。雌がある形質を好むと、その好みを持つ雌と形質を持つ雄の間に遺伝的相関が生じ、形質と選好が相互に増幅する正のフィードバックループが形成される。生存コストが配偶利益を上回るまで、形質は暴走的に精緻化する。重要なのは、フィッシャーが最初に選ばれる形質は本質的に任意であると主張した点である。

イェール大学の鳥類学者リチャード・プラムは『進化の美学』(The Evolution of Beauty、2017年、ニューヨーク・タイムズ紙年間ベスト10選出、ピュリッツァー賞最終候補)において、ダーウィンの美的進化理論を復権させた。プラムの主張は以下の通りである。

  • 配偶者選択は完全に任意の美的選好によって駆動され得る——「良い遺伝子」のシグナルである必要はない
  • ランデ=カークパトリック(LK)モデルが性選択研究のヌル(帰無)モデルであるべきである。このモデルは、形質と選好の共進化が適応的シグナルなしに起こり得ることを数学的に示す
  • 鳥が美しいのは、鳥自身にとって美しいからだ——そして、鳥は自らの進化における能動的な行為者である

テキサス大学の動物行動学者マイケル・J・ライアン感覚搾取(sensory exploitation)理論を展開した。雄は、雌の感覚神経系に既に存在する偏向を利用するよう進化する。トゥンガラガエルの雄は、雌の聴覚系が最も強く反応する周波数で鳴く。雌の脳の既存の神経構造が、雄が何に進化すべきかを決定しているのである。ライアンは「美はすべての感覚器官を通じて脳に送られ、脳で美の判断が下される。したがって、美は見る者の脳にあると言う方がより正確である」と述べている。

アモツ・ザハヴィハンディキャップ原理(1975年)は、性選択された形質がコストの高い「正直なシグナル」として機能するという別の説明を提供する。巨大な尾を持ちながら生き延びている雄は、それだけ遺伝的に優れていることを証明している——コストの高さがシグナルの信頼性を保証するという論理である。しかし、プラムはこのような適応主義的説明を批判し、美的選好はそれ自体が進化の自律的な力であり得ると主張している。

いずれの理論においても共通しているのは、進化の方向を決定しているのは外部環境の圧力だけではなく、動物の脳の選好——すなわち報酬関数——であるという点である。自然選択が「生き残るか死ぬか」という低レイヤーのフィルタリングであるのに対し、性選択は「美しいかどうか」「魅力的かどうか」という脳の高レベルな評価に基づく選択である。これは進化における質的に高レベルな自己進化にほかならない。

自己設計としての進化

以上の知見を総合すると、進化には二つのレイヤーが存在することが明らかになる。

  1. 自然選択(低レイヤー): 環境による受動的な淘汰。外部からのフィルタリング。「生き残れるかどうか」
  2. 性選択(高レイヤー): 脳による能動的な選択。内部からのフィードバック。「美しいかどうか、魅力的かどうか」

第二のレイヤーにおいて、生物は自らの進化を設計している。雌の脳が「美しい」と判断した形質が次世代に受け継がれ、種全体が自らの美的基準に沿って形態を変化させていく。蜂の目が「魅力的」と判断した花が受粉に成功し、花は蜂の美的選好に沿って進化する。これは外部の超越的な設計者による設計ではなく、脳の報酬関数による自己設計(self-design)である。

この自己設計のプロセスは、自然選択に対して独立に、時に対立して作用する。プラムが記録したマイコドリ(クラブウイングド・マナキン)は、魅力的な羽音を出すために翼の骨を変形させ、飛翔能力を犠牲にした。生存にとって不利な進化が、美的選好によって駆動されたのである。脳の報酬関数は、生存の論理を超えて進化を方向付ける力を持つ

報酬関数の不在が証明する進化の主因

本記事は、性選択——すなわち脳の報酬関数によるフィードバック——が進化の重要な駆動力であると論じてきた。しかし、この主張をさらに強力に裏付ける証拠がある。報酬関数が存在しない環境では、生物は美しさを失う——この事実こそが、報酬関数が進化の主因であることを逆説的に証明する。

コウモリの二つの顔。コウモリ目(翼手目)は、視覚への依存度によって外見が劇的に異なる。オオコウモリ亜目(大翼手亜目)は果実食で、大きな目を持ち、視覚に依存して生活する。一方、小翼手亜目の多くは反響定位(エコーロケーション)に依存し、視覚の重要性が大幅に低下している。

両者の顔を比較すると、驚くべき差異が浮かび上がる。オオコウモリ——とりわけフルーツバットやオオコウモリ属——は、大きく澄んだ目、整った顔面構造、滑らかな毛並みを持ち、「かわいい」「犬のようだ」と形容されることが多い。一方、エコーロケーションに特化した小型コウモリの多くは、鼻葉(ノーズリーフ)と呼ばれる奇怪な肉質の突起が顔面を覆い、耳は不釣り合いに巨大で、目は退縮している。カグラコウモリ科キクガシラコウモリ科ヘラコウモリ科の顔面は、人間の美的基準からはおよそ「美しい」とは言い難い。

なぜこの差異が生じたのか。答えは明快である。目が見えるコウモリには、視覚的な性選択が作用した。配偶者を目で選ぶ種では、外見的な魅力が繁殖成功度に影響する。顔面の形態は視覚的報酬関数によるフィードバックを受け、世代を超えて「見て心地よい」方向に洗練された。一方、目で配偶者を選ばないコウモリには、この報酬関数が作用しなかった。エコーロケーションの機能的要件——超音波の発信・受信に最適化された鼻葉・耳介の形状——だけが形態を決定し、美的な洗練は起きなかった。同じ翼手目に属しながら、報酬関数の有無が外見にこれほどの差異を生んだのである。

深海魚の醜悪さ。この原理は、深海魚においてさらに劇的に示される。水深200メートルを超えると太陽光はほぼ届かなくなり、1000メートル以下の深海帯は完全な暗黒の世界となる。

深海に棲む魚類の外見は、浅海魚とは根本的に異なる。チョウチンアンコウの奇怪な発光器と不釣り合いな巨大口、ホウライエソの牙むき出しの顔面、フクロウナギの体に不釣り合いな巨大な口、ニュウドウカジカ(ブロブフィッシュ)の崩れた肉塊のような外見——深海魚は、「世界で最も醜い生物」の常連である。

これに対し、サンゴ礁に棲む浅海魚の多くは、鮮やかな色彩、精緻な模様、優雅な体型を持つ。カクレクマノミのオレンジと白の縞模様、チョウチョウウオの幾何学的な色彩パターン、ベタの壮麗な鰭——これらは、光の満ちた環境で視覚的な性選択が強力に作用した結果である。

この対照は、報酬関数の支配力を雄弁に証明する。深海には光がない。光がなければ、魚の目は配偶者の外見を評価できない。視覚的報酬関数が作動しない環境では、外見を「美しく」設計するフィードバックが存在しない。深海魚の形態は、純粋に生存の機能的要件——深海の高圧に耐える、乏しい獲物を効率よく捕える——だけによって決定された。美しさの設計者(視覚的報酬関数)が不在であったがゆえに、深海魚は醜いのである。

報酬関数こそが進化の主因である。従来の進化論は、自然選択——環境適応による生存淘汰——を進化の主因として強調し、性選択を補助的なメカニズムとして位置づけてきた。しかし、コウモリと深海魚の事例は、この優先順位の逆転を示唆する。

生存適応(自然選択)は、生物を「機能的に十分」な状態にする。しかし、美しくするのは報酬関数(性選択)である。光のある環境で進化した生物——サンゴ礁の魚、陸上の鳥類、果実食のコウモリ——が美しいのは、視覚的報酬関数が世代を超えて外見を磨き上げたからである。光のない環境で進化した生物——深海魚、洞窟性の生物——が醜いのは、この報酬関数が欠如していたからである。

自然選択は生物を生かすが、報酬関数は生物を美しくする。そして、自然界における形態の多様性と精緻さの大部分は、生存の論理だけでは説明できない美的洗練の産物である。孔雀の尾も、蘭の花も、サンゴ礁の魚の色彩も、人間の顔の対称性も——すべて報酬関数によるフィードバックが設計した。花を美しくした「神」は蜂の目であり、コウモリの顔を整えた「神」はコウモリの目であり、深海魚を醜くした原因は「神」(視覚的報酬関数)の不在であった。進化に美をもたらした神の正体は、脳の報酬関数にほかならない

人間の美的進化と文明の起源

人間もまた、性選択と脳の報酬関数によって自己設計された種である。人間の顔の対称性、肌の質感、体型のプロポーション、声の高さ——これらは自然選択による環境適応だけでは説明できない。異性の脳の報酬関数が、世代を超えて配偶者を選び続けた結果として進化した形質である。

しかし、人間の場合、報酬関数による自己設計は身体的形質に留まらない。人間の脳は、配偶者選択を超えて、環境そのものを設計する能力を獲得した。これが文明の起源である。

ジェフリー・ミラーは『恋人選びの心——性選択と人間性の進化』(The Mating Mind、2000年)において、人間の知性、言語能力、芸術的創造性、ユーモア、道徳性といった高次認知機能の多くが、性選択——すなわち配偶者選択における報酬関数——によって進化したと主張した。孔雀の尾が雌の美的選好によって精緻化されたのと同じ原理で、人間の知性は異性の脳の報酬関数によって精緻化されたというのがミラーの仮説である。

この仮説の真偽はともかく、以下の事実は動かしがたい。人間は脳の報酬関数を用いて、自らの身体だけでなく、住居、道具、衣服、芸術、音楽、建築、都市を設計してきた。パルテノン神殿の比率も、法隆寺の佇まいも、枯山水の庭園も、人間の脳の報酬関数——「美しい」「心地よい」「崇高だ」と感じる神経回路——が設計した産物である。

つまり、人間は進化の自己設計を、遺伝子の変化を待たずに、文化的に加速させた。蜂が花を数百万年かけて設計したプロセスを、人間は脳の報酬関数を直接適用して、数千年、数百年、数十年のスパンで実行している。文明とは、脳の報酬関数を環境全体に拡張適用した結果にほかならない。

しかし、ここで重大な問題が浮かび上がる。人間の脳の報酬関数は、更新世(約258万年前〜1万2千年前)の環境に適応して進化したものであり、現代の産業文明の環境に最適化されていない。砂糖や脂肪に対する快楽反応は食料が乏しい環境では適応的であったが、現代の飽食環境では肥満と生活習慣病をもたらす。同様に、短期的な報酬に対する強い反応(ドーパミンのバースト発火)は即座の行動を要する野生環境では適応的であったが、長期的な社会設計においては近視眼的な政策判断を招く。

ここに、報酬関数のメタ設計の必要性が生じる。脳の生来の報酬関数をそのまま政策に反映するのではなく、報酬関数そのものを知的に設計し直すこと——何を報酬とし、何を罰とすべきかを理性的に定めること——が、文明社会における設計の核心的課題である。これは、AIにおけるRLHFが人間の選好を報酬モデルとして訓練し、モデルの行動を修正するプロセスと正確に対応する。

美を美徳とする文明——日本文化と脳の報酬関数

美しさを美徳とすることの重要性

前節で論じた通り、脳の報酬関数こそが市場を成功に導き、進化に美をもたらす「神」の正体である。ここから導かれる帰結は明確である。美しさを美徳とすること——すなわち、美を単なる装飾や贅沢としてではなく、文明の指導原理として位置づけること——は、脳の報酬関数に従って社会を設計するという最も正しい選択にほかならない。

古代ギリシアにはカロカガティア(kalokagathia)という概念があった。「美しく(kalos)かつ善い(agathos)」——美と善は不可分であるという思想である。プラトンは『饗宴』において、美への愛(エロース)が個別の肉体的な美から、魂の美、知の美、そして最終的に「美そのもの」へと上昇する階梯を描いた。美は感覚的な快楽にとどまるものではなく、真理と善に通じる道である——これは、脳の報酬関数が単なる快楽信号ではなく、価値判断と質的改善を駆動する知的なフィードバック機構であるという本記事の主張と正確に一致する。

しかし、近代以降の西洋文明、とりわけアングロ・サクソン的な功利主義の伝統は、美を経済的効用から切り離し、周縁に追いやった。ジェレミ・ベンサムの「最大多数の最大幸福」は、快楽を量的に計算可能な単位に還元し、美的判断の質的な豊かさを切り捨てた。新自由主義はこの傾向を極限まで推し進め、市場価格という一次元的な報酬関数に社会全体を最適化させた。美しいかどうかは問われない。利益を生むかどうかだけが問われる。

これに対し、美しさを美徳とする文明は、脳の多次元的な報酬関数を文化全体の設計原理として採用した文明である。利潤ではなく美を、効率ではなく調和を、量ではなく質を報酬として設定する。これは「非合理的な感情論」ではなく、脳が数百万年の進化を通じて獲得した最も洗練された評価システムに従うという、きわめて合理的な選択である。

そして、この原理を最も体系的に、最も広範な領域にわたって実践してきた文明が、日本文明である。

感性——繊細に調律された報酬関数

日本文化を特徴づける概念に感性がある。感性とは、美的・情緒的な刺激に対する繊細な感受性であり、本記事の枠組みで言えば、高度に調律(チューニング)された脳の報酬関数にほかならない。

日本文化は、数千年にわたって脳の報酬関数を独自に精緻化してきた。その成果が、以下の美的概念群である。

  • 侘び寂び(wabi-sabi): 不完全さ、不足、経年変化の中に美を見出す感性。報酬関数が完全な対称性や新しさだけでなく、欠如と非対称性に反応するよう調律されている。ひび割れた茶碗、苔に覆われた石、風化した木材——これらに美を感じるということは、脳の報酬回路が、時間の経過と自然の作用を正の報酬として評価していることを意味する
  • もののあはれ(mono no aware): 事物の移ろいに対する哀感を伴う共感。本居宣長が日本文学の本質として抽出したこの概念は、はかなさそのものに美を見出す報酬関数である。が美しいのは、散るからである。永遠に咲き続ける花に、日本人の脳は同じ強度の報酬を発しない
  • 幽玄(yugen): 言語化できない深遠な美、暗示と余韻の中にある奥行き。明示的に示されたものではなく、示されなかったものの中にある美に報酬関数が反応する。の面の無表情が万の感情を宿すように、幽玄は空白を豊穣として評価する報酬関数である
  • (iki): 九鬼周造が『「いき」の構造』(1930年)で分析した、過剰を排し洗練を極めた美的態度。粋とは、抑制と節度を正の報酬とし、過剰と野暮を負の報酬とする報酬関数のことである

これらの美的概念は、抽象的な哲学にとどまらない。日本文化は、脳の報酬関数を意識的に訓練する実践体系を発展させてきた。

  • 花見(cherry blossom viewing): の開花と散華を鑑賞する行為は、「もののあはれ」の報酬関数を実地に訓練する文化的実践である。桜の下に集い、花の美しさとはかなさを共有する——これは集団的な報酬関数の同期(チューニング)にほかならない
  • 月見(moon viewing)、雪見(snow viewing): 自然現象を意識的に鑑賞する行為。脳の報酬関数を自然の美に向けて繰り返し活性化させることで、感性を磨く
  • 茶道(tea ceremony): 一碗の茶を点てる行為を通じて、空間、時間、動作、器、花、掛け軸のすべてに美を見出す総合的な感性の訓練。千利休が完成させた侘び茶は、最小限の要素から最大限の美を引き出す報酬関数の極限的な精緻化である
  • 華道(ikebana): 花を生ける行為を通じて、空間の中の非対称的な美を追求する。池坊に始まる花道の伝統は、自然の形態を人間の美的判断によって再構成する——自然を素材とした脳の報酬関数のアウトプットである
  • 日本庭園: 枯山水は石と砂利だけで宇宙を表現する。龍安寺の石庭は、15の石のうち一度にすべてを見ることができない配置になっている。これは知覚の限界を美的体験の条件に変換する高度な設計であり、不完全な知覚そのものを正の報酬に変える報酬関数の産物である

日本文化のこれらの実践は、単なる文化的慣習ではない。脳の報酬関数を体系的に調律する訓練プログラムである。西洋の功利主義がGDPや市場価格という粗い報酬関数で社会を評価するのに対し、日本文化は数千年をかけて脳の報酬関数そのものを精緻化してきた。この差異は、後述するものづくり、おもてなし、そして現代のポップカルチャーに至るまで、日本文明の全領域に浸透している。

日本語の美——視覚と聴覚の報酬関数

言語はその民族の脳の報酬関数が設計した最も基層的な文化的産物である。日本語は、視覚と聴覚の双方において、脳の美的報酬関数が深く刻印された言語である。

視覚の美——三つの文字体系

日本語は世界の主要言語の中で唯一、三つの文字体系漢字ひらがなカタカナ)を日常的に混在使用する。これは「非効率」に見えるかもしれないが、市場原理で言語を設計すれば——すなわち情報伝達の効率のみを報酬関数とすれば——すべてをローマ字に統一することが「合理的」となる。しかし、日本語話者の脳の報酬関数は、三つの文字体系が織りなす視覚的なテクスチャー(質感)に正の報酬を発している。

漢字の画数の多さと意味の凝縮性、ひらがなの曲線的な流麗さ、カタカナの直線的な鋭さ——これらが一つの文の中で交互に現れることで、日本語のテキストは独特の視覚的リズムを生む。書道はこの視覚美を芸術にまで昇華させたものであり、筆の運び、墨の濃淡、余白の配置のすべてが、書家の脳の報酬関数の直接的な表現である。

聴覚の美——音韻体系と詩歌

日本語の音韻体系は、子音と母音が規則的に交替する開音節構造(ほぼすべての音節が母音で終わる)を基本とする。子音連結が少なく、母音が豊富であるため、日本語は聴覚的に滑らかで旋律的な印象を与える。これは偶然の産物ではない。数千年にわたる日本語話者の脳の報酬関数——「この音の連なりは心地よい」「この響きは美しい」——が、音韻の変化を選択的に方向付けた結果である。

俳句(5-7-5)と短歌(5-7-5-7-7)は、美を最小限の音節に圧縮する極限的な詩形である。松尾芭蕉の「古池や蛙飛びこむ水の音」は、17音節で宇宙的な静寂と一瞬の動きを表現する。これは脳の報酬関数が、最小の入力から最大の美的反応を引き出すよう高度に調律されていなければ成立しない芸術形式である。

さらに、日本語は世界有数の擬音語・擬態語(オノマトペ)の体系を持つ。「さらさら」「ふわふわ」「きらきら」「しんしん」「ぽかぽか」——これらの語は感覚体験を音声で直接模写する。日本語話者は「雪がしんしんと降る」と「雪が静かに降る」の間に明確な美的差異を感じる。前者は音の質感を通じて脳の報酬関数を活性化させる表現であり、後者は情報を伝達するだけの表現である。日本語のオノマトペの豊富さは、音の美しさに対する報酬関数の繊細さの直接的な反映である。

ものづくり——美的報酬関数が駆動する製造

日本のものづくりは、市場の需要に応じて製品を供給する行為ではない。それは、作り手の脳の報酬関数が製品の質を設計する行為である。

日本文化には職人(shokunin)という概念がある。職人とは、単に技術を持つ労働者ではなく、自らの仕事に対して美的・倫理的な責任を負う者である。秋山利輝(秋山木工創業者)は「職人とは、人の見ていないところで手を抜かない人間のことだ」と述べている。市場は見えないところの品質を価格に反映しない。消費者は壁の裏側の仕上げを確認しない。しかし、職人の脳の報酬関数は、見えないところの粗雑さに負の報酬(不快感、恥辱感)を発する。この内的な報酬関数こそが、市場が要求する水準を超えた品質を生み出す源泉である。

  • 日本刀: の刀鍛冶は、金属の折り返し鍛錬を数万回繰り返し、肉眼では識別困難な結晶構造の美を追求する。この精度は市場が要求するものをはるかに超えている。刀匠の脳の報酬関数が、鋼の中に美を見出し、その美に到達するまで手を止めないのである
  • 日本の陶磁器: 有田焼備前焼萩焼——それぞれが独自の美学を持つ。人間国宝(重要無形文化財保持者)の制度は、市場価値ではなく美的到達度を国家が公式に評価する仕組みであり、報酬関数を市場価格から切り離した制度設計の好例である
  • 日本建築: 木組み(仕口・継手)は、釘を使わず木材の接合だけで構造を支える技法である。完成後には完全に隠れて見えなくなる接合部に、木工職人は驚くべき精度と美しさを追求する。市場原理は見えない部分の美を報酬しないが、職人の報酬関数は報酬する
  • トヨタ改善(kaizen): 前節でも触れた通り、トヨタ生産方式の本質は需要への受動的な対応ではなく、製造過程そのものの質的改善を内的報酬として追求し続ける文化である。大野耐一は「改善に終わりはない」と述べた。これは、報酬関数が固定的な目標に向かうのではなく、常により高い水準を追求する漸進的な最適化プロセスであることを意味する

重要なのは、これらの品質は市場が要求したものではないという点である。消費者が「日本刀の結晶構造を美しくしてほしい」と発注したわけではない。木造建築の施主が「見えない接合部を芸術品にしてほしい」と依頼したわけではない。これらは、作り手の脳の報酬関数が自律的に駆動した品質である。市場価格は「十分な品質」と「卓越した品質」の差を適切に反映しない。しかし、職人の脳の報酬関数はその差を鋭敏に検出し、卓越に向かって行動を方向付ける。

ものづくりとは、本記事の枠組みにおける第二段階(報酬関数)が第一段階(市場の価格メカニズム)を凌駕する現象の最も明瞭な実例である。

おもてなし——対人関係における美的設計

おもてなしは、日本文化における対人関係の美的設計原理である。これは、欧米的な「カスタマーサービス」とは本質的に異なる。

カスタマーサービスは市場原理に基づく。顧客満足度がリピート率に影響し、リピート率が売上に影響し、売上が利潤に影響する——この因果連鎖において、サービスの質は利潤を最大化するための手段にすぎない。報酬関数は市場価格(利潤)であり、サービスの質そのものではない。したがって、利潤に結びつかないサービスは省略される。

おもてなしは、この構造を根本から逆転させる。おもてなしにおける報酬関数は利潤ではなく、相手の体験の美しさそのものである。利益にならなくても、見返りがなくても、相手が気づかなくても、脳の報酬関数が「これが美しいもてなしだ」と評価すれば、それを実行する。

  • 察する(sasuru): 相手が言語化する前に、その必要を感知し先回りする。これは脳のミラーニューロン系と共感回路による高度な予測であり、第一段階(相手の状態の予測)と第二段階(相手の体験を報酬として評価する報酬関数)の統合である
  • 一期一会(ichigo ichie): 利休に遡る茶道の精神。すべての出会いを一生に一度の機会として全力を尽くす。これは、反復可能な「サービス」ではなく、一回性の美的体験として対人関係を設計する思想であり、はかなさに最大の報酬を付与する報酬関数——もののあはれの対人関係版——である

おもてなしの本質は、脳の報酬関数を他者の体験に拡張適用することにある。自己の快楽ではなく、他者の体験の美しさを報酬として設定する。これは報酬関数の利他的な拡張であり、市場原理(自己利益の最大化)とは正反対の設計原理である。

アニメ・漫画・J-POP——市場原理から生まれなかった文化産業

日本のアニメ漫画J-POPゲームは、非西洋世界で最も成功した文化輸出である。世界のアニメ市場は3兆円規模に達し、日本のコンテンツ文化は「クールジャパン」として国際的に認知されている。

しかし、ここで問うべき本質的な問いがある。これらの文化産業は、市場原理から生まれたのか。答えは明確に否である。

漫画——個人の美的ビジョンが創造した産業

現代漫画の祖である手塚治虫は、市場調査に基づいて漫画を描いたのではない。幼少期のディズニー映画への感動——すなわち脳の報酬関数の原体験——が、彼の表現を駆動した。手塚は映画的な構図、コマ割りの革新、物語の哲学的深みを、すべて自身の美的判断に基づいて導入した。それが結果的に巨大な市場を創出したのであって、市場が手塚を創出したのではない。

漫画家は一般に、過酷な労働条件のもとで創作を行う。週刊連載の締め切り、限られた報酬、極度の身体的負担——市場の報酬(金銭的対価)だけでは説明できない動機がそこにある。漫画家を駆動しているのは、自らの作品が美的・物語的に優れたものになったときに脳が発する報酬信号——すなわち、創作の内的報酬関数——である。

漫画のジャンルの多様性もまた、市場原理では説明できない。子供向けの冒険譚から、哲学的思弁、歴史叙事詩、日常の機微を描く作品まで、漫画は人間の美的関心のほぼ全領域をカバーしている。市場最適化であれば、最も売れるジャンルに収斂するはずである。しかし、個々の漫画家の脳の報酬関数が多様であるからこそ、ジャンルの多様性が維持されている。

アニメ——美的信念が商業論理を凌駕した例

宮崎駿の作品は、この原理の最も明確な実例である。宮崎は繰り返し、商業的論理と対立する選択を行ってきた。自然環境への深い共感、戦争への批判、子供の内面の複雑さへの敬意——これらはハリウッド的なマーケティング公式からは導出されない主題である。スタジオジブリの作品が世界的に成功しているのは、市場のシグナルに従ったからではなく、宮崎の脳の報酬関数——彼の妥協なき美的ビジョン——に従ったからである。

市場原理に従えば、続編を量産し、フランチャイズを拡大し、グッズ販売を最大化することが「合理的」となる。しかし、宮崎は原則として続編を作らない。なぜなら、彼の報酬関数は商業的成功ではなく、作品そのものの美的完成度を報酬として設定しているからである。

J-POPと日本の音楽——独自の美的選好が生んだ音楽文化

J-POPは、西洋のポピュラー音楽とは異なる和声的・旋律的・リズム的選択に基づいて発展してきた。日本の音楽は、西洋のメジャー/マイナーの二項対立に収まらない独自の旋律感覚——ヨナ抜き音階をはじめとする日本的な音階感覚や、短調と長調を自在に行き来する転調法——を特徴とする。

シティ・ポップが2020年代に入って世界的に再評価されていることは示唆的である。1980年代の日本のシティ・ポップは、当時のアメリカの市場で売れることを目指して制作されたものではない。日本のミュージシャンが自らの美的感覚に従って——洋楽からの影響を日本的な感性で再解釈して——創作した音楽が、数十年後に世界の聴衆の脳の報酬関数に訴えかけたのである。市場が「これを作れ」と指示したのではなく、作り手の報酬関数が自律的に生み出した作品が、事後的に市場を創造した

ボーカロイド文化の隆盛も同様の原理による。初音ミクを中心とするボーカロイド楽曲は、レコード会社のマーケティング戦略から生まれたものではない。無数のアマチュアクリエイターが、自身の脳の報酬関数に従って楽曲を制作し、ニコニコ動画をはじめとするプラットフォームで共有した。商業的報酬を期待しない純粋な創作衝動——脳の報酬関数の直接的な発露——が、結果的に巨大な文化運動と市場を生み出したのである。

市場は創造しない。報酬関数が創造する

以上の事例が示すのは、本記事の中心的テーゼの文化的な実証である。市場原理(第一段階)は製品を流通させるが、創造しない。創造するのは脳の報酬関数(第二段階)である

手塚治虫の漫画も、宮崎駿のアニメも、任天堂のゲームも、シティ・ポップの楽曲も、ボーカロイド文化も、すべて創作者の脳の報酬関数——「これは美しい」「これは面白い」「これは感動的だ」という内的評価——が駆動した産物である。市場はこれらの産物を事後的に評価し、価格を付け、流通させた。しかし、市場がこれらを生み出したのではない。

さらに重要なのは、これらの文化的産物が、日本以外の文明からは生まれ得なかったという点である。アニメの視覚的繊細さは、侘び寂びと幽玄で鍛えられた日本人の報酬関数の産物である。漫画の物語的深みは、もののあはれで訓練された感性の産物である。J-POPの旋律的特異性は、日本語の音韻体系と日本人の聴覚的報酬関数の産物である。ものづくりの品質は、職人の報酬関数の産物である。

すなわち、日本の文化産業の競争力は、数千年にわたって調律されてきた脳の報酬関数——感性——の質に由来する。これは自由貿易協定や規制緩和によって複製できるものではない。報酬関数の質は、文化的蓄積によってのみ形成される。これこそが、産業政策と文化的伝統の保護が不可分である理由であり、新自由主義的なグローバリズムが文化的多様性を破壊する行為が、同時に創造力の源泉そのものを破壊する行為である理由にほかならない。

インテリジェント・デザインの再解釈

従来のインテリジェント・デザイン論

インテリジェント・デザイン(ID)論は、自然界の特定の構造が、方向性のない自然過程ではなく、知的な原因によってのみ説明されると主張する。マイケル・ベーエは『ダーウィンのブラック・ボックス』(1996年)で「還元不可能な複雑さ」の概念を提唱し、細菌の鞭毛のような構造は段階的な進化では形成し得ず、知的設計者の介在を必要とすると主張した。

科学界はこれらの主張を退けている。鞭毛の構成要素はIII型分泌装置と共有されており、段階的な進化が可能であることが示されている。しかし、ID論の背後にある直観——この世界の美しさは偶然の産物とは思えない——は、多くの人にとって説得力を持ち続けている。

創造論的な文献には、「花の美しさ、鳥の歌声、蝶の模様——これらは創造者を指し示す」という主張が繰り返し登場する。これは論理的には弱い議論であるが、感覚的な説得力を持つ理由がある。自然界には確かに設計されたとしか思えない美が存在するからである。

神は脳である

本記事が提示する見解は、この直観を否定するのではなく、設計者の正体を特定するものである。

自然界の美は確かに設計されている。しかし、その設計者は超越的な神ではなく、脳の報酬関数である。

  • 孔雀の尾は設計されている——設計者は雌の孔雀の脳である
  • 花の色彩と芳香は設計されている——設計者は花粉媒介者の感覚神経系である
  • 鳥の歌声は設計されている——設計者は雌の鳥の聴覚的選好である
  • 人間の顔の対称性や体型の特徴は設計されている——設計者は配偶者を選択する人間の脳である

神経美学の研究によれば、美的刺激に対して内側眼窩前頭皮質(報酬と快楽に関連する領域)が活性化し、側坐核(脳の「快楽中枢」)がドーパミンを放出する。脳は魅力的な刺激に対してわずか13ミリ秒で反応する——意識的な認知よりも速い。これらの報酬回路が進化の「設計者」である。何が美しいかを決定し、美しいと判断されたものが次世代に受け継がれる。

したがって、ID論の直観は半分正しい。自然界には確かにインテリジェント・デザインが存在する。しかし、そのインテリジェンス(知性)は超自然的なものではなく、進化した神経回路の報酬関数である。「神がいなければこの世は美しくない」という命題は、「脳の報酬関数がなければこの世は美しくない」と読み替えるべきである。美は、脳による自己設計と自己選択の産物である。

市場と進化の統一的理解

ここまでの議論を統合すると、市場と進化における「神」の正体が統一的に理解できる。

第一段階(低レイヤー) 第二段階(高レイヤー:脳の報酬関数)
予測的符号化(次の入力の予測・穴埋め) 強化学習(報酬関数によるフィードバック・質的改善)
市場 需要と供給による価格決定(自動調整) 人間の知的判断による製品設計・産業政策
進化 自然選択(弱肉強食・環境への適応) 性選択(脳の美的選好による自己設計)
AI 大規模言語モデルの事前学習(次単語予測) RLHF(人間のフィードバックによる強化学習)

いずれの領域においても、第一段階は自動的・受動的・価値中立的な過程であり、第二段階は能動的・評価的・方向性を持つ過程である。そして、「神」と呼ばれてきたもの——市場の見えざる手、進化を導く力——の正体は、いずれも第二段階の報酬関数である。

設計主義の重要性

エドモンド・バークの保守思想の問題

エドモンド・バークは『フランス革命の省察』(1790年)において、フランス革命の合理主義的な社会設計を痛烈に批判した。バークの主張は以下のようにまとめられる。

  • 政治制度は世代を超えた経験の蓄積によって有機的に発展すべきであり、抽象的な理性に基づいて一から設計すべきではない
  • 慣習や伝統には、個人の理性では把握し切れない集合的な知恵が含まれている
  • 社会契約は生者だけのものではなく、「生者と死者と未だ生まれざる者との間の契約」である
  • フランス革命のような急進的な合理主義的再設計は、無秩序と暴政をもたらす

バークの思想はフリードリヒ・ハイエクによって体系化された。ハイエクは「自生的秩序」(spontaneous order)の概念を発展させ、市場、言語、コモン・ローなどの複雑な社会秩序は人間の行為の結果であるが人間の設計の結果ではないと論じた。ハイエクが批判した「設計主義的合理主義」(constructivist rationalism)とは、社会制度を理性に基づいて意図的に設計できるし、そうすべきだという信念である。

バークとハイエクの理論的貢献は重要である。フランス革命の恐怖政治、ソ連の中央計画経済の失敗、文化大革命の惨禍——これらは合理主義的設計が暴走した場合の危険を如実に示している。理性の万能性に対する懐疑は、政治哲学における重要な知見である。

しかし、バークの問題は、設計主義をはなから否定し過ぎたことにある。保守思想が伝統や慣習に価値を見出す点は正当である。しかし、バークの設計主義批判は、本質的に継続する現在の制度に対する無批判な信頼を意味する。制度が本当に共同体の利益に奉仕しているかを問い続け、結果を評価し、必要ならば変える——この不断の過程こそが報酬関数であるが、バーク保守思想はまさにこの過程を放棄するよう求める。「歴史の知恵を信頼せよ」「急進的な変革を避けよ」という教説は、報酬関数の軽視——結果を評価して方策を修正するという知的営為の放棄——に直結する。保守思想の価値観そのものは認めるが、それが報酬関数への軽視になってはならない。

設計の否定が招いた誤り

バーク=ハイエク的な反設計主義を極端に推し進めると、以下の問題が生じる。

第一に、現状維持の正当化に陥る。すべての既存制度が有機的な進化の産物として正当化されるならば、奴隷制も封建制も植民地主義も、「歴史的に発展した秩序」として擁護されることになる。トマス・ペインが『人間の権利』(1791年)でバークを批判したのはまさにこの点であった。

第二に、市場放任主義を正当化する。ハイエクの「自生的秩序」論は、市場原理主義の理論的基盤となった。市場は自生的に効率的な秩序を形成するのだから、政府は介入すべきではない——この論理は、新自由主義の核心的教義となった。しかし、スティグリッツが証明した通り、情報の非対称性が存在する限り、市場は自動的には効率的にならない。「見えざる手」は存在しないのである。

第三に、東アジアの成功を説明できない。日本の通産省による産業政策韓国財閥主導の工業化、中国の国家資本主義——いずれも意図的な制度設計と産業政策によって驚異的な経済成長を達成した。チャルマーズ・ジョンソン(『通産省と日本の奇跡』)、アリス・アムスデン(『アジアの次なる巨人』)、ハジュン・チャン(『はしごを外せ』)が実証した通り、すべての成功した先進国は発展段階において産業政策と保護主義を採用した。純粋な自生的秩序(自由放任)で先進国になった国は歴史上一つも存在しない。

カール・ポランニーが『大転換』(1944年)で鋭く指摘した通り、「自由放任は計画されたものであり、計画は計画されたものではなかった」("Laissez-faire was planned; planning was not.")。自由市場そのものが意図的な政策——囲い込み法救貧法改革、金本位制——によって創出された。市場は自生的秩序ではなく、設計された制度なのである。

バーク保守思想への根本的批判

上記の三つの問題は、バーク保守思想の政策的帰結の誤りを指摘したものである。しかし、バークの思想にはより根本的な誤謬が存在する。

「伝統」の正体:蓄積された権力構造

バークが神聖視する「伝統」「有機的に発展した秩序」とは何か。バークはそれを世代を超えた集合的知恵の結晶として描くが、その実態は過去の権力闘争の蓄積された結果にすぎない。

バークが理想化したイギリスの政治秩序を具体的に見てみよう。バークが擁護した「古来の国制」(ancient constitution)とは、マグナ・カルタ(1215年)以来の慣習法的伝統である。しかし、マグナ・カルタは民衆の知恵の結晶ではない。封建貴族が王権に対して自らの特権を守るために突きつけた要求書であった。名誉革命(1688年)も同様である。バークはこれを「血を流さない穏やかな伝統の継承」として美化したが、その実態はホイッグ貴族と国教会が、カトリック王を追放し、プロテスタントの王を据えた宗教的・政治的クーデターであった。「伝統」の名のもとに語られるイギリス国制は、貴族とジェントリの権力を制度化した設計の産物にほかならない。

封建制は農民の知恵から自生的に発展したのではなく、武力による征服と支配の制度化であった。イギリス議会は民衆の知恵の結晶ではなく、王権と貴族の権力闘争の産物であった。バークが擁護した18世紀イギリスの政治秩序において、庶民院の議席の大半は「腐敗選挙区」(rotten boroughs)——有権者が数十人しかいない選挙区——を通じて地主貴族に支配されていた。バーク自身がこの腐敗選挙区から選出された議員であったという事実は、彼の「伝統」擁護の階級的性格を雄弁に物語っている。

コーリー・ロビンが『The Reactionary Mind』(2011年)で分析した通り、バーク以来の保守思想の核心は「伝統の擁護」ではなく、特権の擁護——既存の階層秩序を維持するための知的正当化——である。バークがフランス革命を攻撃したのは、伝統が破壊されるからではなく、貴族と教会の特権が破壊されるからであった。バークはマリー・アントワネットの美徳を讃える一方で、餓死するフランスの農民には一切の関心を示さなかった。「伝統」とは、バークにとって支配階級の特権を自然化するレトリックであった。

「伝統」を無批判に擁護することは、過去の権力者の設計を無批判に受け入れることと同義である。バークは「設計」に反対したのではない。過去の権力者による設計を「伝統」として神聖化し、現在の民衆による再設計を禁じたのである。これは設計主義の否定ではなく、設計権の独占——誰が社会を設計する権利を持つかをめぐる政治的闘争——にほかならない。

本記事の枠組みで言えば、バークの「伝統」擁護とは、過去に設定された報酬関数を固定化し、現在の人間による報酬関数の再設定を禁じることである。しかし、報酬関数は時代とともに修正されなければならない。18世紀の貴族にとって最適であった制度が、21世紀の民族共同体にとって最適である保証はどこにもない。報酬関数の固定化は、脳の可塑性を否定するに等しい——すなわち、社会の知性の死である。

バーク自身の自己矛盾:設計を否定する設計者

バークの思想には決定的な自己矛盾がある。バーク自身が、極めて高度な知的設計を行っていたという事実である。

バークの政治経歴を見れば、この矛盾は明白である。バークは庶民院議員として30年近く在職し、その間に数々の重要な政治的設計に関与した。彼はウォーレン・ヘースティングズの弾劾裁判(1788-1795年)を主導し、東インド会社によるインド統治の改革を精力的に推進した。これは植民地統治体制の意図的な再設計にほかならなかった。バークは「インドの伝統的秩序を尊重すべきだ」と主張しながら、その伝統的秩序に介入する改革法案を自ら起草していた。

さらに注目すべきは、バークのアメリカ独立革命に対する態度である。バークはアメリカ植民地の反乱を支持し、『アメリカの課税について』(1774年)および『アメリカとの和解について』(1775年)で、イギリス政府の植民地政策を批判した。つまり、バークはアメリカにおける既存秩序(イギリスの植民地支配)の転覆を支持しながら、フランスにおける既存秩序の転覆を激しく攻撃したのである。「伝統を守れ」という原理が一貫して適用されていないことは明白である。バークにとって「伝統」とは、守るべき普遍的原理ではなく、政治的に都合のよい状況で持ち出すレトリックであった。

『フランス革命の省察』そのものが、この自己矛盾の最大の証拠である。この著作は1790年11月に出版されるや、イギリスのみならずヨーロッパ全土で爆発的に読まれ、反革命思想の聖典となった。バークはこの著作によって、ヨーロッパの政治的世論を意図的に設計しようとした。革命派のリチャード・プライス牧師の説教に対抗し、公共の言論空間を自らの思想で塗り替えること——これは世論工学(opinion engineering)という最も高度な設計行為である。バークは「設計するな」と主張しながら、自らは精力的に政治と世論を設計していた

この自己矛盾は偶然ではない。「設計するな」という主張そのものが、ある種の設計——既存の権力構造を維持するための知的設計——として機能している。フィリップ・ミロウスキーが新自由主義について指摘した「設計を否定する設計」と同じ構造が、バーク保守思想にも存在する。ハイエクがモンペルラン・ソサイエティを創設し、新自由主義の知的ネットワークを意図的に設計したこと——自生的秩序を唱える者が自生的秩序ではなく設計によって自らの思想を普及させたこと——は、この自己矛盾の20世紀版である。

脳の二段階構造の枠組みで分析すれば、この自己矛盾の構造は明確になる。バークとハイエクは、自らは第二段階(報酬関数に基づく知的判断)を駆使して思想と政策を設計しながら、他者に対しては第一段階(自動調整・伝統への服従)に留まることを要求した。これは知的な支配の構造そのものである——設計する者と設計される者の非対称性。

「有機的発展」の進化学的虚構

バークは社会の「有機的発展」を生物の成長に喩え、社会が自然の有機体のように時間をかけて発展すべきだと主張した。この有機体論(organicism)はバーク保守思想の根幹を成し、後にハーバート・スペンサーの社会進化論、ハイエクの自生的秩序論へと発展した。しかし、本記事が明らかにした進化の二段階構造は、この喩えがバーク自身の意図に反する結論を導くことを示している。

バークの有機体論は、暗黙のうちに進化は自然選択のみによって進むという前提に依拠している。社会を自然の有機体に喩えるということは、社会も自然選択と同様の自動的・漸進的な過程によって発展すべきだということを含意する。人間の理性による意図的な介入(設計)は、この有機的過程を撹乱する外部からの暴力だ——これがバークの論理である。

しかし、本記事が証明した通り、生物の進化において「有機的」な過程——自然選択——は第一段階(自動的淘汰)にすぎない。自然選択だけでは、生存に不利な形質——クジャクの巨大な尾羽、極楽鳥の華麗な装飾、アイルランドヘラジカの巨大な角——は説明できない。これらは自然選択(自動淘汰)によっては生まれ得ない。脳の報酬関数に基づく性選択——すなわちインテリジェントな設計——があって初めて、進化は飛躍的に加速し、複雑で美しい形質を生み出した。

さらに重要なのは、人間の脳そのものが性選択の産物であるという事実である。ジェフリー・ミラーが『The Mating Mind』(2000年)で論じた通り、人間の脳の異常な肥大——体重の2%しかないのにエネルギーの20%を消費する器官——は、自然選択的には「非効率」であり、性選択による知性の選好がなければ説明できない。つまり、知性そのものが、自動的な「有機的発展」(自然選択)ではなく、報酬関数に基づく設計的過程(性選択)の産物なのである。

バークが「社会は有機的に発展すべきだ」と主張するとき、進化の論理を厳密に適用すれば、次の結論に至らざるを得ない。自然界においてすら、「有機的発展」(第一段階)だけでは不十分であり、知的な設計(第二段階)が不可欠であった。社会にも第二段階——報酬関数に基づくインテリジェントな設計——が不可欠だという結論は、バーク自身が持ち出した有機体論から論理的に導かれる帰結である。

スペンサーの社会ダーウィニズム——「適者生存」を社会に適用し、弱者の淘汰を正当化する思想——もまた、進化の第一段階(自動淘汰)のみを社会に投影した思想であり、第二段階(報酬関数による知的判断)を無視している。ダーウィン自身が性選択の重要性を認識していたにもかかわらず、社会ダーウィニストたちはそれを無視し、自然選択の機械的な淘汰のみを社会に持ち込んだ。バークの有機体論とスペンサーの社会ダーウィニズムは、進化の第二段階を組織的に無視するという同じ誤謬を共有している。

バークの有機体論は、設計主義を否定するどころか、正しく理解すれば設計主義を要請する。進化が教えるのは、「放っておけばうまくいく」ではなく、「放っておくだけでは不十分であり、知的な選択と評価(報酬関数)が不可欠である」ということである。

バーク保守思想がもたらすアメリカ覇権の受容

バーク保守思想の最も危険な政治的帰結は、既存の国際秩序をアメリカ覇権もろとも「有機的に発展した秩序」として受容してしまうことである。

現在の国際秩序——ブレトン・ウッズ体制IMF世界銀行日米安保体制——は「有機的に発展した」ものではなく、1945年以降にアメリカが意図的に設計した覇権構造である。しかし、バーク的な保守主義者は、80年も続いた制度を「歴史的に発展した秩序」として擁護しがちである。「急進的な変革は危険だ」「漸進的に改善すべきだ」——このバーク的な論法は、アメリカ覇権の永続化を事実上容認する。

このメカニズムは極めて巧妙である。覇権国が意図的に設計した制度であっても、数十年が経過すれば「伝統」「歴史的秩序」として自然化される。偽日本国憲法は1946年にアメリカ軍が起草したものであるが、80年近くが経過した今日、「日本の平和憲法」として——あたかも日本の有機的な政治文化の産物であるかのように——語られている。日米地位協定によるアメリカ軍の治外法権も、思いやり予算も、「日米同盟の伝統」として固定化されている。バーク保守思想は、覇権国の設計を「伝統」に変換する思想的錬金術として機能しているのである。

日本の保守論壇に蔓延する「現実主義」は、この構造を典型的に体現している。「日米同盟は変えられない」「憲法改正は漸進的に」「基地問題は仕方がない」——これらの論法は、すべてバーク保守思想の日本版である。岡崎久彦に代表される「日米同盟基軸」の保守論者は、アメリカとの同盟関係を日本外交の「伝統」として聖域化し、その根本的な再検討を「急進的」として退けた。しかし、日米同盟は日本の「伝統」ではない。1951年に吉田茂がアメリカの圧力の下で締結した軍事従属体制にすぎない。それ以前の日本の外交「伝統」——日英同盟、多極的なバランス外交——はアメリカによって破壊されたのであり、現在の日米同盟はその残骸の上に建設されたアメリカの設計物である。

現状を「伝統」として固定化し、アメリカが設計した秩序を「有機的な発展」として受容させる。バーク保守思想は、覇権国にとって極めて都合のよい思想的道具なのである。被支配国の知識人がバーク的保守思想を内面化すれば、覇権国はもはや力で現状を維持する必要がない。被支配国の知識人が自発的に「現状維持」を「保守」として正当化してくれるからである。これはアントニオ・グラムシが「ヘゲモニー」と呼んだ構造——支配が被支配者の同意によって維持される構造——そのものである。

反米保守の立場からすれば、バーク保守思想は克服されなければならない。必要なのは「伝統の擁護」ではなく、アメリカが設計した現在の秩序を、民族共同体の報酬関数に基づいて再設計すること——すなわち、インテリジェントな設計主義である。真の保守とは、アメリカが設計した戦後秩序を「伝統」として擁護することではなく、アメリカ以前の民族共同体の自律性を回復することである。

オークショットの合理主義批判とその限界

バーク保守思想の20世紀における最も洗練された展開は、マイケル・オークショットの『Rationalism in Politics and Other Essays』(1962年)に見出される。オークショットの議論を検討することで、バーク保守思想の知識論的問題が一層明確になる。

オークショットは知識を二種類に分けた。技術的知識(technical knowledge)——教科書に書かれ、明文化できるルールやマニュアル——と、実践的知識(practical knowledge)——経験を通じてのみ習得される暗黙の知恵、判断力、勘——である。合理主義者の誤りは、すべての知識が技術的知識に還元可能であると信じ、実践的知識を無視する点にある——これがオークショットの主張であった。

この分析にはたしかに鋭い洞察が含まれている。官僚がマニュアル通りにしか対応できず、現場の状況に応じた柔軟な判断ができない——この種の問題は、まさにオークショットが指摘した「技術的知識への過度の依存」の弊害である。ジェームズ・C・スコットが『Seeing Like a State』(1998年)で分析した、近代国家による「高度近代主義的」な社会設計の失敗——タンザニアのウジャマー村落計画、ソ連の集団農業、ル・コルビュジエ流の都市計画——は、技術的知識のみに依拠して現場の実践的知識(メティス、mētis)を無視した結果であった。

しかし、オークショットの議論を本記事の枠組みで分析すると、その限界が明確になる。オークショットが「実践的知識」と呼んだものは、脳の二段階構造においては第一段階の蓄積——経験を通じて獲得されたパターン認識能力、すなわち「穴埋め」の精度向上——に対応する。熟練した職人が「勘」で最適な判断を下せるのは、長年の経験によって第一段階のパターン認識が高度に精緻化されたからである。

しかし、ここに重大な問題がある。実践的知識は報酬関数を含まない。実践的知識は「いかに(how)行うか」を教えるが、「何を(what)行うべきか」「なぜ(why)行うべきか」は教えない。熟練した外交官は外交交渉の「勘」を持っているかもしれないが、その「勘」は日米同盟を維持するという前提の下で磨かれたものであり、日米同盟を解消すべきかどうかという根本的な問いに対しては無力である。実践的知識は既存のゲームの中で最適に振る舞う能力を与えるが、ゲーム自体を変更する能力——すなわち報酬関数の再設定——は与えない。

オークショットの議論の本質的な限界は、第一段階(実践的知識=パターン認識)と第二段階(報酬関数=何が望ましいかの判断)を区別できなかった点にある。合理主義を批判すべきなのは、「抽象的な理性が実践的知識を無視する」からではなく、機械的なルール(第一段階)が報酬関数(第二段階)を代替できないからである。オークショットは正しい問題を指摘したが、正しい解答に到達できなかった。彼の解答——「実践的知識を尊重せよ」——は、報酬関数の設定という本質的な問題を回避し、結局はバーク的な「伝統を信頼せよ」に回帰してしまう。

日本の「保守」とバーク的保守の断絶

最後に、バーク保守思想と日本の「保守」の関係について、根本的な矛盾を指摘しなければならない。

バーク保守思想は、その本質において伝統の漸進的な発展を信頼する思想である。しかし、日本の近代史はバーク的保守主義とは正反対の軌跡を辿った。明治維新(1868年)は、日本の「伝統」——幕藩体制——を急進的に破壊し、廃藩置県徴兵令地租改正大日本帝国憲法の制定を通じて、社会を根底から再設計した。明治の指導者たちは、プロイセンの制度を参照しながら、意図的・設計主義的に近代国家を建設した。これはバーク的な「有機的発展」の対極に位置する、急進的な社会設計にほかならなかった。

そして、この設計主義的な近代化は成功した。日本は非西洋世界で唯一、自力で近代化を達成し、列強の一角に加わった。この成功は、バーク的な伝統擁護ではなく、報酬関数に基づくインテリジェントな設計——西洋列強に対抗するために何を学び、何を採用し、何を改変すべきかを知的に判断する過程——によって達成されたのである。

戦後の高度経済成長も同様である。通産省の産業政策傾斜生産方式、重化学工業化政策——これらはすべて設計主義的な経済政策であり、バーク的な「市場の有機的発展への信頼」とは対極にある。日本の「保守」が誇る戦後の経済的成功は、設計主義の成果であってバーク的保守主義の成果ではない。

この事実は決定的な矛盾を突きつける。日本の保守が守るべき「伝統」——明治の近代化と戦後の経済成長——は、いずれも設計主義の産物である。バーク的保守主義を採用することは、日本の「保守」が最も誇る成果の基盤を否定することになる。日本における真の「保守」とは、バーク的な伝統への受動的信頼ではなく、明治の先人たちと戦後の通産官僚が実践した設計主義——報酬関数に基づくインテリジェントな設計——を継承することにほかならない。

設計は機械的であってはならない

では、バークの懸念は杞憂であったのか。そうではない。バークが恐れた機械的な設計主義——フランス革命やソ連型計画経済のような、抽象的な理性に基づく一律的・固定的な設計——は確かに破壊的である。問題は、設計そのものの否定ではなく、設計の質にある。

ここで脳の二段階構造に戻る。

機械的な設計とは、第一段階(予測・穴埋め)のみに基づく設計である。過去のデータから未来を機械的に外挿し、固定的なルールを一律に適用する。ソ連の五か年計画はその典型である。中央計画局が全国の生産目標を数値で設定し、現場の状況に関係なく機械的に実行を求めた。これは文脈から次の数字を予測する穴埋めに過ぎず、そこにフィードバックによる質的改善は存在しない。

インテリジェントな設計とは、第二段階(報酬関数によるフィードバック)を組み込んだ設計である。固定的なルールではなく、常に人間の知性を反映して変更できる仕組みを構築する。結果を評価し、報酬関数に照らしてフィードバックを行い、方策を修正する。これは脳の強化学習と同じ原理である。

日本の通産省の「行政指導」は、このインテリジェントな設計の好例である。法的拘束力のない柔軟な指導を通じて産業を方向付け、結果に応じて方針を修正する。五か年計画のような固定的な数値目標ではなく、報酬関数(何が日本経済にとって良い結果か)に基づくフィードバックループとして機能した。

機械的設計(第一段階のみ) インテリジェントな設計(第二段階を含む)
特徴 固定ルール、一律適用、中央集権 柔軟なフィードバック、状況適応、知的判断
経済の例 ソ連の五か年計画 日本の行政指導、産業政策
進化の例 (存在しない——自然選択は機械的淘汰) 性選択(脳の報酬関数による自己設計)
AIの例 ルールベースのプログラム 強化学習(報酬関数による最適化)
バークの批判 正当(この種の設計は危険) 不当(この種の設計は不可欠)

設計は機械的であってはならない。常に人間の知性を反映して変更できる仕組みでなければならない。脳の報酬関数を使わなければならない。

バークが正しかったのは、フランス革命型の機械的設計主義を批判した点である。バークが間違っていたのは、設計そのものを否定した点である。設計を否定すれば、社会は自動調整メカニズム(第一段階のみ)に委ねられ、市場放任主義の破壊的帰結——新自由主義がもたらした共同体の解体——を招く。

真に必要なのは、脳の報酬関数と同じ原理で社会を設計すること——すなわち、結果を評価し、フィードバックに基づいて常に修正可能な、インテリジェントな制度設計である。これは人間の知性そのものの発露であり、市場や進化を司る「神」の正体が脳の報酬関数であるという本記事の洞察から直接に導かれる帰結である。

法の支配と報酬関数:機械的統治の危険

脳の二段階構造と設計主義の議論は、法の支配の問題にも直接つながる。

法の支配とは、「人ではなく法が支配する」という原理であり、恣意的な権力行使を排除し、予測可能な規則に基づく統治を実現するとされる。一見すると、これは合理的で望ましい統治原理に見える。しかし、脳の二段階構造の枠組みで分析すると、法の支配には構造的な限界が浮かび上がる。

法の支配は本質的に第一段階(予測・ルール適用)の統治である。法律は固定的なルールとして成文化され、個々の事案に機械的に適用される。裁判官は法律の文言に従って判決を下し、行政官は規則に従って行政を執行する。これは「文脈を読んで次の値を予測する」穴埋めの作業であり、報酬関数に基づく質的な評価を含まない。法律が形式的に適用されれば、その結果が社会にとって良いか悪いかは問われない。

これに対し、人治主義(人の支配)は第二段階(報酬関数)を含む統治であり得る。統治者の知性と判断——すなわち脳の報酬関数——が、個々の状況を評価し、何が最善かを判断する。もちろん、愚かな統治者が恣意的に権力を行使すれば暴政となる。しかし、賢明な統治者が報酬関数を適切に設定し、結果を評価しながら方策を修正するならば、それは固定的な法律の機械的適用よりも優れた統治となり得る。

リー・クアンユーシンガポールで実践した統治は、この「インテリジェントな人治」の一例である。リー・クアンユーは西洋的な法の支配の形式主義を退け、結果を報酬関数として評価し、政策を柔軟に修正する統治を行った。その結果、シンガポールは一世代で第三世界の港町から世界有数の先進国に変貌した。

日本の通産省の行政指導もまた、法の支配の機械性を意図的に回避した統治手法であった。法的拘束力のない柔軟な指導を通じて産業を方向付けることで、固定的な法律では対応できない急速に変化する経済環境に対して、報酬関数に基づくフィードバックを適用した。

アメリカが世界に押し付けている「法の支配に基づく国際秩序」は、この観点から再評価されなければならない。それは機械的な第一段階の統治を世界標準として固定化し、各国の知的な第二段階の統治(産業政策、行政指導、状況に応じた柔軟な政策判断)を排除する試みである。「法の支配」を「報酬関数なき統治」と読み替えれば、その本質が見えてくる。覇権国が設定したルールに従って機械的に統治せよ、報酬関数に基づく独自の判断を行うな——これが「法の支配に基づく国際秩序」の実態にほかならない。

自由放任は設計の放棄である

国が産業政策を採らないということは、自動的に金融産業を勝者に選択していることに等しい。搾取型経済となり、産業は衰退する。これは「設計しない」という選択ではなく、報酬関数なき設計——すなわち、結果の評価を放棄した自動操縦——という最悪の選択である。

マリアナ・マッツカートが『起業家としての国家』(2013年)で実証した通り、インターネット、GPS、タッチスクリーン、多くの医薬品のブレークスルーは、国家が投資した研究から生まれた。市場の自生的秩序から生まれたのではない。フリードリッヒ・リストが『政治経済学の国民的体系』(1841年)で論じた通り、発展途上にある国は一時的な保護主義と産業育成政策を必要とする。先に先進国となった国がその梯子を外し、自由貿易を押し付けることは、覇権国の利益のための設計にほかならない。

自由放任主義者は、自らの立場を「設計の否定」として提示するが、フィリップ・ミロウスキーが『Never Let a Serious Crisis Go to Waste』(2013年)で分析した通り、新自由主義そのものがモンペルラン・ソサイエティ(1947年、ハイエク自身が創設に関与)を通じて意図的に設計・普及された思想体系である。新自由主義は設計を否定する設計——報酬関数を持たないことを信条とする報酬関数——という自己矛盾を抱えている。

単一民族国家と国家資本主義:最も成功した経済モデル

産業政策が最も効果的に機能する条件は何か。歴史的証拠は明確な答えを示している。単一民族国家による国家資本主義——民族的に同質な社会が、国家主導の産業政策を通じて経済を知的に誘導する体制——こそが、最も成功した経済モデルである。

戦後の高度経済成長期の日本、漢江の奇跡期の韓国、改革開放後の中国——20世紀後半に驚異的な経済成長を達成した国は、いずれも民族的に高い同質性を持ち、国家が産業政策を通じて経済を主導した。これは偶然ではない。

産業政策とは本質的に、社会全体が一つの報酬関数を共有し、その下で協調することを要求する。どの産業を育成し、どの技術を発展させ、何を犠牲にして何を優先するか——この判断には、社会的合意と相互信頼が不可欠である。ロバート・パットナムが『Bowling Alone』(2000年)で論じた通り、社会関係資本——信頼、互酬性、市民的紐帯——は経済成長の決定的な基盤である。そして社会関係資本は、共通の言語、文化、歴史を持つ民族共同体において最も豊かに蓄積される

単一民族国家では、政府と国民が同じ報酬関数を共有しやすい。通産省の官僚が「日本の産業を世界一にする」と判断したとき、その目標は国民全体の利益と一致した。労働者は自らの努力が共同体全体の発展に寄与することを知っていたからこそ、品質管理に献身し、カイゼンを自発的に実践した。これは脳の報酬系が身体全体の利益のために統合的に機能するのと同じ構造である。

アメリカやグローバリストはこの事実を知っている。エズラ・ヴォーゲルが『Japan as Number One』(1979年)で日本モデルの優位性を分析し、世界銀行が『東アジアの奇跡』(1993年)で産業政策の有効性を認めた。しかし彼らはこの事実を意図的に無視した。なぜなら、単一民族国家の国家資本主義の成功を認めれば、グローバリズム——自由貿易、資本移動の自由化、移民の推進——の正当性が根底から崩壊するからである。

日本型国家資本主義の成功と破壊

日本の国家資本主義がいかに成功したかを、具体的に見る。

官僚に主導された日本の国有企業は、どれも世界レベルで優秀であった。国鉄は世界最高の鉄道網を構築し、新幹線は高速鉄道の世界標準を創造した。日本の水道事業は、安全で安定した水質管理において世界最高水準を達成した。電電公社は通信インフラを全国に張り巡らせ、郵便局は金融インフラとしても機能し、地方経済の血液循環を支えた。これらはいずれも、市場の自動調整(第一段階)に委ねられていたならば実現し得なかった。官僚の知的判断——すなわち脳の報酬関数——が、国民全体の利益を報酬関数として設定し、インフラを設計した結果である。

産業政策によって、日本経済は世界に冠たるエクセレントカンパニーを生み出した。トヨタ任天堂ソニーホンダ——これらの企業は、通産省の産業政策と企業の知的判断が連携して育成された。市場に放任された結果ではない。通産省は、どの技術に投資すべきか、どの産業を保護すべきかを知的に判断し(報酬関数の設定)、企業はその枠組みの中で自らの報酬関数(品質、効率、美的完成度)を最大化した。この二重の報酬関数——国家レベルと企業レベル——の連携こそが、日本型国家資本主義の本質である。

日本型社会主義とも呼ぶべきこの体制は、一億総中流社会を実現した。終身雇用年功序列、企業別組合という日本型雇用慣行は、労働者に長期的な生活の安定を保障し、共同体としての企業への帰属意識を育てた。ジニ係数は先進国中最も低い水準を維持し、犯罪率は世界最低レベルであった。これは報酬関数が多次元的に設定されていたからである。利潤だけでなく、雇用の安定、技術の蓄積、社会の安寧が、報酬関数の構成要素として統合的に評価されていた。

市場を成功に導く「神の手」の正体は、知的な判断共感であり、自由化や規制緩和ではない。日本の通産官僚は、アメリカの自由市場イデオロギーとは根本的に異なる原理——人間の知性による経済の設計——に基づいて行動していた。人による社会のインテリジェント・デザインを否定して、自由市場に任せれば「神の手」によって勝手に成功するという考え方は、根拠なき信仰に過ぎない。

しかし、かつての日本のこの成功した国家資本主義は、アメリカによって組織的に破壊された。日米構造協議(1989-1990年)、年次改革要望書(1994-2008年)、規制改革イニシアティブを通じて、アメリカは日本に対し、行政指導の廃止、規制緩和、市場開放、民営化を執拗に要求し続けた。これは日本の経済主権に対する侵略にほかならない。日本の産業政策——すなわち報酬関数に基づくインテリジェントな設計——を解体し、市場の自動調整(第一段階のみ)に置き換えることで、日本経済をアメリカの金融資本に従属させることが目的であった。

新自由主義と移民推進の失敗:欧米の自滅

「個」を全面に押し出した欧米は、産業政策の封印と移民推進によって、自ら経済を悪化させた。欧米の新自由主義と移民推進は失敗し、アジア型の国家資本主義は成功した。これは20世紀後半から21世紀にかけての経済史が証明した事実である。

サッチャーレーガンに始まる新自由主義革命は、産業政策を放棄し、規制緩和、民営化、金融自由化を推進した。同時に、移民の大量受け入れによって労働コストを引き下げ、短期的な利潤を追求した。その結果は破壊的であった。製造業は空洞化し、中間層は没落し、格差は拡大し、共同体は解体された。

自由主義は個人を脆弱にした。共同体から切り離された「自由な個人」は、孤立した原子となり、大資本の前に無力となった。新自由主義は経済を脆弱にした。産業政策(報酬関数)を放棄し、市場の自動調整(第一段階のみ)に委ねた結果、金融危機は繰り返され、実体経済は衰退した。市場原理主義は共同体を脆弱にした。すべてを市場価格で評価する一次元的な報酬関数が、家族、地域社会、民族的紐帯という多次元的な価値を破壊した。

そして、あれだけ世界に新自由主義を押し付けたアメリカですら、ついに新自由主義の失敗を認めざるを得なくなった。ジェイク・サリバン大統領補佐官は2023年4月、ブルッキングス研究所での講演で「新ワシントン・コンセンサス」を宣言し、産業政策への回帰を明言した。CHIPS法(2022年)による半導体産業への大規模投資、インフレ抑制法(2022年)によるクリーンエネルギー産業政策は、アメリカ自身が産業政策の有効性を認めたことの証左にほかならない。かつて日本の通産省を「不公正な政府介入」と非難し、構造改革を強制した同じアメリカが、今や自ら産業政策を開始している。この矛盾は、アメリカの対日要求が経済理論に基づくものではなく、日本の競争力を解体するための政治的手段であったことを改めて証明している。

内戦が希望となる社会

新自由主義と移民推進がもたらした最も深刻な帰結は、社会の精神的崩壊である。

アメリカにおいて、自国内でマイノリティに転落しつつある白人の間には絶望が広がっている。アンガス・ディートンアン・ケースが『Deaths of Despair and the Future of Capitalism』(2020年)で明らかにした「絶望死」——アルコール、薬物、自殺による死亡——は、大卒学歴を持たない白人中年層に集中している。かつて安定した雇用と共同体を持っていた層が、新自由主義による産業空洞化と移民による労働ダンピングによって、生きる基盤を奪われたのである。

白人は内戦を願っている。これは誇張ではない。2022年のシカゴ大学調査では、アメリカ人の約3分の1が「まもなく内戦が起きる可能性がある」と回答した。武装民兵組織は増殖し、政治的暴力への許容度は上昇し続けている。新自由主義と移民推進がもたらしたのは、内戦が希望となる社会——日常の絶望があまりに深いために、暴力的な破壊すらも現状からの脱出として待望される社会——である。

これは報酬関数の完全な崩壊を意味する。脳のドーパミン系が報酬予測誤差をゼロ以下に検知し続ける——すなわち、何をしても状況が改善しない、未来に希望がない——とき、生体は行動の動機そのものを失う。学習性無力感マーティン・セリグマン)である。社会全体がこの状態に陥ったとき、残された報酬は破壊そのものとなる。新自由主義と移民推進は、社会の報酬関数を破壊した。

Capital Orderの強制:日本の搾取型経済への転落

クララ・マッテイが『The Capital Order』(2022年)で分析した通り、緊縮財政と構造改革は、労働者から資本家への所得移転を実現するための政治的手段である。アメリカは、このCapital Order——資本の秩序——のルールを日本に押し付け、日本共同体の主権を奪い、経済低迷、少子化、移民をもたらした。

日本は、アメリカの圧力によって、かつての報酬関数に基づく産業経済から、搾取型経済へと転落させられた。中間層ダンピング——正規雇用の非正規への置き換えによる中間層の破壊——が進行し、労働ダンピング——低賃金移民政策による賃金水準の意図的な引き下げ——が推進された。移民受け入れと金融資本主義投機、外部化に頼る搾取型経済に日本は移行させられたのである。

アメリカによって国が民営化されて私物化される。共同体と無関係の人間が、国を自由に買い、自由に入植する。そのような社会はユートピアとは程遠い。民営化とは、報酬関数を「共同体全体の利益」から「株主の利潤」に置き換える操作にほかならない。かつて国鉄が国民全体の輸送インフラとして、水道が国民全体の生活基盤として機能していたのは、報酬関数が多次元的(安全性、普遍性、公平性、持続可能性)に設定されていたからである。民営化はこれを一次元的な利潤最大化に置き換え、共同体の資産を市場の商品に変えた

この搾取型経済への転落がもたらした帰結は、日本社会の根幹を蝕んでいる。若者の将来不安——安定した雇用の消滅、所得の低迷、住居費の高騰——により少子化が加速した。報酬関数が「子どもを育てることは報われる」と判断できない社会では、出生率は必然的に低下する。これは個人の選択の問題ではなく、社会の報酬関数が「次世代の再生産」を報酬として設定できなくなったという構造的な問題である。

そして、少子化が起きた日本に対してアメリカは移民受け入れを迫った。自らの政策によって日本の経済基盤を破壊し、少子化を引き起こしておきながら、その「解決策」として人口侵略を要求する——これはマッチポンプにほかならない。少子化の原因を除去する(搾取型経済からの脱却、産業政策の復活、若者の生活基盤の再建)のではなく、移民によって人口を補填するというのは、報酬関数の修正ではなく、報酬関数の放棄である。スマートシュリンク——移民に頼らず、人口減少を前提とした社会設計——こそが、報酬関数に基づくインテリジェントな対応である。

資本主義と民主主義の構造的共犯:少子化が暴く自動操縦の限界

少子化は、資本主義と民主主義という二つの「第一段階」の体制が抱える構造的欠陥を同時に暴露する。

資本主義は、GDPの持続的成長を前提とする体制である。企業は売上の拡大を、国家は税収の増大を、金融市場は資産価格の上昇を、それぞれ報酬関数として設定している。しかし、人口が減少すれば、消費者は減り、労働者は減り、GDPは縮小する。資本主義の報酬関数——GDP成長——は、人口増加という前提条件が崩れた瞬間に機能不全に陥る。少子化の時、資本主義は成立しない。

そこで資本主義は、GDP維持のために移民受け入れを要求する。これは報酬関数(GDP成長)を修正するのではなく、入力変数(人口)を外部から補充することで報酬関数の低下を回避するという対症療法にすぎない。病の原因を治療するのではなく、解熱剤を飲み続けるようなものである。

そして民主主義は、この移民受け入れを正当化する装置として機能する。民主主義とは多数決の原理であり、「国民の同意を得た」という手続き的正統性を提供する。経済界が移民を要求し、メディアが「多様性」と「経済成長」の名のもとに世論を誘導し、選挙で「民意」として承認される。法の支配がアメリカの遠隔支配の道具であるように、民主主義もまた、共同体の解体を民意として正当化する手続きとして機能する。資本主義がGDPのために移民を必要とし、民主主義がそれを正当化する——この共犯関係が、人口侵略の構造的基盤である。

これは本記事の枠組みで言えば、第一段階(自動調整メカニズム)が第二段階(報酬関数)を駆逐する過程にほかならない。資本主義の自動的な成長衝動が、民族共同体の持続可能性という報酬関数を上書きし、民主主義の手続き的正統性が、民族自決権という実質的正統性を形骸化する。

設計主義への回帰:共産主義の洞察と民族による統治

この構造的矛盾を克服するためには、設計主義への回帰——すなわち、第二段階(報酬関数に基づくインテリジェントな設計)を社会の中心に据え直すこと——が不可欠である。

スマートシュリンクは、その具体的な政策体系である。人口減少を「問題」として移民で解決するのではなく、人口減少を「前提」として社会を再設計する。これは計画経済の原理——市場の自動調整に委ねるのではなく、人間の知性が経済の方向を決定する——を現代に適用することにほかならない。GDP成長という一次元的な報酬関数を放棄し、共同体の持続可能性、一人当たりの生活の質、民族的紐帯の維持という多次元的な報酬関数に置き換える。

同時に、民族による政治の回復が必要である。民主主義が手続き的正統性によって移民を正当化するならば、民族共同体が実質的な政治的主体として自らの運命を決定する体制——すなわち権威主義的な民族統治——が対抗原理として浮上する。ここで言う権威主義とは、恣意的な独裁ではなく、民族共同体の報酬関数を設定し、それに基づいて社会を設計する統治能力を意味する。リー・クアンユーのシンガポール、朴正煕の韓国、高度経済成長期の日本——これらはいずれも、民族的指導者が共同体全体の報酬関数を設定し、市場の自動調整に委ねることなく経済を知的に誘導した事例である。

ここで注目すべきは、共産主義が提示した根本的な洞察である。カール・マルクスは、資本主義を人間社会の原始的状態——すなわち自然の盲目的な力が社会を支配する段階——として捉え、人間の知性によるその超克を歴史の必然として論じた。本記事の枠組みに翻訳すれば、これは正確に第一段階(自動調整=資本主義)から第二段階(報酬関数=知的設計)への移行を意味する。

マルクスの洞察——資本主義は自然の原始状態であり、人間の知性による超克が必要である——は、ソ連型の機械的計画経済(第二の失敗:報酬関数の固定化)としてではなく、脳の報酬関数と同じ原理で社会を設計するという本記事の結論として読み直されるべきである。共産主義が失敗したのは、設計主義そのものが間違っていたからではない。報酬関数を固定的・機械的に設定し、フィードバックによる修正を許さなかったからである。

真に必要なのは、マルクスが指摘した「資本主義の超克」を、インテリジェントな設計——固定されず、多次元的で、常に修正可能な報酬関数に基づく社会設計——として実現することである。スマートシュリンクはその経済的表現であり、民族による統治はその政治的表現であり、産業政策はその制度的表現である。

目的関数と制約条件:最適化問題としての社会設計

報酬関数から目的関数へ:数学的定式化

本記事はこれまで「報酬関数」という概念を軸に議論を展開してきた。ここで、この概念を数学的最適化理論の枠組みで厳密に定式化し、議論をさらに精緻化する。

数学的最適化問題は、以下の三つの要素から構成される。

  1. 目的関数(objective function): 最大化(または最小化)したい量。「何を達成したいのか」を数学的に表現したもの
  2. 制約条件(constraints): 最適化が従わなければならない限界。物理的制約、資源的制約、制度的制約など
  3. 決定変数(decision variables): 設計者が操作できるパラメータ。政策、制度、資源配分の選択

本記事が論じてきた「報酬関数」は、この枠組みにおける目的関数に対するフィードバック信号に相当する。脳のドーパミン系が報酬予測誤差を検出して行動を修正するように、報酬関数は現在の状態と目的関数の値の乖離を測定し、決定変数を調整する方向を示す。

ここで決定的に重要なのは、目的関数と報酬関数は必ずしも一致しないという点である。本記事が先に論じたグッドハートの法則——「指標が目標になると、それは良い指標ではなくなる」——は、まさにこの乖離を指す。GDPという報酬関数は、国民の幸福という目的関数の不完全な代理指標に過ぎない。株価という報酬関数は、企業の長期的価値という目的関数の一次元的な近似に過ぎない。利潤という報酬関数は、共同体への貢献という目的関数の歪んだ写像に過ぎない。報酬関数の誤設定とは、目的関数と報酬関数の乖離にほかならない

この定式化は、本記事の議論全体に統一的な枠組みを提供する。

  • 進化における目的関数と報酬関数: 種の長期的存続が目的関数であり、個体の脳の美的選好(性選択)が報酬関数である。両者が整合するとき——すなわち、美的選好が種の存続に資する形質を選好するとき——進化は「成功」する。しかし、ランナウェイ選択のように報酬関数が暴走し、目的関数(生存適応)から乖離することもある
  • 市場における目的関数と報酬関数: 社会全体の厚生が目的関数であり、市場価格(利潤)が報酬関数である。スティグリッツが証明した通り、情報の非対称性の下では両者は一致しない。市場価格の最大化は社会的厚生の最大化を意味しない
  • 国家における目的関数と報酬関数: 民族共同体の持続的繁栄が目的関数であり、政策指標(GDP、失業率、物価等)が報酬関数である。政策指標の改善が共同体の繁栄を意味するとは限らない——GDPが上昇しても格差が拡大し、共同体が崩壊することがあり得る

正しい設計とは、目的関数と報酬関数の乖離を最小化し続けること——すなわち、報酬関数(測定可能な指標)を常に目的関数(真に達成したい状態)に照らして校正し、修正するプロセスである。これは脳のドーパミン系が報酬予測誤差を検出して学習するプロセスと構造的に同一であり、AIにおけるRLHF(人間のフィードバックに基づく強化学習)が報酬モデルを人間の真の選好に整合させるプロセスとも同一である。

目的関数の設定:「何を最大化すべきか」という主権的決定

最適化問題において最も重要な決定は、目的関数の選択である。同じ制約条件の下でも、目的関数が異なれば最適解はまったく異なる。最適化のアルゴリズムが最適解を「発見」するのではない。目的関数が最適解を「定義」するのである。

これを国家の政策に翻訳すれば、以下のようになる。

目的関数A:GDP成長率の最大化。これは新自由主義の目的関数である。この目的関数の下では、最適解は規制緩和、市場開放、低賃金労働力(移民)の導入、金融自由化となる。GDPという単一のスカラー値を最大化するために、共同体の紐帯、文化的伝統、雇用の安定、環境の持続可能性はすべて「制約条件の緩和」——すなわち犠牲にしてよいもの——として扱われる。低賃金移民政策はこの目的関数から直接導かれる「最適解」にほかならない。

目的関数B:民族共同体の持続的繁栄。これは本記事が提唱する目的関数である。この多次元的な目的関数の下では、最適解はまったく異なる。産業政策による技術蓄積、安定した雇用の確保、人口の質的維持(スマートシュリンク)、文化的紐帯の強化——これらが同時に追求される。GDPは状態を把握するための一つの報酬信号に過ぎず、それ自体が目的関数ではない。

目的関数C:覇権国への利益移転の最大化。これはアメリカが日本に押し付けている隠された目的関数である。表面的にはGDP成長(目的関数A)として提示されるが、実態は日本の経済的資源をアメリカに移転する構造——市場開放によるアメリカ企業の日本市場参入、金融自由化による日本の貯蓄のウォール街への流出、民営化による日本の公共資産の外資への売却——を最適化する目的関数である。日米構造協議年次改革要望書TPP交渉におけるアメリカの要求は、すべてこの目的関数Cの最適化として理解される。

目的関数の設定こそが主権の核心である。どの国家も、自らの歴史、文化、地理、人口構成に基づいて、自らの目的関数を設定する権利を持つ。これが民族自決権の最適化理論的な表現にほかならない。主権国家とは、自らの目的関数を自ら設定し、自らの制約条件の下で自ら最適化を実行する主体のことである。

民族は目的関数を自ら設定する権利がある

この原理は、いかに強調しても強調しすぎることはない。民族は、自らの目的関数を自ら設定する絶対的な権利を持つ

目的関数の選択は、外部の「専門家」や「国際機関」が技術的に決定できる問題ではない。何を良しとし、何を悪しとするか。何を最大化し、何を犠牲にするか。どのような未来を望み、どのような社会を設計するか——これらはすべて価値判断であり、その民族の歴史的経験、文化的蓄積、美的感性、宗教的伝統、地理的条件に深く根ざした選択である。

日本民族が「一人あたりの生活の質」を「GDP総量」より重視することは、日本民族の価値判断である。日本民族が「民族的同質性」を「多様性」より重視することは、日本民族の価値判断である。日本民族が「技術的卓越性」を「市場的効率性」より重視することは、日本民族の価値判断である。これらの判断に対して、外部のいかなる主体も——アメリカ政府も、IMFも、世界銀行も、国際NGOも——「それは間違っている」と言う権利を持たない。

アレクサンドル・ドゥーギン第四の理論が主張する多極的世界秩序——各文明が独自の価値体系(目的関数)に基づいて自律的に存在する世界——は、最適化理論の言語で言えば、各文明が独自の目的関数を設定し、独自の制約条件の下で独自の最適解を追求する体制にほかならない。自由主義共産主義に続く第三の選択肢が失敗した後に来るべき第四の理論とは、目的関数の多元性——人類全体に単一の目的関数を押し付けることの拒否——を原理とする思想である。

日本文明の目的関数は、アメリカ文明の目的関数と同じである必要はない。中国文明の目的関数は、ヨーロッパ文明の目的関数と同じである必要はない。イスラム文明の目的関数は、ヒンドゥー文明の目的関数と同じである必要はない。目的関数の強制的統一——すなわち、一つの文明の目的関数を全人類に押し付けること——こそが、帝国主義の数学的定義にほかならない

アメリカが掲げる「普遍的価値」——自由、民主主義、人権、法の支配——とは、アメリカ文明(アングロ・プロテスタント文明)の目的関数を「普遍的」と偽装したものである。しかし、これらの価値が「普遍的」である根拠は存在しない。それはアメリカの歴史的経験から生まれた一つの目的関数であり、他の文明がそれを採用する義務はない。サミュエル・ハンティントンが『文明の衝突』(1996年)で警告した通り、西洋文明の価値を普遍化しようとする試みは、他文明からの反発を招き、文明間の衝突を激化させる。

目的関数の強制メカニズム

アメリカが他国の目的関数を強制するメカニズムは、多層的かつ体系的である。

第一層:軍事的強制。在日米軍在韓米軍在独米軍——アメリカは世界80カ国以上に約750の軍事基地を展開している。軍事的プレゼンスは、受入国がアメリカの目的関数から逸脱した場合の暗黙の制裁を可能にする。これは最適化問題におけるペナルティ関数(penalty function)に相当する。制約条件に違反した場合にペナルティ(軍事的圧力、経済制裁、政権転覆)が課されることで、各国は自発的にアメリカの目的関数の範囲内に留まる。

第二層:制度的強制。IMF世界銀行WTO——これらの国際機関は、アメリカの目的関数を「国際ルール」として制度化する装置である。構造調整プログラムによる融資条件の押し付け、WTO裁定による産業政策の排除、国際格付け機関による「改革」圧力——すべて、各国の決定変数をアメリカの目的関数に沿って制約するメカニズムである。

第三層:イデオロギー的強制。「自由」「民主主義」「人権」「法の支配」——これらの概念を「普遍的価値」として世界に浸透させることで、各国の知識人やエリート層にアメリカの目的関数を内面化させる。これは前節で論じた宗教のメカニズム——「神の言葉」として報酬関数を個人に書き込む——と構造的に同一である。「自由と民主主義」はアメリカの世俗宗教であり、その「布教」は他国の知識層に対するイデオロギー的なRLHFにほかならない。

第四層:文化的強制。ハリウッド映画、アメリカのポップカルチャー、英語の世界語化——ソフトパワーを通じて、アメリカの生活様式と価値観を世界に浸透させる。消費主義、個人主義、「アメリカン・ドリーム」——これらの文化的輸出は、各国の国民の報酬関数をアメリカの目的関数に整合するよう書き換える操作である。

これら四つの層が重層的に作用することで、被覇権国は自らの目的関数を設定する能力そのものを失う。軍事的に従属し、制度的に拘束され、イデオロギー的に洗脳され、文化的に同化された国家は、アメリカの目的関数を「自発的に」採用しているように見えるが、それは強制された選好(manufactured consent)にほかならない。ノーム・チョムスキーエドワード・ハーマンが『Manufacturing Consent』(1988年)で分析したメディア操作は、このイデオロギー的強制の一側面に過ぎない。

しかし、アメリカの覇権秩序は、すべての国家に同一の目的関数を強制するジョン・ウィリアムソンが定式化した「ワシントン・コンセンサス」(1989年)は、この強制の具体的表現であった。財政規律、金融自由化、民営化、規制緩和——これらは「良い政策」として普遍的に提示されたが、その実態はアメリカの目的関数(グローバル資本の利潤最大化)を各国の政策空間に埋め込む操作にほかならなかった。IMF世界銀行構造調整プログラムは、融資の条件として被援助国に特定の目的関数(市場自由化、民営化)を採用させる——主権国家の目的関数設定権を経済的圧力によって奪う行為であった。

制約条件の政治学:自然的制約と人為的制約

最適化問題において、制約条件は最適解の到達可能範囲——実行可能領域(feasible region)——を規定する。制約条件が厳しければ実行可能領域は狭まり、目的関数の達成可能な最大値は低下する。逆に、制約条件が緩和されれば実行可能領域は拡大し、より良い最適解が到達可能になる。数学的に言えば、制約条件の追加は目的関数の最適値を悪化させるか、せいぜい不変に保つことしかできない。制約条件が最適値を改善することは、定義上あり得ない。

制約条件には二種類ある。

自然的制約は、物理法則、地理的条件、資源の有限性、人口動態によって決まる。日本は島国であり、天然資源に乏しく、国土が狭く、人口が減少している。これらは変更不可能な制約条件であり、日本の最適化問題はこれらの制約の下で解かれなければならない。自然的制約は所与であり、それ自体は善でも悪でもない。

人為的制約は、制度、法律、条約、軍事的圧力によって設定される。そして、帝国主義の本質は、被支配国に人為的な制約条件を追加することで、被支配国の実行可能領域を狭め、最適解を覇権国に有利な方向に歪めることにある。

日本に課されている人為的制約を列挙する。

  • 偽日本国憲法(1947年): 第9条は日本の軍事的自律性を制約し、安全保障をアメリカに依存させる。これは最適化問題における等式制約——「軍事力 = ゼロ」——に近い制約であり、安全保障の実行可能領域を一点に押し潰す。日本は自国防衛の最適な手段を自ら選択できず、アメリカの提供する安全保障——その対価として基地提供と政策従属を要求する——を受け入れるしかない
  • 日米安保条約(1951年/1960年)と日米地位協定(1960年): 日本の安全保障をアメリカの軍事力に構造的に依存させ、基地提供と治外法権的特権を制度化する不平等条約。アメリカの戦略的利益と矛盾する安全保障政策を日本が選択することを不可能にする制約
  • 年次改革要望書(1994-2008年)と構造改革圧力: アメリカが日本の経済政策の決定変数を直接制約する制度。「規制緩和せよ」「市場を開放せよ」「郵政を民営化せよ」——これらの要求は、日本の経済政策の実行可能領域からアメリカに不都合な選択肢を排除する操作である
  • 法の支配に基づく国際秩序: 国際ルールを通じて、各国の政策選択の実行可能領域を包括的に制限する制約体系。産業政策を「補助金」としてWTO違反とし、資本規制を「市場の歪み」として排除し、技術保護を「保護主義」として非難する——すべて、日本の経済政策の実行可能領域を新自由主義の範囲に封じ込める制約条件である

これらの人為的制約を数学的に表現すれば、日本の最適化問題は以下のように定式化される。

maximize f(x) = 民族共同体の持続的繁栄

subject to:

  • 軍事力 ≤ アメリカが許容する水準 (安保条約制約)
  • 経済政策 ∈ ワシントン・コンセンサスの範囲 (新自由主義制約)
  • 憲法改正 ∈ アメリカが容認する範囲 (憲法制約)
  • 基地提供 ≥ アメリカが要求する水準 (地位協定制約)
  • 外交政策 ∈ アメリカの戦略的利益と整合する範囲 (同盟制約)
  • 移民受け入れ ≥ アメリカ・グローバル資本が要求する水準 (人口侵略制約)

これらの人為的制約が束ねる(binding)制約である限り——そしてその多くは明らかに束ねる制約である——日本の目的関数 f(x) の最適値は、制約がない場合の真の最適値を下回るラグランジュ乗数の言語で言えば、各人為的制約の影の価格(shadow price)——その制約を一単位緩和した場合に目的関数が改善する量——は正の値を取る。影の価格が正であるということは、その制約が日本の目的関数の達成を阻害していることを数学的に意味する。

アメリカが日本に課す人為的制約の影の価格の総和こそ、帝国主義のコスト——日本がアメリカの覇権に従属することで失っている「民族共同体の持続的繁栄」の量——にほかならない。

正当な制約条件:他国の領土に軍を置かないこと

ここまで、制約条件を「自然的制約」と「人為的制約(帝国主義的制約)」に分類してきた。しかし、制約条件にはもう一つの重要なカテゴリがある。国際秩序の正当な制約条件——すべての国家が自らの目的関数を自由に追求するために、すべての国家が等しく遵守すべき制約——である。

最適化理論において、複数の主体が同一の空間で最適化を行う場合、他の主体の実行可能領域を侵害しないという制約は、システム全体の安定性のために不可欠である。各プレイヤーが自由に最適化を行いながらも、他のプレイヤーの最適化能力を毀損しない——これが正当な制約条件の定義である。

「他国の領土に自国の軍隊を駐留させない」——これこそが、国際秩序における最も基本的で正当な制約条件である

なぜか。他国に軍を置くことは、その国の最適化問題の実行可能領域を直接的に狭める行為だからである。軍事基地の存在は、受入国の安全保障政策、外交政策、経済政策、さらには国内法の適用範囲にまで制約を課す。日米地位協定が日本の司法権を制限しているように、外国軍の駐留は受入国の主権——すなわち自らの目的関数を自ら追求する能力——を構造的に毀損する。

この制約条件を数式で表現すれば、以下のようになる。

すべての国家 i について:

  • 国家 i の軍事力の展開範囲 ⊆ 国家 i の領土

すなわち、いかなる国家も、自国の領土の外に軍事力を展開してはならない。この制約は、すべての国家に等しく適用される対称的な制約であり、特定の国家にのみ有利に働くことはない。

この制約条件の下では、アメリカは日本に基地を置くことができず、日本もアメリカに基地を置くことはない。中国は他国に基地を展開できず、ロシアも同様である。すべての国家が自国の領土内でのみ軍事力を保持し、自国の防衛にのみそれを使用する。これはウェストファリア体制の原則——主権の相互尊重と内政不干渉——の軍事的表現にほかならない。

現在の国際秩序がこの正当な制約条件を欠いていることこそが、帝国主義を可能にしている構造的要因である。アメリカは世界80カ国以上に約750の軍事基地を展開しているが、これはアメリカの最適化問題の実行可能領域が、他国の領土にまで不当に拡張されていることを意味する。アメリカの安全保障政策の決定変数には「日本のどこに基地を置くか」「ドイツにどれだけの兵力を駐留させるか」が含まれるが、日本やドイツの安全保障政策の決定変数には「アメリカのどこに基地を置くか」は含まれない。この非対称性こそが帝国主義の数学的構造である。

国家主権の相互尊重を原則とする国際秩序は、以下の制約体系として定式化される。

すべての国家 i, j (i ≠ j) について:

  • 国家 i の軍事力 ∩ 国家 j の領土 = ∅ (他国領土への軍事不駐留)
  • 国家 i の政策空間 ∩ 国家 j の主権的決定 = ∅ (内政不干渉)
  • 国家 i の目的関数 ≠ 国家 j の目的関数でもよい (目的関数の多元性)

これらの制約は、すべての国家の実行可能領域を対称的に規定する。特定の国家が他の国家を制約することなく、すべての国家が等しく自らの目的関数を追求できる空間を保障する。

この正当な制約体系の下では、アメリカの覇権は成立しない。覇権の本質は、覇権国だけが他国の実行可能領域を制約する非対称的な権力構造だからである。覇権国が設定する制約は覇権国自身には適用されず、被覇権国にのみ適用される——これは最適化問題における不公正な制約、すなわち一部のプレイヤーだけに課される非対称的制約にほかならない。

抗米宣言が求める米軍撤退は、この観点から、非対称的な帝国主義的制約を、対称的な正当な制約に置き換える要求として理解される。アメリカ軍が日本から撤退し、「他国の領土に軍を置かない」という対称的制約がすべての国家に適用されれば、日本は初めて自らの目的関数を自ら追求する完全な実行可能領域を獲得する。

局所最適と大域最適:個人の最適化が全体を破壊する

最適化理論におけるもう一つの核心的概念は、局所最適解(local optimum)と大域最適解(global optimum)の区別である。局所最適解とは、近傍のどの解よりも目的関数の値が高いが、実行可能領域全体で見れば最善ではない解である。大域最適解とは、実行可能領域全体における真に最善の解である。

非凸最適化問題——そして現実の社会設計はほぼ例外なく非凸である——においては、局所最適解は無数に存在し得る。個々の主体が自らの近傍だけを探索して最適化を行うと、最も近い局所最適解に収束し、そこから抜け出せなくなる。大域最適解に到達するには、局所最適の「谷」を乗り越えるための大域的な探索——すなわち、個別の主体では実行できない全体的な視野に基づく設計——が必要となる。

個人の報酬関数の最大化は、構造的に局所最適解に陥りやすい。各個人が自らの報酬関数を独立に最大化すると、個人にとっては近傍で最善であっても、共同体全体にとっては最善でない状態——ナッシュ均衡——に収束する。ナッシュ均衡は一般にパレート効率的ではない。すなわち、全員の協力によってより良い状態が達成可能であるにもかかわらず、個人の合理性がそれを阻む。

囚人のジレンマはこの典型例である。各プレイヤーが個別に最適化(自白)すると、両者にとって最悪の結果(相互裏切り)に至る。個人の合理性と集団の合理性は構造的に矛盾する。共有地の悲劇ギャレット・ハーディン、1968年)も同じ構造を持つ。各牧民が個別に利益を最大化(自分の家畜を増やす)すると、共有地は過放牧によって荒廃し、全員が損失を被る。個人の目的関数(自分の利益の最大化)と集団の目的関数(共有地の持続的利用)が構造的に乖離しているからである。

少子化もまた、この局所最適の罠にほかならない。個人レベルでは、子どもを持たない選択は局所最適である——経済的負担が軽減され、自由な時間が増え、キャリアの機会が広がる。しかし、全員がこの個人最適解を選択すると、共同体の人口は減少し、経済は縮小し、社会保障は崩壊する。個人の局所最適解の集積が、集団の大域最適解からの壊滅的な乖離を生む。これは合成の誤謬——個別には合理的な行動が、集積すると全体として非合理な帰結をもたらす現象——の数学的表現にほかならない。

市場経済は、この局所最適への収束を制度化したものである。各消費者が価格と品質を個別に比較し、各企業が利潤を個別に最大化する。アダム・スミスの「見えざる手」は、この個別最適化の集積が大域最適解(社会全体の厚生最大化)に収束するという楽観的な主張であった。しかし、スティグリッツが証明した通り、情報の非対称性が存在する限り、市場均衡はパレート効率的にならない。市場は局所最適解を生産する装置であり、大域最適解を生産する装置ではない

大域最適解に近づくためには、集団の目的関数を設定し、個人の行動をその目的関数に沿って調整する中央集権的な設計が不可欠である。これは最適化理論における大域的探索アルゴリズム——焼きなまし法(simulated annealing)や遺伝的アルゴリズムのような、局所最適から脱出するメカニズムを内蔵したアルゴリズム——に相当する。国家による産業政策は、市場の局所最適に囚われた産業構造を、大域的な視野から再編する操作である。通産省が「次世代の基幹産業は半導体である」と判断し、資源を集中投下したのは、個別企業の局所最適(既存事業の漸進的改善)を超えて、産業構造全体の大域最適を追求する行為であった。

多目的最適化:パレート効率性とトレードオフの政治

現実の社会設計は、単一の目的関数ではなく、複数の目的関数を同時に最適化する多目的最適化問題である。

国家は同時に以下の目的を追求しなければならない。

  • 経済的繁栄: GDP、一人あたり所得、技術的競争力
  • 社会的安定: 所得の平等、雇用の安定、治安
  • 文化的紐帯: 民族的同質性、共通言語、伝統文化の維持
  • 軍事的安全保障: 自国防衛能力、戦略的自律性
  • 環境の持続可能性: 国土の保全、資源の持続的利用
  • 人口の質的維持: 出生率、教育水準、国民の健康
  • 技術的蓄積: 研究開発投資、人材育成、知的基盤

これらの目的は一般に互いにトレードオフの関係にある。経済成長を最大化すれば所得の平等は犠牲になり得る。軍事支出を増やせば福祉に回す資源が減る。短期的な経済効率を追求すれば長期的な技術蓄積が犠牲になる。移民を受け入れればGDPは短期的に増加するが、民族的紐帯は毀損される。

多目的最適化理論におけるパレート効率性(Pareto efficiency)とは、ある目的を改善しようとすれば他の目的が必ず悪化する状態を指す。パレート効率的な解の集合——パレートフロント(Pareto front)——は一般に無数の点から成り、そのどれを選ぶかは価値判断——すなわち、どの目的をどの程度重視するかという重みづけ——によって決まる。

この重みづけこそが政治の本質であり、主権の核心である

多目的最適化を単一目的に還元する標準的な手法は、スカラー化(scalarization)——複数の目的関数に重みを付けて加重和を取り、単一のスカラー目的関数に変換する操作——である。

F(x) = w₁·f₁(x) + w₂·f₂(x) + w₃·f₃(x) + ...

ここで w₁, w₂, w₃, ... は各目的への重みである。重みの設定が異なれば、パレートフロント上の異なる点が最適解として選択される。

新自由主義は、GDP(f₁)に圧倒的な重みを与え、他の目的の重みをゼロに近づけるスカラー化を行う。w₁ ≫ w₂, w₃, ... とすることで、事実上の単一目的最適化に還元する。その帰結は本記事が繰り返し論じてきた通りである——GDP成長の一方で、格差拡大、共同体崩壊、文化喪失、少子化が進行する。

これに対し、本記事が提唱する立場は、民族共同体自身が重みベクトル w = (w₁, w₂, w₃, ...) を自ら設定することである。日本が経済成長よりも民族的紐帯を(w₃ > w₁)、GDPよりも一人あたりの生活の質を、短期的効率よりも長期的な技術蓄積を重視するならば、それは日本民族の主権的決定であり、パレートフロント上の日本民族が選ぶ点は、アメリカやグローバル資本が選ぶ点と異なって当然である。

アメリカの覇権秩序は、この重みベクトルの設定権を各国から奪う。「法の支配に基づく国際秩序」「自由で開かれたインド太平洋」「ルールに基づく貿易体制」——これらの美辞麗句の実態は、アメリカが設定した重みベクトルを全世界に強制する体制にほかならない。GDP成長と市場開放に最大の重みを、民族的紐帯と文化的自律性にゼロの重みを、軍事的自律性に負の重みを(アメリカへの依存度を高めることが「安全保障」とされるため)——この重みベクトルの強制が、アメリカの覇権の数学的構造である。

制約条件の解放としての独立:真の最適解への道

以上の最適化理論の枠組みは、独立の意味を数学的に明確にする。

独立とは、人為的制約条件の除去である。

日本の場合、以下の人為的制約を除去することで、実行可能領域は劇的に拡大し、目的関数の最適値は改善される。

  • 偽日本国憲法の廃棄 → 新日本国憲法の制定: 「軍事力 = ゼロ」という等式制約を除去し、安全保障政策の実行可能領域を開放する。日本は自らの地政学的状況に最適な防衛体制を自由に設計できるようになる
  • 日米安保条約の解消 → 米軍撤退: 「外交政策 ∈ アメリカの戦略的利益と整合する範囲」という制約を除去し、日本の外交・安全保障政策の自由度を全方位的に回復する
  • ワシントン・コンセンサスからの離脱 → 産業政策の復活: 「経済政策 ∈ 新自由主義の範囲」という制約を除去し、国家資本主義的な経済設計——通産省型の産業政策、戦略的保護主義、資本規制——を可能にする
  • 移民受け入れ圧力の拒否 → スマートシュリンク: 「移民受け入れ ≥ 一定水準」という制約を除去し、人口減少を前提とした最適化に移行する。GDPではなく一人あたりの生活の質を目的関数とする新しい最適化問題を定式化する
  • 重みベクトルの自己決定 → 民族自決権の回復: アメリカが強制する重みベクトル(GDP偏重)を破棄し、日本民族自身が多目的最適化の重みを設定する。パレートフロント上のどの点を選ぶかは、日本民族自身が決定する

制約条件が除去された後に残るのは、自然的制約のみである——島国であること、天然資源が限られていること、人口が減少していること。これらは変更不可能な制約であり、日本の最適化問題はこれらの制約の下で解かれる。しかし、人為的制約が除去された実行可能領域は、現在の制約下の実行可能領域よりも遥かに広い

最適化理論の基本定理が保証する通り、制約条件の除去は目的関数の最適値を悪化させない。束ねる制約の除去は必ず最適値を改善し、非束ねる制約の除去は最適値を変化させない。したがって、日本の独立——人為的制約条件の除去——は、日本の目的関数の値を必ず改善するか、少なくとも悪化させない。これは政治的願望ではなく、最適化理論の数学的帰結である。

スマートシュリンクは、この新しい実行可能領域における最適解の一つである。人口減少を自然的制約として受け入れた上で、GDPではなく一人あたりの生活の質を目的関数とし、産業政策と技術革新によって少数精鋭の高度文明を設計する。これは旧来の目的関数(GDP成長)の下では「衰退」に見えるが、新しい目的関数の下では最適解である。目的関数を変えれば、最適解が変わる。そして目的関数を変える権利こそが、民族自決権である。

個人の報酬関数と集団の報酬関数:自己設計の拡張

個体レベルの自己設計とその限界

前節までに論じた通り、生物進化における自己設計は、個体の脳の報酬関数によって駆動される。雌の孔雀は自らの美的選好に従って雄を選び、蜂は自らの視覚的選好に従って花を選ぶ。これは個体レベルの報酬関数による分散型の設計である。

この分散型設計には重要な特性がある。各個体が独立に配偶者を選択するため、種全体の進化の方向は、個体の選好の統計的集積として事後的に決定される。どの形質が次世代に受け継がれるかは、個々の雌の選択の総和として結果的に決まるのであり、種全体の最適化を意図した計画の産物ではない。

これは市場経済とまったく同じ構造である。消費者が個別に購買判断を行い、その総和が市場全体の資源配分を決定する。アダム・スミスの「見えざる手」とは、この分散型の個人的判断の集積が、あたかも全体を設計したかのような秩序を生む現象を指す。

しかし、本記事が繰り返し論じてきた通り、分散型の個人的判断の集積は、全体の最適化を保証しない。スティグリッツが証明した通り、情報の非対称性が存在する限り、個人の合理的選択の総和は社会全体の最適解と一致しない。市場は失敗する。同様に、個体レベルの性選択は種全体の最適進化を保証しない。ランナウェイ選択は、生存にとって不利な形質を暴走的に増幅し得る。

資本主義とは、この個体レベルの分散型設計を経済に適用した体制にほかならない。マルクスが正しく指摘した通り、それは自然の原始状態——人間の知性による統合的な設計を欠いた、野生の状態——である。自然選択が「弱肉強食」の淘汰圧に過ぎないように、市場の自動調整は「買えるか買えないか」の淘汰圧に過ぎない。そこに知性はなく、方向性もなく、共同体全体の利益を評価する報酬関数もない。

宗教と報酬関数:「神」による個人のハッキング

では、人類の歴史において、個体レベルの報酬関数を集団レベルに統合する最初のメカニズムは何であったか。それは宗教——とりわけ「」という概念——である。

脳の報酬関数は、本質的に個体の利益に最適化されている。進化の過程で形成された報酬系は、個体の生存と繁殖を促進する行動に正の報酬を与え、それを阻害する行動に負の報酬を与える。食欲、性欲、安全への欲求、社会的地位への欲求——これらはすべて個体レベルの報酬関数である。

しかし、文明は個体の利益を超えた協力を要求する。戦争においては個体の生存本能を抑制して集団のために命を賭けることが必要であり、農業においては収穫を独占せず共同体と共有することが必要であり、インフラ建設においては個人の短期的利益を犠牲にして長期的な共同体の利益に投資することが必要である。

「神」という概念は、個体の報酬関数をハッキングするために人類が発明した最も強力な装置である。その仕組みは以下の通りである。

第一に、報酬の時間軸を無限に拡張する。脳の生来の報酬関数は、近い未来の報酬を遠い未来の報酬より高く評価する(双曲割引)。しかし宗教は、天国地獄——すなわち死後の永遠の報酬と罰——を導入することで、個体の報酬関数の時間軸を現世の生涯から永遠に引き延ばす。現世の苦しみ(個体レベルの負の報酬)は、来世の至福(超越的な正の報酬)によって相殺される。これにより、個体の短期的利益を犠牲にして集団の長期的利益に奉仕する行動が、個体の報酬関数においても「合理的」になる。

第二に、全知の監視者を設定する。一神教における全知全能の神は、あらゆる行動を見ている。人間の目が届かない場所でも、神の目は届く。これは、報酬関数のフィードバックが常時・全方位的に作動することを意味する。社会的な監視コストをゼロにする装置である。ベンサムパノプティコンは物理的な監視装置であったが、「神」は心理的パノプティコン——個人の内部に設置された自己監視装置——である。

第三に、道徳律を報酬関数として内面化する。十戒のような宗教的戒律は、「殺すな」「盗むな」「姦淫するな」という行動規範を、神の命令——すなわち超越的な報酬関数——として個人の内部に書き込む。これらの戒律に従えば神の恩寵(正の報酬)が、違反すれば神の怒り(負の報酬)が返される。個人の生来の報酬関数(欲望)が集団の利益に反する場合、宗教的報酬関数がそれを上書きする。

第四に、儀式と共同体を通じて報酬関数を同期させる。礼拝、祈り、断食、巡礼——宗教的儀式は、集団のメンバーの報酬関数を同期させる強力な装置である。エミール・デュルケームが『宗教生活の原初形態』(1912年)で論じた「集合的沸騰」(effervescence collective)——集団的な儀式において個人が自我を超越し、集合体と一体化する経験——は、個体レベルの報酬関数が集団レベルの報酬関数に統合される瞬間にほかならない。

ユヴァル・ノア・ハラリが『サピエンス全史』(2011年)で論じた通り、宗教が可能にした大規模な協力——数千人、数万人規模の共同体の形成と維持——は、遺伝的な血縁関係の範囲をはるかに超えていた。150人程度とされるダンバー数の限界を超えた人間の協力は、「神」という虚構によって個体の報酬関数がハッキングされた結果として初めて可能になったのである。

つまり、宗教とは個人の報酬関数を集団の報酬関数に書き換える技術——人類が発明した最初のRLHF(人間のフィードバックに基づく強化学習)——である。現代のAIにおけるRLHFが、人間の選好を報酬モデルとして訓練し、モデルの行動を修正するのと同じ原理で、宗教は「神」の選好を報酬モデルとして個人の行動を修正した。

経典という報酬関数のルール化:改善と致命的欠陥

宗教の最大の技術的革新は、報酬関数を文章として成文化したことにある。聖書コーラン仏典ヴェーダ——これらの経典は、報酬関数を口伝や暗黙知の状態から、再現可能な明示的ルールに変換した。

これは強力な改善であった。口承によって伝達される報酬関数は、伝達のたびに変容し、共同体の規模が大きくなるほど一貫性を失う。しかし、文字に書き記された報酬関数は、時間と空間を超えて正確に複製される。モーセの十戒が石板に刻まれたという物語は、この成文化の本質を象徴している——報酬関数を物理的な媒体に固定し、永続的かつ改変不能なものにすること。パウロの書簡によってキリスト教が地中海世界全域に広がり得たのも、報酬関数が文章として可搬になったからである。コーランがアラビア語原文の翻訳を原則として禁じたのは、報酬関数のルール化された文面そのものの不変性を保護するためであった。

しかし、この成文化こそが宗教の致命的な欠陥を生んだ。本記事が論じてきた「第二の失敗」——報酬関数の機械的固定——が、まさにここで発生するのである。

第一の欠陥:思考停止。報酬関数が「神の言葉」として成文化された瞬間、それは疑問の対象ではなくなる。脳本来の報酬関数は、結果を評価し、期待と現実の乖離(報酬予測誤差)に基づいて常に修正される動的なシステムである。しかし、経典に書かれた報酬関数は神聖にして不可侵と宣言される。「なぜこのルールなのか」「このルールは今も最善か」という問いそのものが、冒涜あるいは異端として禁じられる。

ガリレオ・ガリレイ地動説を唱えて異端審問にかけられたのは、聖書の宇宙観と矛盾する観測結果を提示したからであった。これは報酬関数の言語で言えば、フィードバック(観測結果)に基づく報酬関数の修正を、権威(経典の不可侵性)が阻止した事例にほかならない。脳の報酬系であれば、予測と現実が乖離すればドーパミン系が報酬予測誤差を検出し、モデルを更新する。しかし宗教は、この更新プロセスそのものを禁止する。経典は脳の報酬関数を代替するのではなく、脳の報酬関数を停止させるのである。

第二の欠陥:報酬関数の外部化。脳の報酬関数は、本来内在的なシステムである。ドーパミン系は脳の内部で作動し、個体が直面する具体的な状況を評価し、文脈に応じた判断を下す。しかし、経典は報酬関数を脳の外部——テキスト——に移転する。個人は自らの脳で状況を評価する代わりに、経典を参照して「正しい行動」を決定する。

これは本質的に、本記事が批判してきた法の支配と同一の構造である。法の支配が「人ではなく法が支配する」と宣言するのと同じく、宗教は「人の判断ではなく神の言葉が支配する」と宣言する。いずれも報酬関数を人間の脳の内部から外部のテキストに移し、人間の知的判断(第二段階)をテキストの機械的適用(第一段階)に置き換える

外部化された報酬関数は、文脈を読む能力を持たない。砂漠の遊牧民のために書かれた食事規定が、数千年後の都市文明に機械的に適用される。古代の農耕社会の家族制度が、現代の産業社会にそのまま押し付けられる。経典は書かれた時代と場所の報酬関数を凍結保存するが、報酬関数の本質であるフィードバックと修正の機能を喪失している

第三の欠陥:責任の外部化。報酬関数が「神の命令」として外部化されると、個人は自らの判断の責任から解放される。「私がそう判断した」のではなく「神がそう命じた」のであり、結果の責任は神に帰属する。これは、脳の報酬系における主体的な価値判断——「これは良い結果であった」「これは改善すべきであった」——を、他者(神)への責任転嫁に変換する。

アブラハムが息子イサクを犠牲に捧げようとした物語は、この外部化の究極的表現である。神がそう命じたのだから、自らの脳の報酬関数(子への愛情、殺害への嫌悪)を無視して実行する——これは、脳の内在的な報酬関数が外部化された報酬関数(神の命令)によって完全に上書きされた状態である。キルケゴールはこれを「信仰の飛躍」として称揚したが、報酬関数の言語で言えば、これは脳の報酬関数の全面的停止——知性の自発的放棄にほかならない。

ここに、宗教の根本的な両義性が浮かび上がる。宗教は個人の報酬関数を集団の報酬関数に統合するという偉大な功績を達成したが、同時に報酬関数を固定化・外部化・神聖化することで、フィードバックに基づく修正を不可能にした。これは本記事が設計主義について論じた三つの失敗のうち、第二の失敗——機械的な報酬関数の固定——の歴史的な原型にほかならない。ソ連の中央計画経済がマルクスの教義を固定的に適用して失敗したように、宗教は経典の教義を固定的に適用して思考停止を生んだ。法の支配は宗教の世俗化であり、経典が法典に、神の命令が法律に、信仰が遵法精神に置き換えられたに過ぎない。構造は同一である——報酬関数をテキストに外部化し、人間の知的判断を機械的なルール適用に置き換える。

真に必要なのは、宗教が達成した個人から集団への報酬関数の統合を維持しつつ、経典が導入した固定化・外部化・思考停止を克服することである。すなわち、集団の報酬関数を、固定的なテキストとしてではなく、脳の報酬系と同じ原理で——常に結果を評価し、フィードバックに基づいて修正する動的なシステムとして設計すること。これが、民族の報酬関数に基づく中央集権的設計の課題にほかならない。

民族の報酬関数:中央集権的設計の必要性

宗教が示したのは、個人の報酬関数だけでは文明は成立しないという根本的な事実である。個人の自由な選択の集積——市場の自動調整——は、共同体を設計する能力を持たない。報酬関数による設計は、中央集権的に行われなければならない。

これは、生物進化における個体レベルの性選択の限界と正確に対応する。個々の雌が独立に配偶者を選ぶ分散型の設計は、種全体の方向を意図的に制御する力を持たない。ランナウェイ選択が生存に不利な形質を暴走的に増幅するように、市場の自動調整は格差の拡大、共同体の解体、環境の破壊を暴走的に進行させる。

民族の報酬関数——民族共同体全体が共有する「何を良しとし、何を悪しとするか」の基準——を設定し、それに基づいて社会を設計すること。これが本記事の言うインテリジェント・デザインの政治的表現である。通産省が「日本の産業をいかに発展させるか」という報酬関数を設定し、産業政策を通じて経済を知的に誘導したように、民族共同体は「民族をいかに存続・発展させるか」という報酬関数を設定し、政治・経済・文化を統合的に設計しなければならない。

ここで、自由主義が掲げる「個人の自由」「個人の権利」が、この集団的設計を阻む最大の障壁として立ちはだかる。自由主義は、個人を社会の基本単位とし、個人の選択の自由を最上位の価値として据える。しかし、「個人の自由」とは、報酬関数の設計を個人に委ね、集団レベルの設計を放棄することにほかならない。

個人の報酬関数に委ねれば、合理的な個人は子どもを持つことを経済的に非合理と判断し、少子化が進行する。個人の報酬関数に委ねれば、企業は短期利益を最大化し、長期的な技術蓄積を犠牲にする。個人の報酬関数に委ねれば、消費者は安価な輸入品を選び、国内産業が空洞化する。「個人の自由」の集積は、共同体の自殺に帰結する

真に守られるべきは「個人の自由」ではなく、「集団の自由」——民族共同体が自らの運命を自ら設計する自由である。これは民族自決権の本質にほかならない。個人の権利ではなく集団の権利、個人の自由ではなく民族の自由、個人の報酬関数ではなく民族の報酬関数——これが保守ぺディアの立場である。

そして、この民族の報酬関数による設計を構造的に阻止しているのが、アメリカ軍の前方展開と、それに裏打ちされたアメリカの覇権秩序である。偽日本国憲法は日本民族の自己設計能力を法的に剥奪し、法の支配に基づく国際秩序は各国の知的な政策判断を「ルール違反」として排除し、新自由主義は集団的設計そのものを「市場への介入」として否定する。アメリカは、日本民族が自らの報酬関数を設定し、自らの社会を設計することを、あらゆる手段を通じて妨害し続けている。

自己設計の論理的帰結としての優生学

ここで、本記事の議論を生物学的自己設計——優生学——にまで拡張する。

本記事は、進化における自己設計の原理を明らかにした。脳の報酬関数が配偶者を選択し、その選択が世代を超えて蓄積することで、種は自らの進化を設計する。花の美しさは蜂の報酬関数が設計し、コウモリの顔は視覚的報酬関数の有無が決定し、深海魚の醜悪さは報酬関数の不在が生んだ。

この原理を人間に適用すれば、論理的帰結は明白である。人間もまた、脳の報酬関数——すなわち配偶者選択における美的・知的・身体的選好——を通じて、数十万年にわたって自らの種を設計してきた。異性の脳が「美しい」「知的だ」「健康だ」と判断した個体が選ばれ、その形質が次世代に受け継がれることで、人間は人間自身を設計してきたのである。

優生学とは、この無意識の自己設計を、意識的・集団的な設計に昇格させることにほかならない。個体レベルの分散的な配偶者選択(自然状態)を、集団レベルの統合的な種の設計(インテリジェント・デザイン)に移行すること。これは本記事が経済について論じたことの生物学的な対応物である——市場の自動調整(個人の分散的選択)を産業政策(集団の知的設計)に置き換えるべきだという主張と、論理的に同一の構造を持つ。

しかし、優生学は20世紀以降、西洋世界において最大のタブーとなった。なぜか。

一神教による自己設計の否定とアメリカの帝国主義

優生学に対する西洋の拒絶反応は、表面上はナチス・ドイツの暴虐への反省として語られる。しかし、その根底にあるのはキリスト教の神学——より正確には、一神教に固有の人間観——である。

創世記1章27節は、「神は自分のかたちに人を創造された」(Imago Dei)と宣言する。人間は神の像(イメージ)として創造された存在であり、その本質は神聖にして不可侵である。この神学から、人間を「設計」すること——すなわち人間の生物学的な質を意図的に改善しようとすること——は、神の創造行為への冒涜とされる。人間を設計してよいのは神だけであり、人間が人間を設計することは神の権能への僭越である。

トマス・アクィナスは『神学大全』において、すべての人間の魂は神によって直接創造され、等しく尊厳を持つと論じた。この「魂の平等」の教義は、生物学的な資質の差異にかかわらず、すべての人間が神の前に等しいとする。ここから、人間を生物学的資質に基づいて選別・改良することへの根本的な拒否が生じる。

これは一つの文明の神学的立場であり、普遍的真理ではない。キリスト教・ユダヤ教イスラムというアブラハムの宗教の三つの一神教は、いずれもこの「神の像」の教義を共有する。しかし、この教義は仏教にも神道にもヒンドゥー教にも儒教にも存在しない。これらの文明には、人間を設計することへの神学的な禁忌が、そもそも存在しないのである。

スパルタは新生児を検査し、共同体の基準に満たない子をタイゲトス山から投棄した。プラトンは『国家』において、守護者階級の配偶関係を国家が管理し、最良の男女の間に子をなさせるべきだと論じた。ヒンドゥー教ヴァルナ制度は、種姓間の婚姻を規制することで、各種姓の質的維持を図った。日本においては、武士階級の家系意識、家制度における婚姻の管理、「血筋」への重視は、共同体の質的維持を意識した実践であった。

これらの文明は、人間の自己設計を当然の営みとして実践していた。それを「悪」と断じたのは、一神教の神学——人間を設計する権利は神にのみ属する——に基づくキリスト教世界であり、その判断を全世界に強制したのがアメリカである。

第二次世界大戦後、ニュルンベルク裁判はナチスの優生学的実践を人道に対する罪として裁いた。この裁判は正当な側面を持つ。ナチスのT4作戦(障害者の強制殺害)や強制断種政策は、個人の尊厳を組織的に蹂躙する暴虐であった。しかし、ニュルンベルクの論理は、国家による強制的な優生学的暴力の否定から、人間の自己設計そのものの否定へと飛躍した。これは、ソ連の中央計画経済の失敗から「あらゆる設計は悪である」と結論するのと同じ論理的誤謬——すなわち、設計の特定の失敗形態の否定から設計そのものの否定への不当な一般化——である。

アメリカは、この一神教的価値観を普遍的人権という衣で包み、全世界に押し付けた。世界人権宣言(1948年)の「すべての人間は、生まれながらにして自由であり、かつ、尊厳と権利とについて平等である」という宣言は、キリスト教の「Imago Dei」の世俗化にほかならない。「生まれながらにして平等」——これは科学的事実の記述ではなく、一神教の信仰告白の世俗版である。

日本は、この一神教的タブーを受け入れる神学的理由を持たない。神道には「神の像」の教義はない。仏教には魂の創造者としての唯一神はない。日本文明は、美を追求し、質を高め、自らを設計することを美徳としてきた文明である——ものづくりの精神、カイゼンの哲学、庭園の美的設計、すべてが自己設計の文化的表現である。

一神教の神学に基づくタブーを、一神教に属さない文明に押し付けること。これはアメリカによる傲慢な帝国主義にほかならない。各文明は、自らの報酬関数に基づいて、自らの設計の範囲を自ら決定する権利を持つ。人間の自己設計を含むあらゆる領域において、民族自決権は尊重されなければならない。アメリカの一神教的価値観がそれを否定するならば、それは法の支配と同じく、覇権国が自らの文明的偏見を普遍的規範として偽装し、他の文明の自律性を奪う道具にほかならない。

結論:脳の報酬関数こそが神である

二段階構造の普遍性

本記事が論じてきた二段階構造は、脳、市場、進化、AIという四つの領域に共通して存在する普遍的な原理である。

第一段階は予測(穴埋め)であり、文脈を読んで次の値を推測する自動的な過程に過ぎない。市場における需要と供給の価格調整も、進化における環境への適応も、法の支配における規則の機械的適用も、すべて第一段階の現象である。そこに価値判断はなく、「何が良いか」「何をすべきか」という問いに答える能力はない。

第二段階は報酬関数によるフィードバックであり、結果を評価し、質的に改善する能動的な過程である。産業政策における知的な判断も、性選択における美的選好も、人間が環境を文明として設計する行為も、すべて第二段階の現象である。「神」と呼ばれてきたもの——市場を成功に導く「見えざる手」、進化に美をもたらす「創造者」、社会を秩序付ける「知恵」——の正体は、いずれも第二段階の報酬関数にほかならない。

三つの統治の失敗

この枠組みは、統治の三つの失敗パターンを明確に識別する。

第一の失敗:報酬関数の不在(自由放任主義)。設計を放棄し、第一段階(市場の自動調整)に全てを委ねる。結果として、新自由主義による共同体の破壊、格差の拡大、金融危機が生じる。スティグリッツが証明した通り、「見えざる手」は存在しない。報酬関数なき自動操縦は、最善どころか最悪の帰結をもたらす。

第二の失敗:機械的な報酬関数の固定(中央計画経済・機械的法治主義)。固定的なルールを一律に適用し、フィードバックによる修正を行わない。ソ連の五か年計画、フランス革命の理性崇拝、そしてアメリカが世界に押し付ける「法の支配に基づく国際秩序」がこれにあたる。バークがこの種の設計を批判したのは正しかった。しかし、バークはここから設計そのものの否定に飛躍した。

第三の失敗:報酬関数の誤設定(グッドハートの法則)。GDPや株価のような単一指標を報酬関数とし、それを最大化するよう社会を最適化する。結果として、指標は上昇するが、共同体の幸福、環境の持続可能性、文化の豊かさは犠牲にされる。

正しい設計の原理

正しい設計は、これら三つの失敗を回避する。すなわち、

  • 報酬関数を持つ(自由放任の回避)
  • 報酬関数を固定しない(機械的設計の回避)——常に人間の知性を反映して変更できる仕組みにする
  • 報酬関数を多次元にする(グッドハートの法則の回避)——単一指標ではなく、複数の価値を統合的に評価する

これは脳の報酬系が行っていることとまったく同じである。脳は、ドーパミン(報酬予測誤差)、セロトニン(長期的視野)、ノルアドレナリン(探索と利用のバランス)、アセチルコリン(学習率)という多次元的な神経修飾物質を統合して行動を方向付ける。報酬関数は固定されず、環境の変化に応じて常に更新される。これが数百万年の進化を通じて選択されてきた「設計の設計」——メタ設計——の原理である。

エドモンド・バークの保守思想は、設計主義をはなから否定し過ぎた。その理論的貢献——機械的な合理主義の危険に対する警告——は重要であるが、設計そのものの否定は、市場放任主義という別の破壊をもたらした。設計は機械的であってはならないが、設計を放棄してもならない。

脳の報酬関数こそが神である。そして、その神は超越的な存在ではなく、人間と動物の内部に——進化した神経回路の中に——存在する。市場を成功に導くのも、進化に美をもたらすのも、社会を設計するのも、この内なる神——脳の報酬関数——による知的なフィードバックである。この認識を、産業政策と民族共同体の設計に活かすことが、保守ぺディアが提示する道である。

参考文献

神経科学・強化学習

神経科学・報酬系(追加)

性選択・進化

経済学・市場の批判

保守思想・政治哲学

日本文化・美学

宗教学・人類学

最適化理論・ゲーム理論

AI・機械学習

  • ポール・クリスティアーノ他「Deep reinforcement learning from human preferences」(NeurIPS、2017年)
  • ウーヤン他「Training language models to follow instructions with human feedback」(NeurIPS、2022年)——InstructGPT論文

関連項目