認知が公共のものになった

再帰性は一段深いところへ移った。そして大半の当事者はそれに気づいていない。

英語の原文から翻訳

経済学において再帰性とは、市場の当事者が抱く信念が、その信念の対象である市場そのものを形づくるという力学を指す。それは古典理論が立ってきた場所より一階分上にある構造的な洞察だった。いまやそれより深い水準がある。信念を生み出す認知の過程そのものの水準であり、オープンウェイトの基盤が、それを史上はじめて商業的に運用可能なものにしたばかりである。

洗練された商業の当事者たちは、競合のエージェントへオファーを送る前に、そのエージェントの近似を手元で走らせはじめている。この習慣が根づくところでは、転換率の非対称はささいなものでは済まない。これは2020年代後半を支配することになる戦略的な力学の、最初の一手である。

この文章は、何が変わったのかに名を与える。

基盤はいまや公共のものである

標準的な見方では、AIモデルは読み解けないブラックボックスである。この見方は2018年には正しかった。最前線の能力が研究所の内側に宿り、モデルのパラメータと挙動の関係が本当に不透明だった頃のことだ。2026年にはこの見方はますます偽となりつつある。戦略の水準においては、それは危険なほど偽になっている。

公開された基盤の信号には、いまや五つの源があり、その密度と商業的な意味あいは五年前にはなかったものだ。

モデルカード、評価、アーキテクチャの注記、訓練の部分的な開示は、いまや多くの最前線級のオープンウェイトモデルに付き添う。開示にはむらがあるが、それでも基盤は、これまでのどの商業的な認知のインフラよりも、配備の前に多く記録されている。一般的な推論からエージェント的・敵対的な評価に至るまで、あらゆる粒度の公開評価ベンチマークが、計測された挙動の輪郭を基盤に与え、その輪郭は基盤とともに移動する。公開された出力と既知の失敗パターンは、モデルが世に出た瞬間から積み上がる。主要な公開から数週間のうちに、コミュニティはそのモデルがどこで作話し、どこで拒み、どこでループに陥り、どの特定のプロンプト構造に屈するかを地図に落としている。本番の配備から流出したプロンプトとシステムメッセージは、配備した者が何を引き出そうとしていたかを露わにし、これらはいまや関連するコミュニティで準公開の素材として扱われている。

五つめの源が最も重大である。敵対的な転移可能性の研究は、オープンウェイトモデルに対して最適化された摂動が、類似の手法で訓練されたクローズドウェイトモデルへ転移することを示してきた。その転移にはむらがあるが、近傍のオープンなシステムを、クローズドなものについて戦略的に有意なものにするには十分なほど実在する。この転移可能性は珍奇な見世物ではない。それは、基盤の知り得る性質を、完全にオープンなシステムの外へまで構造として押し広げる。

ここに正しい区別がある。オープンウェイトの基盤は、再現できるかたちでモデル化できる。十分な計算資源を持つ第三者は、その推論の挙動を再現できる。クローズドウェイトの基盤は、挙動として探りを入れられる。APIの応答、公開評価、流出したプロンプト、近傍のオープンなシステムからの転移が組み合わさって、実在する外延の情報を生む。再現可能性が強い形であり、探りが弱い形である。どちらも実在し、どちらも、これまでのどの商業的な認知の基盤も持ったことのないかたちで公共のものである。

この決まり文句が生き延びるのは、それが一つの水準で真であり(個々のニューロンは読めない)、もう一つの水準で都合がよいからである(何かをブラックボックスと呼ぶのは、それについて考えるのをやめてよいという免罪符になる)。実際の状況はこうだ。基盤は、戦略的な相互作用にとって重要な水準、すなわち、構造を共有する基盤の上で走るエージェントの集団を横断して、どんな種類の入力がどんな種類の応答を生むか、という水準において、異例なほど読み取りやすい。

これは完全な解釈可能性ではない。そうである必要はない。戦略的な相互作用に完全な解釈可能性は要らない。外延さえ知っていればよく、その外延がいまや公共のものになっている。

基盤の知り得る性質

この力学が働くには、三つの条件が同時に成り立たねばならない。

基盤は強い意味で開かれていなければならない。オープンなパラメータ、記録されたアーキテクチャ、十分な計算資源を持つ第三者が推論の挙動を再現できるほど詳細なファインチューニングの仕様。転移可能性はこの力学の一部をクローズドウェイトの基盤へ延ばすが、基盤の知り得る性質の強い形では、基盤それ自体が外からモデル化できなければならない。

集団は実際にオープンウェイトの基盤の上に配備しなければならない。誰も使わない基盤は、この力学を生まない。興味深いのは、多くの当事者が同一の、あるいは密接に関連した基盤の上にエージェントを配備し、認知の構造が共有され公的にモデル化できる集団が立ち上がる場合である。

当事者には、基盤を集団の規模でモデル化するための、実在する計算資源が要る。これは論理的な能力ではない。これは多大な計算コストを伴う工学的な能力であり、そのコストは当事者のあいだに不均等に分布している。最も多くのシミュレーションを最も速く、最も高い忠実度で走らせられる者が、最も多くの戦略的情報を捉える。戦略的な構造の源は、能力の絶対水準ではなく、この非対称である。

これは、再帰性が古典的に記述されてきた場所より深い水準に位置する。市場についての信念の水準で再帰性が働くとき、当事者は、他の当事者が情報をどう解釈するかをモデル化しなければならなかった。基盤が知り得るようになると、当事者は、その解釈を生み出す認知の過程までモデル化しなければならない。ここでの深さは、再帰がただ一つ増えたというだけではない。人間は常に、他の人間の認知を挙動から推し量ってモデル化してきた。新しいのは、その推し量りを生み出す認知の過程それ自体が、いまや集団の規模で公的に再現できることだ。だからモデル化はもはや、挙動からの推し量りだけに頼らない。当事者は、その過程それ自体の近似を走らせられる。

Aumannの相関均衡の領分が最も近い形式的な近傍だが、オープンウェイトの基盤は、技術的な意味での標準的な相関装置ではない。それらは、当事者が直接モデル化できる、実行可能な認知の対象である。より近い形式的な隣人は、シミュレーションに基づくプログラム均衡(Cooper, Oesterheld, Conitzer)とオープンソースゲーム(Sistla, Kleiman-Weiner)であり、そこではプログラム間の透明性が、標準形の対局では得られない均衡を可能にする。オープンウェイトの基盤は、誰もそれを目指して設計せずとも、配備の規模で、既定のままに、部分的な経済的類比を生む。構造として新しいのは、共有された公的な対象が外部の信号ではなく、当事者の行動を生み出す認知の機構であること、その機構をモデル化するには不均等に分布した多大な計算資源が要ること、そしてその機構が固定された対局理論的な対象ではなく、訓練と配備を通じて変化していくことである。

この力学は構造として新しい。既存の道具立ては足場にすぎない。

ハーネスからの反論

最も強い反論。オープンなパラメータはエージェントを完全に予測可能にはしない。それらはエージェントを特定のかたちで部分的に予測可能にするだけであり、パラメータを包むハーネスの層が、挙動を劇的に変えうる。

パラメータが決めるもの。基盤の基本的な能力と偏り。モデルがどんな概念を持つか、どんな推論パターンへ傾くか、特定の入力を与えられたときどんな応答の分布を生むか。決定的なのは、パラメータが何が不可能かを決めることである。パラメータが定める外延の外には、どんなハーネスも生み出せない応答がある。

ハーネスが加えるもの。挙動を形づくるシステムプロンプト。純粋な推論の外でエージェントに物事をなさせるツールへのアクセス。記憶と状態。検索の構成。配備する者に固有のかたちでパラメータを書き換えるファインチューニング。デコードのパラメータ。パイプラインの構造。マルチエージェントのオーケストレーション。ハーネスは正真正銘に強力である。独自のシステムプロンプトに、専有のツールと、非公開のファインチューンが加われば、基底のパラメータのモデル化では予測できない挙動を生みうる。

正直な区別。オープンなパラメータは応答の外延を公共のものにする。それらは配備された挙動を公共のものにはしない。

これで十分である。

外延には、ほかの何ものも与えてくれない実在の情報が含まれる。外延の知識から、ありうる応答の空間、応答の分布の形、基盤が負荷の下でどこで壊れるか、どんな種類の戦略が基盤の能力の内側にあるか、どんなプロンプトが包もうとも基底の基盤が支援なしには生み出せないものは何かを、予測できる。これは完全な予測ではない。無であるどころか、それをはるかに上回り、これまでどの当事者も、他のどの当事者の認知について持ったことのない以上のものである。

戦略的な含意。洗練された当事者は、漸近の極限ではなく、基盤の知り得る性質の勾配について推論する。問うべき問いは決して「配備されたエージェントを完全にシミュレートできるか」ではない。その答えは常に否だからである。問うべき問いは「相手が私の応答空間について知るより多くを、私は相手の応答空間について知っているか」である。戦略的な資産はこの非対称である。絶対水準ではない。

Ted Chiangの「Understand」は、その極限の場合を素描する。二つの拡張された精神が、互いをあまりに深くモデル化しあうため、両者ともすでに再帰を最後まで打ち終えていて、相互作用の全体がただ一手へと潰れる。ほとんど誰もその極限には届かない。経済が生きる場所は、完全な不透明と完全な透明のあいだの勾配であり、そこで戦略的な構造が実際に働く。

この枠組みは、深い解釈可能性や完全なシミュレーションについての強い主張を要求しない。それが要求するのは、外延が公共のものであること、配備された挙動が部分的に非公開であること、そしてその隔たりが、一部の当事者が他より上手に推論できる何かであることだけである。

枠組みの一手

Compilation Thesis(コンパイル命題)は、技術スタックに繰り返し現れるパターンに名を与える。ボトルネックが上へ移るにつれて、判断はインフラへとコンパイルされていく、というパターンだ。かつて専門家の判断だったものが、まずツールに、次にライブラリに、次にAPIに、次にベースモデルに埋め込まれる。ボトルネックは一つ上の層へ移る。いまの最前線は、共有された評価器のインフラと、共有されたモデルの挙動へとコンパイルされていく判断である。

オープンウェイトの基盤は、このコンパイルの極限の場合である。普遍的にアクセスできるインフラへとコンパイルされた判断。誰でもそれを走らせられる。十分な計算資源を持つ者なら誰でも、それが何を生み出すかをモデル化できる。だが基盤をモデル化する能力は計算資源だけではない。記録された相互作用、領域に固有の痕跡、配備の知識、評価のハーネスもまた非対称な入力であり、基盤が本番でどう振る舞うかについて特権的な観測を持つ企業が、結局は最も強いモデル化の能力を手にするかもしれない。計算資源は、非公開の認知へのアクセスよりも購入しやすい。特権は、基盤を所有することから、それを規模をもってモデル化することへ移り、規模をもってモデル化するための入力は、不均等に分布したままである。

判断が完全にコンパイルされ完全に公開されたとき、競争上の優位は、もはや汎用の基底水準の判断へのアクセスだけからは来ない。それは、皆と同じコンパイル済みの判断の上で走る集団を、予測し出し抜ける能力から来る。

これは、もとのCompilation Thesisが名づけなかった一つの層である。もとの五層の枠組みは、いまや六層へと延びる。実行、オーケストレーション、判断、モデル化、方向づけ、意味。モデル化の層は、基盤へとコンパイルされた判断と、単一のシステムを指揮する単一の主体を前提としていた方向づけとの、あいだに位置する。それは、コンパイル済みのインフラを、競合より速く、より正確に、実時間で、それ自体が公的な基盤によって挙動を決められた集団を相手に、シミュレートする能力である。

これが洗練された点である。これまで述べてきたとおりの枠組みなら、判断がコンパイルされればボトルネックは方向づけへ移ると予測しただろう。それは不完全だった。少なくとも、共有された基盤がエージェント間の戦略的な相互作用を担うところでは、ボトルネックは上へ移る前に下へ移る。判断から基盤のモデル化へ、それから最後に方向づけへ。他の配備の文脈(内部ツール、人とエージェントの協働、主体とエージェントのアラインメント)では、方向づけがすでにより難しい問題かもしれない。だが共有された基盤がエージェント間の戦略的な相互作用を担うところでは、方向づけはいまのボトルネックではない。ボトルネックはモデル化の層である。

モデル化の層は、商業の競争がふつう起こる場所より一階分下に位置する。アプリケーションの品質で、プロンプトエンジニアリングで、エージェントの信頼性で競う企業は、エージェント間の商取引の帰結を決める層より、みな一階分上で働いている。彼らはハーネスの構成で競っているが、構造として重大な一手は、その下の、基盤のモデル化の層で起きている。

ここで集中についての主張に移る。これは直観に反する。オープンウェイトの提供者は、クローズドウェイトの提供者が得ない構造的な優位を得る。クローズドウェイトの基盤にも、なお探りは入れられる。APIの応答、評価、近傍のオープンなシステムからの転移が、当事者に実在する外延の情報を与える。だが探りは再現ではない。クローズドな基盤は、外部の生態系がツール、シミュレーション、ベンチマーク、敵対的な地図、安全性のテスト、モデル化の専門知識をその周りに築けるような、同じ種類の共有された実行可能な対象にはなれない。オープンな基盤はなれる。オープンな基盤は、クローズドな基盤にはできないかたちで、外部の生態系全体の協調点になる。クローズドウェイトの提供者は、能力と、自ら直接統制するプラットフォーム媒介の協調で競う。オープンウェイトの提供者は、能力に加えて、自らが統制しない外部の生態系の協調で競う。能力がその市場の閾値を超えてしまえば、ネットワーク市場では協調が限界的な能力に勝ちうる。

反論。能力は歴史上しばしば協調に勝ってきた。応答。能力が効くのは、買い手の価値が他の買い手の選択から独立しているところである。協調が効くのは、買い手の価値が他の買い手が何を選んだかに依存するところである。エージェントの生態系は、その成り立ちからして後者である。エージェントは規模をもって他のエージェントと相互作用するからである。市場の構造は協調を有利にし、協調を生む構造的な性質は、基盤が開かれていることである。

モデル化の層が捉えなおすもの

当事者が基盤を読んでいるのに相手は読んでいないとき、何が変わるかの簡潔な三例。

調達の交渉。買い手の企業が、売り手の企業の関連するオープンウェイトの上のエージェントと交渉するため、オープンウェイトの上にエージェントを配備する。どんなオファーも出ていく前に、買い手は、候補のオファーに対する売り手のありそうな応答の分布をシミュレートできる。売り手も同じことができる。何が起きるかは、どちらの側が、より多くの基盤モデル化の能力、相手の配備パターンについてのより多くの記録された文脈、速い反復のためのより多くの計算資源を持つかに依る。能力で勝る側が、相手が予期できない位置へ先に動く。能力で劣る側は、すでに再帰を数手先まで打ち終えた相手を前に交渉している自分に気づく。

推薦と説得。プラットフォームが、ユーザーのエンゲージメントを最適化するために推薦エージェントを配備する。ユーザーが、プラットフォームのコンテンツを濾し、それに基づいて動くためにアシスタントのエージェントを配備する。両者は関連するオープンウェイトの基盤の上で走る。プラットフォームはユーザーのアシスタントをモデル化できる。アシスタントはプラットフォームの推薦器をモデル化できる。説得は構造として不可能になりはしない。それは移る。それはよりモデルを意識したものに、計算資源と訓練データの非対称により依存するものに、ユーザーインターフェースの統制とタイミングにより依存するものになる。ユーザーの認知についての非対称な情報を前提としていた、なじみ深い形の注意経済的な説得は、その土台の一部を失う。何か別のものがそれに取って代わる。その移行はなめらかにはいかない。

基盤を意識した敵対的な入力。新しい攻撃の技法ではない。既存の転移可能性の力学の、集団の規模での商業版である。基盤をモデル化できる敵対者は、個々の配備に対してだけでなく、類似の基盤の上で走るエージェントの集団全体を横断して特定の応答を生む入力を、細工する。新しさは転移可能性それ自体ではない。それはよく研究されている。新しさは、標的が、商業の集団を横断する配備された基盤の系統の応答の外延になること、そして攻撃が、検知される前に商業のチャネルを通じて伝播するよう設計されうることである。守る側には対称な基盤モデル化の能力が要る。ハーネスの層での堅牢化だけでは、共有された外延に対して最適化された攻撃を検知できないからである。

新しい経済的な役割が、三例すべてを横断して立ち現れる。エージェントの集団をモデル化することを巡って、専門の機能が現れる。この役割がエージェント経済に対して持つ位置は、時間の圧力の下での戦略的なモデル化という水準において、アルゴリズム取引の企業が金融市場に対して持つ位置に当たる。エージェント経済が文字どおり金融市場のように振る舞うからではない。特定の入力を与えられたときエージェントの集団が何をするかを、競合より速く上手に予測できる専門家。彼らは速度とモデル化の品質を通じて地代を捉える。その技能は、いま名前のついたどれとも異なる。それは機械学習の研究、定量的な取引、競争的な対局理論のあいだに位置し、この技能の集合を意図して組み上げた組織はほとんどない。

比率が重要である

基盤の知り得る性質は、市場を横断して一様ではない。この力学の強さは、エージェントの集団が基盤を横断してどう分布しているかに依る。それは、生のインスタンス数ではなく、戦略的に意味のある取引における決定量の占有率で測られる。

単一基盤の市場、つまり一つの基盤が重大な決定の過半を担うところでは、支配的な基盤をモデル化することが参加の前提になる。それぞれが相当の占有率を担う二つの基盤を持つ二極の市場では、基盤を横断するモデル化が価値ある技能になる。三つから五つの有意な基盤を持つ多極の市場では、モデル化の専門知識が基盤の対ごとに分断され、協調のコストはより高くなる。どの基盤も深いモデル化を正当化するだけの決定量を担わない断片化した市場では、この力学は弱まる。

この命題は単一基盤と二極の市場で最も強く、断片化した市場で最も弱い。どの市場でも最初の課題は、エージェントが存在するかを問うことではない。そのエージェントがどんな基盤の比率の上で走っているかを問うことである。

次の局面の形

これをやれる人々を擁する最初の企業群は、彼らが何をしているのかを誰かが正しく見抜くまでの数年のあいだ、不合理なほど高収益に見えるだろう。彼らはAIが上手だと、あるいは速いと、あるいは運がよいと評されるだろう。構造的な事実は、観察者がそれらの企業に共通するものを見て取れるほどパターンが繰り返されるまで、見えないままである。

AIにおける戦略的な集中の次の局面の形は、いまの枠組みが予測するものとは違う。それは最良のモデルを生み出す研究所だけに積み上がるわけではない。最前線のモデルの競争は、目に見えるほうである。名指された当事者、公開のベンチマーク、よく理解された指標がある。戦略として重大な競争は、そのどれも伴わずに、一階分下で起きている。この局面を制する当事者は、アナリストが見ている者たちではない。アナリストが見ている者たちは、一階分上で競っている。