人工的認知の進化

抽象化の五つの層

2026-01-30

大規模言語モデル(LLM)の産業導入は、抽象化の段階的な進化である。2022年から2024年までは第1層(基盤モデル)が支配し、そこでは生の知能そのものが製品だった。第2層(単一エージェント)は、ツール使用を通じた行動というパラダイムを持ち込んだ。今日、業界は第3層、オーケストレーションに深く根を下ろしており、課題は複数のエージェントをいかに協調させるかへと移っている。

しかしオーケストレーションは局所的な極大にすぎない。私たちは、見事で即時の論理を瞬発的に放てるが、長い時間にわたって一貫した思考を保てない一回性の専門家を築いてきた。やがて私たちは第4層、長期認知へと舵を切る。ステートレスなトークン生成から、状態を保ち持続するシステム2の思考プロセスへの転換であり、エンジニアの端から端までの長期認知を模したものだ。その先には第5層、組織的ワークフローがある。そこではこれらの認知主体が組織計画の織物に編み込まれ、確実なビジネス成果をもたらす。

私たちはやがて、ただモデルをつなぎ合わせる段階を越えて、認知と組織を設計する段階へと進んでいく。これが私が思い描いている設計図である。

第1層、基盤モデル

初期の段階(2022年から2024年)で、業界は進歩のただ一つの軸、すなわちスケールに焦点を当てていた。パラメータ戦争は、MMLUのような静的なベンチマークで最先端の性能を追うことで定義されていた。スケールが依然として決定的であることに変わりはないが、2026年の研究の最前線はその次元を広げている。私たちはもはや、このモデルはどれほど賢いか、とだけ問うているのではない。このモデルはシステムの中でどれほど効率よく推論できるか、を問うている。

**垂直的特化。**市場は、汎用モデル(安く、速く、ヒューリスティック)と、特定の業種、言語、モダリティに合わせて作り込まれたエンタープライズ級の推論エンジンとに分かれつつある。競争の堀は、業種ごとの多言語性とネイティブなマルチモダリティへと移っていく。

**パラメータの中のシステム2。**推論が純粋に外側のプロンプト操作とテキスト要約にすぎなかった時代を、私たちは抜け出しつつある。次世代のモデルは、システム2の能力をフォワードパスそのものへ直接内在化させ始めている。話す前に考えるために推論時の計算を割り当てられるモデル、つまりエージェント的ループをモデルのパラメータそのものに焼き込んだモデルが現れている。

基盤モデルは、AIオペレーティングシステムの特化したカーネルになりつつある。CPUが特化したコア(GPU、NPU)からなる複雑なエコシステムへと進化したのと同じように、第1層は、その上位の層を動かす特化した推論エンジンへと分化しつつある。

第2層、エージェントによる行動

第2層は、モデルが受動的なテキスト生成器であることをやめ、能動的なシステム構成要素になった転換点を画する。私たちは、モデルにSQLクエリを書けと求める段階から、それを実行するためにライブのデータベース接続を与える段階へと移った。これを推し進めたのがツール使用(関数呼び出し)の導入である。モデルを散文ではなく構造化された呼び出しを出力するようにファインチューニングすることで、私たちは事実上モデルにエージェンシーを与えた。エンジニアリングの現実は、プロンプトエンジニアリングから、確率的なモデルが現実世界とやり取りするために呼び出せる、明確で決定論的なツールを備えたAPI設計へと移った。

これらの接続が標準化されると、単一エージェントの有用性は一気に広がった。当初、あらゆる連携は手作りのつなぎコードだった。Model Context Protocol(MCP)のような標準が登場し、モデルがリソースを発見し利用する仕方が統一された。今や私たちは、リポジトリやSlackワークスペースやデータベースといったエンタープライズ環境まるごとを、標準化されたサーバーエンドポイントへと抽象化できる。これによって単一エージェントは、目新しさから、自らの文脈を取得し定められたサンドボックス内で自律的なループを実行できる、実用に耐える働き手へと変わった。

第3層、マルチエージェント・オーケストレーション

単一エージェントのパラダイム(第2層)は実行を実証したが、スケールにおいて行き詰まった。信頼性を設計し切るには、汎用のエージェントを特化したユニットへと分解しなければならない。私たちはデジタルの職人からデジタルの組立ラインへと移りつつある。これには新たなアーキテクチャの層、すなわちオーケストレーションが要る。

第2層では、私たちは単一の関数を設計した。第3層では、トポロジーを設計する。複雑さはモデルから、ハンドオフ、状態管理、ワークフロー設計へと移った。

イノベーションはタイミングの関数である。2023年末、私は、のちにGoogleのNotebookLMとなったものとトポロジー的に同一のマルチエージェント・ポッドキャストエンジンを作った。技術的には動いたが、商業的には成り立たなかった。2023年にGPT-4の呼び出しを四つつなぐということは、耐え難い遅延と脆いjsonのハンドオフを意味した。Googleが12か月後に同じ着想で成功したとき、それは一つの決定的な教訓を証明した。**オーケストレーション製品は、弱い土台を埋め合わせようとするとき失敗する。**それが成功するのは、土台にある知能(第1層)が、ユーティリティとして扱えるほど安く、速く、信頼できるものになったときだけだ。

今日、議論は、どのモデルか、からどうつなぐか、へと移った。

決定論的制御(ステートマシン)は、ワークフローを厳格な有向非巡回グラフ(DAG)として扱う。予測不可能性がバグである高リスクの領域(銀行業務、コーディング)で使われる(例:LangGraph)。
確率的創発(マルチエージェントシステム)は、ワークフローを専門家の社会的ネットワークとして扱う。エージェントはコンセンサスが形成されるまで対話する。解への道筋が未知である研究開発やディープリサーチの課題で使われる(例:AutoGen)。

第3層はタスク分解を解決するが、固い天井にぶつかる。すなわち時間的近視眼である。私たちは一回性の専門家を築いてしまった。RalphやDevinのような高度な長考ループでさえ、今のところ直列化された健忘に頼っている。それらは、ログファイルを書き、終了し、そのメモを読む新しいクローンを起動するという形で動く。知恵は外側に残り、テキストファイルに閉じ込められたままで、モデルにはない。これらのエージェントは反芻することも、無意識のうちに処理することも、進化することもできない。ただ文脈を再読み込みするだけだ。タスクを解くことからミッションを遂行することへ進むには、外在化したログを内在化した状態へと置き換えなければならない。これが第4層への登攀を必然のものとする。

第4層、長期認知

業界はステートレスな知能から状態を保つ認知へと舵を切りつつある。第4層は、エンジニアが何週間にもわたって思考の流れを保てる能力を、アーキテクチャとして再現したものだ。それはAIを、反応的なエンジン(システム1)から、抽象的な目標を持つ持続的な認知主体へと移す。

私たちは推論密度(第1層)と認知スパン(第4層)とを区別しなければならない。

第1層(モデル):難しい数学の問題を30秒で解ける。
第4層(アーキテクチャ):プロダクトのローンチを30日かけて成し遂げられる。最も賢い推論モデルでさえ、依然として一回性の専門家にすぎない。第4層は、セッションのリセットを越えて自己が生き延びることを保証する状態マネージャーである。

今のメモリは幻想である。RAGは単なるロギングであり、日記を書いては読むのに似ている。本物の生物学的記憶は構造的だ。技能を身につけるとき、人はただテキストの要約を書くわけではない。シナプスの結合そのものが変わるのだ。第4層を実現するには、読み書きから可塑的なアーキテクチャへと移らなければならない。

ワーキングメモリ(潜在状態):静的なトークン窓を越えて、ターンをまたいで持続する、圧縮された高次元の潜在状態を持つ微分可能な文脈へ。
エピソード記憶(グラフ):取得されたテキスト片の集まりではなく、決定と結果からなる構造化された知識グラフ。
手続き記憶(パラメータのログ):エンジニアリングの最前線。ヒントをプロンプトで与える代わりに、私たちはテスト時訓練(TTT)や動的LoRAアダプターを用いる。エージェントは、ミッションの間だけ自らのパラメータを局所的に更新することで、文字どおり学習する。

第5層、組織的ワークフロー

第4層が個の脳なら、第5層は組織の精神である。この層は、タスク実行から戦略的オーケストレーションへの転換を表す。高機能な企業では、成果はプロダクト、セールス、エンジニアリングのあいだの目に見えない整合に支えられている。第5層は、この組織のステートマシンを再現するアーキテクチャだ。

SaaSからService-as-Softwareへの移行はすでに起きている。私たちは人のための道具を作る段階から、仕事そのものを行うシステムを作る段階へと移りつつある。これは、私たちがコードとみなすものの根本的な拡張を求める。ボトルネックはもはや技術的な正しさ(動くか)ではなく、むしろ領域への忠実さである。エンタープライズ営業のような複雑なワークフローを自動化するには、システムはそのビジネスのダイナミクス、すなわち微妙なインセンティブ、交渉のダイナミクス、組織の摩擦までも取り込まなければならない。課題は、ビジネスリーダーの直観を、実行可能なトポロジーへとうまく符号化することにある。アルゴリズムがすなわち組織なのだ。

ビジネスは、隠れた依存関係を抱えた長期的でマルチエージェントなゲームである。プロンプト(プロダクトをローンチせよ)が失敗するのは、それが法務とマーケティングのあいだのデッドロックを無視するからだ。第5層はこれを再帰的な目標分解によって解く。

戦略ノード:第4四半期の目標を月ごとのマイルストーンに分解する。
依存関係の解決:システムは、プロダクトがUIを仕上げるまでマーケティングが始められないことを見抜き、スケジュールを自律的に調整する。
反事実シミュレーション:組織のシステム2。実行に先立って、世界モデルのシミュレーションを6か月先まで走らせる。

ここでさらに興味深い課題が立ち上がる。真実を、すなわち宇宙のイベント台帳をどう設計するか、である。多様な50体のエージェントをどう整合させ続けるのか。対話には頼れない。共有された真実が要る。一つの候補は、イベントソーシングのアーキテクチャをモデルにした組織の皮質だ。

台帳:あらゆる戦略的な動きが不変のトランザクションである(Product_Shipped_v1.2、Marketing_Started_Campaign)。
ガバナンスの層:これがPolicy-as-Codeを可能にする。PR_Agentが公開する前に、台帳はそのテキストをLegal_Policy_Vectorに照らして検証する。これは単なるデータベースではない。企業全体にわたるスプリットブレインの実行を防ぐ中枢神経系である。

6. AI/MLエンジニアへの含意

機械学習エンジニアにとって、抽象化の階層は転換を迫る。問いはもはや、モデルを訓練できるか、ではなく、認知のどの層を最適化しているのか、である。

6.1. モデリングの未来:スケールから特異性へ

ベンチマークのスコアで競う代わりに、MLエンジニアはアーキテクチャの特化により多くを注ぐようになる。

**内在化されたシステム2:**フォワードパスを越えるアーキテクチャ、つまりエージェント的ループをパラメータそのものに焼き込むアーキテクチャの研究。
**テキストから行動へ:**私たちは高品質な人間のテキストを事実上使い尽くした。次の指数曲線は行動データ、すなわち環境とうまくやり取りしたエージェントの軌跡にある。今後12か月で、このデータは爆発的に増える。モデルは専用の行動エンコーダーを進化させ、自己回帰的なjson生成を迂回して、離散的な行動ポインターや制御ベクトルを直接予測するようになる。これは行うことを話すこととは別のモダリティとして扱う。
**専門家の推論の深い整合:**法律のテキスト(語彙)でモデルをファインチューニングするだけでは足りない。最前線は、報酬モデルを通じて推論のトポロジーそのものを変えることにある。私たちは、弁護士が何を知っているかを学ぶことから、弁護士がどのようにリスクを比較考量するかを学ぶことへ移りつつあり、専門用語だけでなくその領域の直観を共有するモデルを作っている。

6.2. 認知のアーキテクト

この役割は分散システムと認知科学を組み合わせる。目標は、ビジネス領域とは独立に、エージェントの心、すなわち思考の構造を構築することにある。

**認識論的エンジニアリング:**システムがどう知り、どう忘れるかを設計すること。これには階層的なメモリシステムの設計(単純なRAGを越えて、グラフベースのエピソード記憶へ)が要り、それによってエージェントは何か月にもわたり同一性と文脈を保つ。
**状態のシリアライゼーション:**状態の永続化問題を解くこと。思考の流れをどうデータベースにシリアライズし、24時間後に文脈を失わずに再水和するのか。これは事実上、知能のためのハイバネート/レジュームである。
**メタ最適化:**他のエージェントを最適化するメタエージェントを作ること。これはエージェント的システムの自動設計であり、エンジニアが適合度関数を定義し、システムが最適なグラフ・トポロジーを反復的に探索する。

6.3. 垂直のアーキテクト

この役割は深い領域知識とワークフロー・エンジニアリングを組み合わせる。目標は、雑然とした人間中心の業界ワークフローを、決定論的なAIグラフへと翻訳することにある。

**認知マッピング:**ベテランの特許弁護士の隣に座り、その直観を50の離散的な認知ステップへと分解し、それをトポロジーへ写像すること。
**評価駆動開発:**ビジネスロジックのための単体テストを作ること。垂直のアーキテクトは、業種固有のe2eワークフローのための評価パイプラインを構築する。
**ハンドオフ設計:**人間が介在する(Human-in-the-Loop)摩擦点を設計すること。自動化のループを壊さずに信頼を最大化するために、いつ人間に制御を委ねるべきかを正確に見極めること。

7. 企業への含意

この情勢を進む企業にとって、これからの課題は、APIやツールを買ってAIを導入することをはるかに越えていく。それはプロセスを組み替えることで認知を統合することである。

7.1. 新たなデータの堀:ナレッジベースから行動テレメトリへ

ほとんどの企業は、自社の競争の堀が静的な文書やナレッジベースにあると誤って信じている。2026年において、テキストはコモディティだ。本当の堀は行動テレメトリ、すなわちマニュアルが役に立たないときにあなたの専門家がどのように問題を解くかの粒度の細かい記録にある。価値を捉えるには、文書で訓練することを越えて、決定でファインチューニングすることへ進む必要がある。上級幹部が危機に対処するとき、システムは決定の軌跡を記録しなければならない。どんな基準が使われ、どんなヒューリスティックが課され、どんなデータが無視され、いかにして曖昧さを切り抜けたのか。この人間の行動プロトコルが第4層の認知の訓練データとなり、事実上、専門家の判断を学習し高めていく。

7.2. プロトコルのデジタル化:会社のやり方を符号化する

どの組織も影のプロトコル、すなわち実際に仕事を片づけている、しばしば公式の方針に反する不文のヒューリスティックや部族的知識の上で動いている。垂直のアーキテクトの役割は、こうした影のプロトコルを探し出し、決定論的なガードレールへと硬化させることにある。このプロセスは企業文化をコードへと変える。人間の直観を実行可能なグラフへ写像することで、企業は事実上、自社のビジネスロジックをバージョン管理する。これによって、最高の社員が最良の日に見せる高い判断力の働きが、組織全体の基準線となる。

8. 政府への戦略的含意

韓国がAIで主導しようとする野心は、相当な資本の投入に裏打ちされて明確だ。しかしエンジニアリングの観点から見ると、現在の戦略はスタックの誤った層を最適化してしまう危険をはらんでいる。次の10年を確保するには、価値が実際にどこに積み上がるのかを反映するよう、ソブリンAIの命題を練り直さなければならない。

8.1. フルスタックの主権

基盤モデルは不可欠な国家インフラである。しかし2026年から2030年の経済的余剰は、スタックの上層へと移りつつある。生の知能(第1層)はコモディティ化したユーティリティになりつつある。私たちにはデュアルトラックのアプローチが要る。競争力のある国内の第1層(基盤)を維持しつつ、市場と技術が成熟するにつれて第4層と第5層へと軸足を移す。私たちは電気を生み出す段階を越えて、エンジンを、そして産業のスタックを製造する段階へ進まなければならない。

8.2. デジタル化の競争

2030年までに、政府と産業の完全なデジタル化は世界的に不可避である。経済的優位を決める変数は、それが起きるか否かではなく、いつ起きるかだ。韓国の比較優位は速度である。私たちは国の法務、行政、産業のテレメトリを、訓練に使える純度の高いコーパスへと今デジタル化しなければならない。これは時間に基づく堀を生む。他国がアナログの摩擦に足を取られているあいだに、韓国のエージェントは私たち固有の産業地形をゼロ遅延で渡っていく。

8.3. ガバナンスのオペレーティングシステム

電子政府における韓国の蓄積は厚いが、次の最前線は自律的な公共インフラ、事実上ガバナンスのLinuxである。米国のような国が自律的な規制の枠組みを試みているなか、韓国の小回りの利くデジタルインフラは、私たちがより速く動くことを許し、税務、税関、ビザ処理のための標準化されたエージェント的モジュールを開発できる。いったん国内で検証されれば、このスタックは、旧来の西洋型官僚制を飛び越えて近代的な国家インフラを求める新興国向けの、高付加価値の輸出品へと変わる。私たちは、ハードウェア(船と半導体)だけを輸出する段階から、近代国家のオペレーティングシステムを輸出する段階へと進化しなければならない。

結論

コンピューティングの歴史は、抽象化の上昇によって定義される。私たちは知能を最適化する段階から、それを設計する段階へと舵を切りつつある。モデルが依然として欠かせない核であることに変わりはないが、本当の仕事はエージェントのトポロジー、認知、ワークフロー設計へと移った。次の10年は、パラメータの確率と世界の要求のあいだの隔たりを橋渡しでき、人間とAIの協働のための新たな基準を定められる作り手たちのものだ。発電所が手のうちにある今、エンジンを、そしてその上で動く経済を築くときである。

Link to slide