人を記憶するレイヤー
趣味の生きた部分は人ごとに異なり、モデルのパラメータの外側にある。その最も緻密な地図はすでに存在していて、私たちはそれを点数として読むことで捨ててしまった。
こうしたモデルの上に何かを築くとき、奇妙なのは、モデルそのものには決して手を触れないことだ。その周りを書いていく。文書を渡し、記憶の蓄えを渡し、行動の前に読み込む一連の指示を渡し、道具と制限の枠組みを渡して、そのすべてを整え、ついにそれがこちらの望む方を指すようにする。モデルのパラメータは動かない。こうしたシステムで何かを築く者なら、もう誰もが知っていることだ。それには名前があり、ベストプラクティスがあり、その周りに小さな産業が育ちつつある。まだ語られていないと思うのは、それが趣味にとって何を意味するかだ。固定されたモデルの向きがパラメータの外側から来るのなら、私たちのうち最も向きでできた部分、つまり積み重なりつづける生きたもの、趣味と呼ぶものもまた、外側から来る。
そして趣味こそが正しい言葉で、選好でも意見でもない。私たちはそれを抱く能力を持って生まれるのであって、それ自体を持って生まれるのではない。趣味は能力の上に積み重なるもの、注意を向け応えてきた一生分のものであり、けっして静止せず、けっして完成しない。それは凍ったパラメータの集まりがどうしてもなれない、ただ一つのものだ。モデルが何を学んだにせよ、訓練が止まるまでに学んだのであり、そこで固定された。パラメータは膨大なものを抱えられる。多くの趣味が一度に混ざり合った残りかすを。だができないのは、ひとりの人の趣味でありつづけることだ。それには積み重なりが要り、積み重なりこそ、まさに止まってしまったものだからだ。
だから、人の入っていない良さのモデルは、答えのない問いに答えている。良さはものの性質ではない。ものと、ある誰かとのあいだの関係であり、その誰かを担わないモデルは、平均的な誰かにしか答えられない。それまで見てきた全員の、無難な真ん中にしか答えられないのだ。ひとりの人の趣味の頂、その人を動かし部屋を動かさない特定のものは、その真ん中にはない。はじめからそこにあるはずがなかった。だから、趣味の生きた部分がこうしたモデルの近くのどこかに収まるのなら、生きていて人ごとに異なるほかのすべてがすでに収まる場所、つまりパラメータの外側、私たちがすでに舵を取ることを覚えた、積み重なるレイヤーに収まるほかない。
それが対象としてどう見えるかを問えば、答えはもう築かれつつある。個人化で最も面白い仕事は、人ごとに一つのファインチューニング、という形から離れつつある。それは各人を共有空間の中の小さなベクトルとして、ほかの位置のあいだの一つの位置として表し、その人の歩みとともに更新し、モデルそのものは凍ったまま残す。そのうちのいくつかは、システムがまだほとんど出会っていない人を、その人が似ている仲間によって配置する。群衆のかたちを借りて、見知らぬ者を位置づけるのだ。
ここが、パラメータについていま述べたことから抜け出す部分だ。パラメータは全員を一つに混ぜ、真ん中にしか答えられない。空間は全員を離して置き、一つの点はそれ自身に答えられる。幾何はパラメータと同じだけ固定されていてかまわない。動くのは空間ではなく、人がその中のどこに座るかだからだ。
だから、人の趣味を抱くのは共有空間の中の一つの座標であり、その空間は多くの人から築かれ、更新されつづける。それが、趣味の生きた部分がパラメータの外側に出たときの姿だ。そして座標は、それが座る空間の良し悪しを超えることはけっしてない。孤独な点は何でもない。だから問いの全体は、人の十分に密な空間がどこから来るはずなのか、になる。プロンプトの履歴ではない。私的なプロファイルでもない。人の共有された幾何だ。それこそ、推薦分野がすでに築いたものだ。
それは二十年前から存在する。私たちはそれを別のもののために築き、そして一つの数として読んだ。推薦システムは、誰が何に応えたかという膨大でほとんど空っぽの記録を取り、それを空間へと畳み込むことに生涯を費やす。人ごとに数百の座標、ものごとに同じだけ、すきまを当てられるように並べて。その空間は、誰が誰の近くに座るかという、趣味の関係構造の、これまで誰も作ったことのない最も密な地図だ。それは見知らぬ二人が同じ耳を持つことを知っている。ものがシステムに入りさえすれば、それを手に取りそうな人々のあいだに置くことができる。そして二十年のあいだ、私たちはそれを一本の線へと潰した。押すか押さないか、四つ星か二つ星か。リストを上から下へ並べられるように。数が製品だった。空間は数のための足場として扱われた。私はそれを捨てられた多様体(the discarded manifold)と呼ぶ。その種で最も豊かなものを築きながら、それを点数として読むことに同意したまさにその瞬間に、同じ一つの動きの中で捨ててしまったからだ。
数はまた、そこにあったもののうち最も小さな部分だった。最も豊かな場合には、人は評点とともに一文を残す。二度買った、私には少し甘すぎる、と。そしてその一文は、点数の運べない理由を運ぶ。そうした理由もまた捨てられた。さらに奇妙な浪費であり、誰かがそれについて書くべきだ。だがそれは、私が名づけている対象とは別のものだ。私が捨てられた多様体で言いたいのは、理由よりも狭く、冷たいものだ。それはただ幾何だけ、位置と位置のあいだの距離、並びそのものだ。並びこそ、生成器が条件づけられる部分だからだ。
正直に言っておくべきだが、私は文章で逆のことを論じてきた。推薦データは趣味には不十分だと書いた。社会的シグナルは交絡だ、群衆の評点はひとりの注意深い批評家の判断の下に座る、と書いた。私はいまもそれらを、自分が見ていた対象、つまりログと評点、システムの排気については、そう思っている。私は、排気がその影であった空間のほうは見ていなかった。私が引きそこねていた区別こそ、これが転じる軸だ。システムが予測する数と、それを予測するために築いた幾何とのあいだの区別である。前者なら私はいまでも退ける。後者こそ、いま私たちが見落としてきたと思うものだ。
最も手強い反論は、私が最も声高にしたものだ。これはすべて、すでに存在するものへの反応であり、創造はまだ存在しないものへの反応を要する。そして誰も見たことのないものには、誰の反応もついていない。それは本当で、本当の限界だ。ラベルは転移しない。だが転移するのはラベルではないし、新しい作物でもない。それは人々の並びだ。彼らは、あるものが作られていようがいまいが、自分の座標を保ちつづける。そしてその並びこそ、生成器が照準できるものだ。まだ作られていないものを、その記述だけで地図に落とすのは細い経路で、振る舞いの下に座ると分野がずっと知ってきたものだ。照準は配置ではない。地図が渡すのは、まず試すべき人々の領域であって、何かが着地したという証明ではない。本物の反応を生むループは、なお回さなければならない。地図がそのループに渡すのは、まずどちらを指すかという向きだ。
一つの数を予測するために築かれたシステムが多面的な趣味を抱けないと反論するなら、その面ははじめから数の中になかった。誰が何を好んだかという十分に大きな記録を畳み込めば、落ちてくる次元は恣意的ではない。それは私たちが見覚えのあるものと並ぶ。気分として読める方向、時代として読める方向、ある種の抑制として読める方向。どれも誰にもラベルづけされず、すべて共起のむき出しのパターンから取り戻される。点数は、その空間の一次元の影だった。私たちは多次元の趣味モデルを訓練し、それを一本の線へ投影した。リストが要るのは線だからだ。そしてその空間は汚れている。何が見せられたか、何がすでに人気だったかによってかたちづくられていて、だからこそそれは事前分布であって、揺るぎない真実ではない。汚染はまず数のうちに現れ、趣味を露出から切り離すことが、分野が十年を費やしてきたものの多くだ。部分的に、全部ではない。事前分布であって、神託ではない。
注意深い批評家は、批評家のすることでは、いまも勝つ。一つの判断の中身、つまりその「なぜ」を、運べるだけ持ちのいい言葉で渡してくれる。地図はそれをできないし、しようともしていない。地図が渡すのは批評家にできないもの、人々の空間全体のかたち、誰が誰の近くに座るかを告げる座標だ。一方は一点での深さ。もう一方は、点が並べられる座標系だ。私はこの二つを一つの仕事をめぐる競争相手として扱っていた。両者ははじめから競争相手ではなかった。
いまについて奇妙なのはここだ。地図は手つかずで座っているのではない。それは二度、いま築き直されつつある。似たかたちを反対の端から手探りする二つの集団によって。推薦分野は、それを大規模な生成型推薦システムとして築き直している。産業規模の振る舞いの流れで訓練され、人々の豊かで絶えず更新される表現、つまり趣味が実際にそうである多面的で移り変わるものを学ぶ。そして一度目と同じやり方で捨てる。そのすべてを次のクリックへ向け、それが集められた一つのカタログの中に置き去りにすることで。アラインメント分野は、同じ構造をもう一方の側から手探りしている。手で集めた比較的わずかな選好データの山から、その小さく明示的な版を築きながら。両者を架ける橋はいまも細く、その多くは小さい側から築かれている。最も密な版はすでに存在する。推薦の側に。そしてそこが、橋の届いていない側だ。
だから私は、次の局面はパラメータの中ではなくこのレイヤーで決まると思う。パラメータの中の能力は改善されつづけ、その多くが年ごとに広く手に入るようになる。手に入るようにならないのは、特定の人々が何年にもわたってどう応えてきたかという積み重なった記録であり、最も密なそうした記録こそ、それを捉えたプラットフォームの中に座る、捨てられた多様体だ。そうした地図の一つを握り、それを順位づけられたリストの燃料として読むのをやめ、趣味のモデルが条件づける、人々についての事前分布として読みはじめる者は、パラメータがけっして運べない趣味の半分を握る。賭けは、これが容易だということではないし、データが誰か他人の取れるものだということでもない。その多くは所有され、機微にふれるもので、そのままにしておくべきだ。賭けはただ、価値がどこへ動いたかについてだけだ。価値はモデルの外側のレイヤーへ、そのレイヤーのうち人を記憶する部分へと動いた。
正直な限界を一つ。それは、私が趣味について書いてきたすべての下を走るのと同じ限界だからだ。地図は、趣味がすでにどこにあるかを告げる。人を配置し、ものを配置し、傾きを予測する。それは私たちが見てきた全員の、いま立っている並びの、最良の絵だ。地図には、まだ誰も愛していないものを人がやがて愛するようになること、その点をかつてなかった場所へ動かすものは告げられない。それは地図の上の位置ではないからだ。それは地図そのものへの変化だ。これらのうち最大のもの、プラットフォームがこれまで記録したすべてで訓練されたものでさえ、そこでは沈黙している。そして分野がそこにぶつかりはじめているのを感じ取れる。人々がしたことを模倣することと、人々が次に何へ手を伸ばすかを知ることとのちがいに。だから捨てられた多様体は、いまあるままの趣味についての最良の事前分布であり、それを拾い直すことが、趣味のモデルが見落としてきたものの多くだ。それでもなお覚えておく値打ちがあるのは、地図の全体が、全員がすでにいる場所の地図だということだ。私たちが最前線と呼びつづけているもの、それは誰よりも先に別の場所にいる、最初の一人だ。