사람을 기억하는 레이어
취향에서 살아 있는 부분은 사람마다 다르고 파라미터 바깥에 놓인다. 그것을 가장 촘촘히 그린 지도는 이미 있었고, 우리는 그것을 점수로 읽으며 내다 버렸다.
이런 모델 위에 무언가를 짓는 일의 묘한 점은, 정작 모델 자체에는 손대지 않는다는 것이다. 우리는 그 둘레를 짓는다. 문서를 건네고, 기억의 저장소를 붙이고, 행동에 앞서 읽어 들이는 지시문을 쥐여 주고, 도구와 한계의 틀을 둘러 주며, 그 모두를 매만져 끝내 모델이 내가 원하는 쪽을 가리키게 한다. 모델 파라미터는 움직이지 않는다. 이런 시스템으로 짓는 사람이라면 이제 다 안다. 거기엔 이름이 붙었고, 모범 사례가 생겼고, 작은 산업이 둘레에 자라고 있다. 아직 짚는 이를 보지 못한 것은 이것이 유독 취향에 무엇을 뜻하느냐다. 고정된 모델의 방향이 파라미터 바깥에서 온다면, 우리에게서 가장 방향으로 빚어진 부분, 곧 살아서 쌓여 가는 그것, 우리가 취향이라 부르는 것 역시 바깥에서 온다.
그리고 취향이 맞는 말이다. 선호도 의견도 아니다. 우리는 취향의 능력을 지니고 태어날 뿐 취향 자체를 지니고 태어나지는 않는다. 취향은 그 능력 위에 쌓이는 것, 한평생 눈여겨보고 반응해 온 것들의 더께이며, 한 자리에 머무는 법이 없고 끝나는 법도 없다. 그것이야말로 얼어붙은 파라미터 한 벌이 결코 될 수 없는 것이다. 모델이 무엇을 배웠든 훈련이 멈출 무렵까지 배웠고, 그러고는 그 자리에 박혔다. 파라미터는 엄청난 양을 담을 수 있다. 여러 취향이 한꺼번에 섞여 남긴 잔여물을. 다만 한 사람의 취향으로 계속 되어 가는 일만은 할 수 없는데, 그러려면 쌓임이 필요하고, 쌓임이야말로 바로 그때 멈춘 것이기 때문이다.
그래서 사람이 빠진 좋음의 모델은 답이 없는 물음에 답하고 있다. 좋음은 사물의 속성이 아니다. 그것은 사물과 누군가 사이의 관계이고, 그 누군가를 품지 못한 모델은 평균의 누군가, 곧 자신이 본 모든 이의 안전한 한가운데를 대신해 답할 수 있을 뿐이다. 어느 한 사람의 취향의 봉우리, 곧 방이 아니라 그 사람을 움직이는 그 특정한 것은 그 한가운데에 없다. 애초에 거기 있을 리 없었다. 그러니 취향에서 살아 있는 부분이 이런 모델 곁 어디엔가 놓이려면, 살아 있고 사람마다 다른 다른 모든 것이 이미 놓인 곳에 놓여야 한다. 파라미터 바깥, 우리가 이미 더듬어 가는 법을 익힌 그 쌓여 가는 레이어에.
그것이 하나의 대상으로 어떻게 생겼는지 물으면, 답은 이미 지어지고 있다. 개인화에서 가장 흥미로운 작업은 사람마다 하나씩 파인튜닝하는 방식에서 멀어지고 있다. 그것은 사람마다를 공유 공간 속 작은 벡터로, 곧 다른 위치들 사이의 한 위치로 나타내고, 그 사람이 움직일 때마다 갱신하며, 모델 자체는 얼어붙은 채로 둔다. 그중 일부는 시스템이 거의 처음 보는 사람을 그가 닮은 무리로 자리매김한다. 낯선 이를 자리에 놓으려 군중의 모양새를 빌려 오는 것이다.
이 대목이 파라미터에 대해 방금 한 말을 비껴간다. 파라미터는 모두를 하나로 섞어 한가운데만 대신해 답할 수 있다. 공간은 모두를 떼어 놓고, 한 점은 자기 자신을 대신해 답할 수 있다. 그 공간은 파라미터만큼 고정되어 있어도 상관없다. 움직이는 것은 공간이 아니라 그 안에서 사람이 앉은 자리이기 때문이다.
그러니 한 사람의 취향을 담는 것은 공유 공간 속의 좌표이고, 그 공간은 수많은 사람으로 지어지며, 계속 갱신된다. 취향에서 살아 있는 부분이 파라미터 바깥으로 나오면 그렇게 생겼다. 그리고 좌표는 그것이 앉은 공간만큼만 좋다. 외톨이 점은 아무것도 아니다. 그래서 온 물음은 사람들이 충분히 촘촘히 놓인 공간이 대체 어디서 와야 하느냐로 모인다. 프롬프트 이력이 아니다. 사적인 프로필이 아니다. 사람들로 이루어진 공유된 거리 공간이다. 그것이 바로 추천 분야가 이미 지어 놓은 것이다.
그것은 이십 년째 있어 왔다. 우리는 다른 쓰임을 위해 그것을 짓고는 하나의 숫자로 읽었다. 추천 시스템은 평생을, 누가 무엇에 반응했는지에 대한 거대하고 거의 텅 빈 기록을 받아다가 하나의 공간으로 접어 넣는 데 쓴다. 사람마다 몇백 개의 좌표, 사물마다 똑같이 몇백 개, 빈틈을 짐작할 수 있도록 배치된 좌표로. 그 공간은 누가 누구 곁에 앉는지의 배열, 곧 취향의 관계 구조를 누가 만든 것보다 촘촘히 그린 지도다. 그것은 두 낯선 이가 같은 귀를 지녔음을 안다. 어떤 사물이 일단 시스템 안에 들어오면 그것에 손 뻗을 법한 사람들 사이로 그 사물을 자리매김할 수 있다. 그러고서 우리는 이십 년 동안 그것을 하나의 선 위로 짓이겼다. 클릭이냐 아니냐, 별 넷이냐 둘이냐로. 목록을 위에서 아래로 정렬할 수 있도록. 숫자가 곧 상품이었다. 공간은 그 숫자를 떠받치는 비계로 다뤄졌다. 나는 그것을 버려진 다양체(the discarded manifold)라 부르겠다. 우리가 그런 종류 중 가장 풍요로운 것을 짓고는 그것을 점수로 읽기로 합의한 그 순간, 같은 손짓으로 내다 버렸기 때문이다.
숫자는 거기 있던 것 가운데 가장 작은 부분이기도 했다. 가장 풍요로운 경우에는 사람이 평점 곁에 한 문장을 남긴다. 두 번 샀다, 내겐 좀 달다, 그 문장은 점수가 담지 못하는 까닭을 실어 나른다. 그 까닭들 역시 내다 버려졌고, 더 기이한 낭비이며, 누군가는 그것에 대해 써야 한다. 다만 그것은 내가 이름 붙이는 것과는 다른 대상이다. 내가 버려진 다양체로 뜻하는 것은 그 까닭들보다 좁고 차다. 그것은 오로지 거리 공간, 곧 위치들과 그 사이의 거리들, 배열 그 자체다. 배열이야말로 생성기가 조건으로 삼을 수 있는 부분이기 때문이다.
정직하게 말해 두자면 나는 글로 그 반대를 주장한 적이 있다. 나는 추천 데이터가 취향에는 모자라다고 말했다. 사회적 신호는 혼동 요인이라고, 군중의 평점은 한 비평가의 신중한 판단 아래에 놓인다고 썼다. 나는 지금도 그렇게 생각한다. 내가 보고 있던 대상들, 곧 로그와 평점, 시스템이 내뿜은 배기에 대해서는. 나는 그 배기가 그림자로 비친 그 공간을 보고 있지 않았다. 내가 긋지 못한 구별이 바로 이 글이 매달린 그것이다. 시스템이 예측하는 숫자와, 그것을 예측하려고 시스템이 지은 거리 공간 사이의 구별. 첫째는 나는 지금도 물리치겠다. 둘째는 우리가 줄곧 놓쳐 온 것이라고 나는 이제 생각한다.
가장 어려운 반론은 내가 가장 목청 높여 던졌던 것이다. 이 모두는 이미 있는 것들에 대한 반응이고, 창작에는 아직 없는 것에 대한 반응이 필요한데, 아무도 본 적 없는 것에는 누구의 반응도 매달려 있지 않다. 그것은 사실이고, 진짜 한계다. 라벨은 옮겨 가지 않는다. 다만 옮겨 가는 것은 라벨이 아니고, 새 작품도 아니다. 그것은 사람들의 배열이다. 어떤 사물이 만들어진 적 있든 없든 사람들은 자기 좌표를 지키고, 그 배열이야말로 생성기를 겨눌 수 있는 대상이다. 만들어지지 않은 사물을 설명만으로 지도 위에 떨구는 것은 가느다란 통로, 곧 이 분야가 늘 행동보다 아래에 놓인다고 알아 온 그 통로다. 겨눔은 놓음이 아니다. 지도는 먼저 시험해 볼 사람들의 영역을 건넬 뿐, 무엇이 가닿았다는 증명을 건네지는 않으며, 진짜 반응을 낳는 고리는 여전히 돌아야 한다. 지도가 그 고리에 주는 것은 먼저 어디를 가리킬지의 방향이다.
하나의 숫자를 예측하도록 지어진 시스템이 여러 갈래의 취향을 담을 수 없다고 반박한다면, 갈래들은 애초에 그 숫자 안에 있던 적이 없다. 누가 무엇을 좋아했는지에 대한 충분히 큰 기록을 접어 넣으면 떨어져 나오는 차원들은 제멋대로가 아니다. 그것들은 우리가 알아보는 것들과 줄을 맞춘다. 분위기로 읽히는 방향, 시대로 읽히는 방향, 일종의 절제로 읽히는 방향, 그 무엇도 누가 라벨 붙인 적 없고, 모두 동시 출현(co-occurrence)의 헐벗은 무늬에서 되찾아진다. 점수는 그 공간의 일차원 그림자였다. 우리는 여러 차원의 취향 모델을 훈련해 놓고는 하나의 선으로 투영해 내렸다. 목록에 필요한 것은 선이기 때문이다. 그리고 그 공간은 더럽다. 무엇이 보였는지에, 또 무엇이 이미 인기였는지에 휘어 있고, 그래서 그것은 정답이 아니라 사전 분포(prior)다. 오염은 먼저 횟수에서 드러나고, 취향을 노출에서 갈라내는 일이 이 분야가 십 년을 쏟아 온 일의 태반이다. 일부이지, 전부는 아니다. 사전 분포이지, 신탁은 아니다.
신중한 비평가는 비평가가 하는 일에서는 여전히 이긴다. 하나의 판단의 내용을, 그 까닭을, 실어 나를 만큼 단단한 언어로 우리에게 건넨다. 지도는 그것을 하지 못하고 하려 들지도 않는다. 지도는 비평가가 하지 못하는 것을 건넨다. 사람들로 이루어진 공간 전체의 모양을, 누가 누구 곁에 앉는지를 말하는 좌표를. 하나는 한 점에서의 깊이다. 다른 하나는 그 점들이 배열된 좌표계다. 나는 그 둘을 한 일자리를 두고 다투는 경쟁자로 여겼다. 그것들은 애초에 경쟁자가 아니었다.
지금 이 시기의 묘한 점은 이것이다. 지도는 손대지 않은 채 놓여 있지 않다. 그것은 두 번 다시 지어지고 있다. 비슷한 모양을 양 끝에서 손 뻗는 두 무리에 의해. 추천 분야는 그것을 대형 생성형 추천 시스템으로 다시 짓고 있다. 산업 규모의 행동 흐름으로 훈련해, 사람들에 대한 풍요롭고 끊임없이 갱신되는 표현, 곧 취향이 실제로 그러한 여러 갈래의 변해 가는 그것을 배우고는, 처음 했던 그대로 다시 내다 버린다. 그 모두를 다음 클릭에 겨누고, 그것이 수집된 단 하나의 카탈로그 안에 남겨 둠으로써. 정렬 분야는 같은 구조를 반대편에서 손 뻗어, 손으로 모으는 비교적 자그마한 선호 데이터 더미에서 작고 또렷한 판본을 짓고 있다. 둘을 잇는 다리는 여전히 가늘고, 그 태반이 더 작은 쪽에서부터 지어지고 있다. 가장 촘촘한 판본은 이미 추천 쪽에 있고, 바로 그 쪽이 다리가 닿지 못한 쪽이다.
그래서 나는 다음 국면이 파라미터가 아니라 이 레이어에서 갈린다고 생각한다. 파라미터 안의 능력은 계속 좋아지고, 해마다 그 더 많은 부분이 두루 풀린다. 풀리지 않는 것은 특정한 사람들이 여러 해에 걸쳐 어떻게 반응해 왔는지의 쌓인 기록이고, 그런 기록 중 가장 촘촘한 것이 버려진 다양체, 곧 그것을 붙잡은 플랫폼들 안에 앉은 그것이다. 그런 지도 하나를 쥔 누군가가 그것을 순위 목록의 연료로 읽기를 그치고, 취향 모델이 조건으로 삼는 사람들에 대한 사전 분포로 읽기 시작한다면, 그는 파라미터가 결코 담을 수 없는 취향의 절반을 쥐게 된다. 내기는 이것이 쉽다는 것도 아니고, 그 데이터가 남이 가져다 쓸 것이라는 것도 아니다. 태반은 임자가 있고 민감하며 그대로 있어야 마땅하다. 내기는 오로지 값어치가 어디로 옮겨 갔느냐에 대한 것이고, 그것은 모델 바깥의 레이어로, 그 레이어 가운데 사람을 기억하는 부분으로 옮겨 갔다.
정직한 한계 하나, 그것이 내가 취향에 대해 써 온 모든 것 아래에 흐르는 바로 그 한계이기 때문이다. 지도는 취향이 이미 어디 있는지를 일러 준다. 사람을 자리에 놓고, 사물을 자리에 놓고, 어느 쪽으로 기우는지를 예측한다. 그것은 우리가 줄곧 지켜본 모두의 지금 배열을 그린 가장 좋은 그림이다. 그러나 아무도 아직 사랑하지 않는 무엇을 한 사람이 끝내 사랑하게 될지는, 곧 그의 점을 한 번도 가 본 적 없는 곳으로 옮기는 그것은 일러 주지 못한다. 그것은 지도 위의 한 위치가 아니기 때문이다. 그것은 지도에 대한 변화다. 이런 것들 가운데 가장 큰 것, 플랫폼이 기록한 모든 것으로 훈련한 것조차 그 자리에서는 말이 없고, 이 분야가 거기에 부딪치기 시작하는 것을 느낄 수 있다. 사람들이 한 일을 흉내 내는 것과 그들이 다음에 무엇으로 손 뻗을지를 아는 것 사이의 차이를. 그러니 버려진 다양체는 지금 있는 그대로의 취향에 대한 가장 좋은 사전 분포이고, 그것을 다시 집어 드는 일이 취향 모델이 줄곧 놓쳐 온 것의 태반이다. 그래도 잊지 말 만한 것이 있다. 지도 전체는 모두가 이미 어디 있는지의 지도다. 우리가 줄곧 최전선이라 부르는 그것은 다른 곳에 가 있는 첫 번째 사람이다.