다음 모델을 위한 글쓰기

모델이 강해질수록, 모델은 지휘하는 사람을 더 필요로 한다

영어 원문에서 옮김

올해 6월 어느 아침, 내 에세이 한 편의 한국어 번역을 검토했다. 점심 전까지 여섯 군데를 고쳤다. 하나하나는 작았고, 하나하나가 ‘아니, 그게 아니라’였다. deployment를 옮긴 자리에 부대 이동처럼 읽히는 단어가 앉아 있었다. 업계가 외래어를 쓰는 자리에 순우리말 조어가 놓여 있었다. 한국 엔지니어라면 결코 입에 올리지 않을 관용구의 직역이 있었다. 어느 것도 문체 지침에 어긋나지는 않았고, 어느 것도 고치는 데 일 분이 걸리지 않았다. 저녁이 되자 내가 일하는 시스템이 시키지 않은 일을 했다. 규칙을 제안한 것이다. 업계 용어는 더 자연스러운 우리말이 있어도 업계의 어법에 남는다. 파리 잡듯 여섯 군데를 고쳤더니, 내가 두 언어를 오가며 여러 해 적용해 오고도 한 번도 입 밖에 내지 않았던 방침이 돌아온 것이다.

쓴 적도 없는 자기 규칙을 글로 읽는 것은 이상한 일이다. 기계가 영리해서가 아니다. 나에게 규칙이 있었다는 사실을 그제야 알게 되어서다.

새 모델은 나올 때마다 나를 덜 필요로 해야 맞다. 나는 매일 그 안에서 일하는데, 새 모델은 나올 때마다 나를 더 필요로 한다. 내 시간을 더 쓰는 것이 아니다. 아직 틀릴 수 있는 부분을 더 쓰는 것이다. 삼 년 전의 일은 지시문을 쓰는 것이었다. 기계가 말한 그대로만 하고 뜻한 것은 하나도 하지 않았으니, 지시문은 꼼꼼하고 빠짐없어야 했다. 지금은 기계가 번역 초안을 내놓고, 내 영어가 정말로 중의적인 두 문장을 짚어 내고, 어느 뜻을 살릴지 묻는다. 첫 번째 일은 나에게서 가져갔다. 두 번째 일은 나에게 돌려주었다. 세 번째 일은 기계가 물어볼 줄 알게 되기 전에는 있지도 않았다.

나를 덜 필요로 하는 버전을, 모두가 말하는 그 버전을 나는 계속 기다린다. 그런데 매번 도착하는 것은 더 나은 질문을 가진 버전이다. 이 도구를 둘러싼 논쟁은 수준에 대한 논쟁이다. 기계가 무엇을 할 수 있고 무엇을 못 하는가. 따질 가치가 있는 것은 변화율이다. 2026년 한복판 기준으로 모델은 대략 여섯 달마다 한 계단씩 올라서고, 한 계단마다 나에게 더 많은 것을, 더 빠르게 요구해 왔다. 이 시대가 스스로에 대해 들려주는 이야기와는 정반대다.

2023년에 내가 다루던 어떤 것도 여섯 번의 교정에서 규칙을 끌어내지 못했을 것이다. 지금은 한 단어면 얻는 방향 잡기를, 그 몇 분의 일이라도 얻으려고 2023년의 나는 지시문을 문단째 썼다. 같은 여섯 교정은 여섯 개의 수정만 남기고 규칙은 남기지 못했을 것이다. 올해의 모델은 여섯 사례에서 규칙을 끌어낸다. 내년의 모델에게 몇 개가 필요할지는 모른다. 다만 지금까지 모든 세대가 점점 덜 필요로 했다는 것만 안다.

판정도 계속 짧아진다. 여섯 군데를 고치고 이틀 뒤, 다음 에세이를 검토할 때 내 가장 긴 답은 네 단어였고 대부분은 한 단어였다. 끝에 가서는 글자 하나로 충분했다. 시스템이 더는 그 글자를 읽고 있지 않았기 때문이다. 그 글자를, 내가 이미 거절해 온 모든 것에 비추어 읽고 있었다.

그것이 교정 자체에 무엇을 하는지 보라. 하나의 판정은 그것을 읽는 모델이 뽑아낼 수 있는 만큼의 값어치를 지니는데, 판정은 그대로인 채 읽는 쪽만 계속 좋아진다. 같은 기록 한 줄이, 더 강한 모델이 집어 들 때마다 더 값지다. 장부는 불어나는 자산이고, 판정을 내리는 그 순간의 품은 갈수록 싸지는 흐름이다. 나는 아무것도 하지 않는다. 기록을 읽는 쪽이 좋아질 뿐이다. 내 판단이 내 곡선이 아니라 기계의 곡선을 타게 해 주는 것이 이 기록이다.

복리를 노리고 판정을 쌓는 것이 아니다. 눈앞의 일이 판정을 필요로 해서 한다. 복리는 거저 따라온다.

2025년 늦게, 투힌 차크라바티와 동료들은 한 소설가의 작품 전체로 모델을 81달러쯤에 파인튜닝했고, 전문 독자들은 그 발췌문을 MFA 출신 작가들의 새 글보다 선호했다. 이 결과는 무엇인가의 끝으로 널리 읽혔다. 설계를 보라. 연구자들은 주제와 브리프와 견본 문단을 양쪽 모두에게 주었다. 그러니 이 연구가 한 번도 시험하지 않은 것이 하나 있다. 무엇을 쓸지 누가 정하는가다. 81달러가 사는 것은 작가의 과거다. 장부는 작가의 현재다. 사람이 움직이니 장부도 움직이고, 사람이 계속 결정하는 한 어떤 스냅숏도 그보다 오래 현재로 남지 못한다.

모든 판정은 모든 미래 모델에 대한 콜옵션이다.

더 강한 모델이 당신을 더 필요로 하는 이유

방금 문장은 미래에 거는 내기다. 그러니 그 밑을 꺼내 보인다. 모델은 집단이 검증할 수 있는 것에서 좋아진다. 돌아가는 코드, 검산되는 증명, 수백만이 받아들일 답. 그날 아침의 여섯 교정은 그 집합에 없다. 어떤 집단도 그 교정을 만들 수 없었다. 교정마다, 내릴 자격이 있는 사람은 단 한 명이었다. 당신의 작업이 어디로 가야 하는지는 어떤 집단도 검증할 수 없고, 당신이 내놓기 전에는 어떤 말뭉치에도 존재하지 않는다. 그래서 더 강한 모델은 점점 더 적은 신호에서 당신의 방향을 복원하는 데에는 좋아지지만, 그 방향을 스스로 세우는 데에는 끝내 들어서지 못한다. 도달하는 힘은 곡선을 타고 좋아진다. 고르는 힘에는, 그것만으로는, 올라탈 곡선이 없다.

그러니 모델이 당신을 위해 만들어 낼 수 있는 모든 것을 하나의 공간이라고 생각해 보라. 세대가 바뀔 때마다 공간은 커지는데, 그 안의 어느 지점을 당신이 원했는지 알아맞히는 실력보다 공간이 더 빨리 커진다. 약한 모델은 모든 지시문을 같은 최빈값 결과물 하나로 뭉뚱그렸다. 그 시절에는 어떤 프롬프트를 넣어도 같은 밍밍한 문단이 돌아왔고, 이 도구에 대한 당신의 직관은 바로 그 시절에 길러졌다. 모두가 얻어 간 교훈은 기계가 사용자를 평준화한다는 것이었다. 평준화한 것은 기계가 약해서였다. 방향이 주어진 강한 모델은 반대로 한다. 방향 없이 두면 여전히 모두를 같은 최빈값으로 끌어당기고, 지금 있는 측정들은 정확히 그것을 잰 것이다. 방향이 주어지면, 사용자 사이의 차이를 지우는 대신 증폭한다.

지금 강한 모델 하나를 두 사람에게 쥐여 줘 보라. 한 사람은 누구라도 쓸 지시문을 쓴다. 다른 한 사람은 작업이 어디로 가야 하는지 알고, 맞는 초안을 보는 순간 알아보는데, 그 이유를 미리 다 적어 둘 수는 없었을 사람이다. 두 결과물은 더는 서로 가까이에 있지 않다. 같은 내 에세이를 그냥 번역한 판과 기록된 판정 수십 개의 지휘 아래 번역한 판은, 예전에는 풍미가 달랐다. 지금 두 판은 종류가 다르다. 글쓰기에서 이 벌어짐을 잰 사람은 아무도 없다. 글쓰기에는 정답이 있는 벤치마크가 없고, 그것 자체가 이 이야기의 일부다. 내가 내놓을 수 있는 증거는 내 것뿐이다.

바닥도 올라간다. 좋은 모델은 이제 누구에게서든 방향을 어느 정도 끌어낸다. 내 모델이 중의적인 두 문장을 짚어 물었듯이. 그러나 그렇게 회수되는 것은 누구라도 말할 수 있는 방향, 그 단어들 뒤에 있을 법한 평균적인 의도다. 그동안 하나의 방향이 골라내야 할 초안의 집합은 세대마다 커진다. 그래서 아무나 받는 초안과 당신이 원했던 초안 사이의 거리는, 둘 다 좋아지는 동안에도 벌어진다. 분산이 판돈을 정한다. 그 판돈을 거두는 것은 알아보는 눈이다. 그리고 모델이 당신의 기록에서 배울 수 있는 알아봄은 어제의 것이다. 아직 기록에 없는 판정만큼은 모델이 당신 대신 내릴 수 없다. 옳은지를 가리는 시험이 당신 안에 있고, 그 시험이 아직 치러지지도 않았기 때문이다.

여기에 위안은 없다. 고르기 위해 건너다봐야 하는 영토는 당신의 속도가 아니라 기계의 속도로 자란다. 일의 기술은 대역폭이 된다. 얼마나 받아들이고, 이미 쥔 것에 얼마나 녹여 넣고, 그에 비추어 얼마나 결정할 수 있는가. 이 시대의 귀한 것은 자기가 무엇을 원하는지 아는 것이라고 사람들은 여러 해 말해 왔다. 대개는 기분 같은 말로 그친다. 그 밑에 깔린 것이 이것이다. 프리미엄과 압력은 같은 사실이다. 내가 그 어느 쪽에 서 있는지 나는 느낀다. 아침이면 대체로. 짐은 기계의 속도로 자란다. 나는 아니다. 그 차이를 메우는 것이 장부다.

공적인 검증 수단이 있는 일은 전부 기계 쪽으로 옮겨 가고 있다. 유창함이 먼저 갔다. 여러 해 전이다. 구조가 지금 가는 중이다. 2026년 한복판에 이 글을 쓰는 동안에. 브리프가 주어진 문체는 패턴이 있는 다른 모든 것처럼 말뭉치에서 학습된다는 것이 드러났다. 옮겨 갈 수 없는 것은 집단이 없는 부분, 고르는 일이고, 값은 그에 맞게 매겨지고 있다. 방향 프리미엄이라 부르자.

글쓰기는 무엇이 되나

화가들은 이 실험을 사백 년 전에 했다. 루벤스는 캔버스 값을 디 수아 마노, 자기 손으로 그린 몫이 얼마인가로 매겼고, 안트베르펜이 프리미엄을 치른 것은 붓질이 아니었다. 붓질은 공방이 댔다. 어느 붓질을 남길지 아는, 지휘하는 지성에 값을 치렀다. 손은 공방의 것이었다. 그림은 그의 것이었다.

글쓰기도 같은 길로 가고 있다. 더 빠르게. 글쓰기의 공방은 정해진 주기로 좋아지기 때문이다. 무게중심이 짓는 일에서 지휘하는 일로 옮겨 간다. 문장은 점점 기계의 것이 될 것이다. 밑칠이 공방의 것이었듯이. 남는 것은 루벤스가 쥐고 있던 부분이다. 어느 문장이 살아남는가. 이 작업은 무엇을 위한 것인가.

넓어지는 공간 전체를 놓고 고르는 것이 일이라면, 고르기의 입력이 곧 솜씨가 된다. 읽기는 더 이상 쓰기의 준비가 아니라 쓰기의 대부분이 된다. 읽어서 아직 쥐고 있는 것이 고르기가 딛고 서는 바탕이다. 지휘에서 더 드문 쪽은 정확하게 거절하는 일이다.

방향은 부산물로 배우는 것이었다. 여러 해의 허드렛일이 작은 결정을 강제했고, 결정이 거듭되어 판단이 되었다. 기계는 허드렛일부터 흡수한다. 그래서 그 수련은 정확히, 그것이 길러 내던 것의 수요가 오르는 동안에 죽어 가고 있다. 프리미엄이 모두가 익히는 기술이 아니라 프리미엄으로 형성되는 이유가 그것이다. 그 도제 수업에서 살아남는 것이 이 흐름, 곧 판정의 스트림이다. 기록이 수련이어서가 아니다. 결정이 수련이고, 장부는 허드렛일이 암묵적으로 강제하던 결정을 명시적인 아니오 하나씩으로 강제한다. 올해 젊은 작가의 최선의 수는 결과물을 다듬는 것이 아니다. 기록 위에서 결정하기 시작하는 것이다.

내 작은 공방은 이미 이렇게 돌아간다. 나는 더 빠른 일손을 기대하고 방을 지었다. 받은 것은 나를 읽는 장치였다. 내 에세이는 세 언어로 나간다. 번역의 편집자와 용어 관리자와 품질 관문은 사람이 아니다. 대부분 생긴 지 몇 주밖에 안 된 판정의 장부이고, 빌드마다 적용된다. 그리고 기록은 거꾸로 나를 읽는다. 읽기 에이전트 셋에게 내가 발표한 모든 글을 훑고 다니게 하고, 내가 무엇을 쓸 가치가 있다고 여기는지 보고하게 했다. 요약을 기대했다. 돌아온 것은 내 에세이들이 맴돌기만 하고 한 번도 말하지 않은 주장이었다. 모델이 강해질수록, 모델을 지휘하는 사람이 더 값지다는 것. 내가 무엇에 대해 써 왔는지 기계가 말해 줘야 했다.

프리미엄은 어디에 내려앉나

작가 자리에 이 시스템들을 지휘하는 누구를 넣어도 모양은 유지된다. 고르게는 아니다. 당신의 일에서 어디에 내려앉을지는 한 번 금을 그어 보면 짚을 수 있다. 성공 여부를 사람의 판단 말고 다른 것이 검증할 수 있는 부분을 전부 표시해 보라. 그 부분들은 닫힌다. 체스가 정확히 이 금에서 무너졌다. 인간에 엔진을 더한 그 유명한 조합의 창은, 검증 수단이 있는 게임을 엔진이 샅샅이 읽어 내는 데 걸린 시간만큼만 열려 있었다. 검증 수단이 있는 글쓰기의 모든 부분도 같은 식으로 닫힐 것이다. 브리프가 주어진 문체는 이미 무너졌고, 81달러 논문이 그 영수증이었다. 프리미엄은 나머지에, 유일한 검증자가 사람인 자리에 몰린다.

앞에 놓인 가장 첨예한 싸움은 스트림을 누가 소유하느냐다. 당신의 결정 기록이 한 회사 제품 안에 쌓인다면 프리미엄은 그 회사의 것이 되고, 그 포획은 계약서처럼 생기지 않을 것이다. 내보내기가 없는 메모리 기능처럼 생길 것이다. 일하는 사람들은 지금 평판을 들고 다니듯 장부를 들고 직장을 옮기게 될 것이고, 고용 계약에도 이것이 적히기 시작할 것이고, 장부 이동권을 둘러싼 싸움은 소셜 그래프를 둘러싼 싸움을 닮을 것이다. 다만 이번에는 자산이 불어난다. 2026년 중반의 제품들이 만드는 메모리는 대개 당신에 관한 사실을 기억하는 것이다. 값을 치를 만한 메모리는 당신이 거절해 온 기록이다.

짝퉁도 올 것이다. 프롬프트를 더 쓰는 것은 지휘가 아니다. 방향이 없는 사람 눈에는 지시의 분량이 방향으로 보일 뿐이다. 이제 중요한 숙제는 하나를 만들어 내는 것이 아니라 쉰 개를 판정하는 것인데, 교육에서 판단을 채점하도록 지어진 것은 거의 없다.

대부분의 방향은 최빈값이다. 어디로 가야 하는지에 대한 평균적인 감각은 평균이고, 그것은 기계가 이미 쥐고 있는 것이며, 최빈값 판정으로 채운 장부는 기계가 몰랐던 것을 하나도 가르치지 못한다. 프리미엄이 가파른 것은 공급이 달려서고, 그것은 기본값으로 주어지지 않는다.

여기, 내 몫의 청구서를 적어 둔다. 내 장부의 판정들에는 2026년 6월이라는 날짜가 찍혀 있다. 한 줄도 손대지 않은 채, 내년의 모델에게 읽힐 때, 올해의 모델에게 읽힐 때보다 더 값져야 한다. 더 값지다는 것은, 같은 기록이 더 많은 결정을 혼자 처리하고 나에게서 더 적은 교정을 끌어낸다는 뜻이다. 둘 다 이미 방이 세고 있는 수치다. 그렇게 되지 않는다면, 프리미엄은 기분이었던 것이다.

충분히 긴 기록은 스트림마저 통째로 학습하게 만들지 모른다. 그럴지도. 학습된 모형은 거절을 예측할 수 있다. 틀렸던 그 사람일 수는 없다. 그리고 글에는 언제나, 틀릴 수 있는 사람의 서명이 붙어 있었다.

기계는 모두의 어제 버전을 쥐고 있다. 말뭉치가 그것이고, 파인튜닝이 그것이다. 내일의 거절은 아직 존재하지 않는다. 누구의 것도, 당신 것도. 지난 한 달 사이 어딘가에, 당신이 내리고도 적어 두지 않은 판정 여섯 개가 있다. 다음 모델은 그것을 지금 모델보다 더 잘 읽을 것이다.