인공 인지의 진화

추상화의 다섯 층

2026-01-30

거대 언어 모델(LLM)의 산업적 도입은 추상화의 단계적 진화다. 2022년부터 2024년까지는 1층(기반 모델)이 지배했고, 거기서는 날것의 지능 그 자체가 제품이었다. 2층(단일 에이전트)은 도구 사용을 통한 행위라는 패러다임을 들여왔다. 오늘날 업계는 3층, 곧 오케스트레이션에 깊이 발을 들였고, 거기서 과제는 여러 에이전트를 조율하는 일로 옮겨 갔다.

그러나 오케스트레이션은 국소 최댓값이다. 우리는 눈부신 즉석 논리를 순간적으로 터뜨릴 줄은 알지만 긴 시간에 걸쳐 일관된 사고를 붙들지는 못하는 일회성 전문가를 지어 왔다. 머지않아 우리는 4층, 곧 장기 인지로 방향을 틀 것이다. 상태 없는 토큰 생성에서, 엔지니어의 끝에서 끝까지 이어지는 장기 인지를 흉내 내는 상태를 지닌 지속적 시스템 2 사고 과정으로 옮겨 가는 전환이다. 그 너머에는 5층, 곧 조직 워크플로가 있고, 거기서는 이 인지 개체들이 조직 계획의 천에 짜여 들어가 약속된 비즈니스 성과를 내놓는다.

머지않아 우리는 그저 모델을 엮는 일을 넘어 인지와 조직을 설계하는 쪽으로 나아갈 것이다. 이것이 내가 그리는 청사진이다.

1층, 기반 모델

초기 단계(2022~2024)에 업계는 진보의 단일 축, 곧 규모에 집중했다. 파라미터 전쟁은 MMLU 같은 정적 벤치마크에서 최고 성능을 좇는 일로 규정되었다. 규모는 여전히 결정적이지만 2026년 연구 최전선은 차원에서 넓어졌다. 우리는 이제 그저 이 모델이 얼마나 똑똑한가만 묻지 않는다. 이 모델이 시스템 안에서 얼마나 효율적으로 추론할 수 있는가를 묻는다.

수직적 특화. 시장은 범용 모델(값싸고 빠르고 휴리스틱한)과, 특정 버티컬과 언어와 양식에 맞춘 엔터프라이즈급 추론 엔진으로 갈라지고 있다. 경쟁의 해자는 버티컬별 다국어성과 네이티브 멀티모달리티로 옮겨 갈 것이다.

파라미터 속의 시스템 2. 우리는 추론이 순전히 바깥의 프롬프팅 요령과 텍스트 요약이던 시대를 넘어서고 있다. 다음 세대 모델은 시스템 2 능력을 포워드 패스에 직접 내재화하기 시작했다. 우리는 말하기에 앞서 생각하도록 추론 시점의 연산을 배분할 줄 아는 모델, 곧 에이전트 루프 자체를 모델 파라미터 속에 구워 넣은 모델을 보고 있다.

기반 모델은 AI 운영 체제의 특화된 커널이 되어 가고 있다. CPU가 특화된 코어들(GPU, NPU)로 이루어진 복잡한 생태계로 진화했듯, 1층도 그 위의 층들을 떠받칠 특화된 추론 엔진들로 쪼개지고 있다.

2층, 에이전트와 함께하는 행위

2층은 모델이 수동적인 텍스트 생성기이기를 멈추고 능동적인 시스템 구성 요소가 되는 전환을 표시한다. 우리는 모델에게 SQL 쿼리를 쓰라고 하던 데서, 살아 있는 데이터베이스 연결을 건네 그것을 실행하게 하는 데로 옮겨 갔다. 이를 이끈 것은 도구 사용(함수 호출)의 도입이었다. 그저 산문이 아니라 구조화된 호출을 내놓도록 모델을 미세 조정함으로써, 우리는 사실상 모델에게 행위 능력을 주었다. 엔지니어링의 현실은 프롬프트 엔지니어링에서, 확률적 모델이 현실 세계와 상호작용하려고 불러낼 수 있는 명확하고 결정론적인 도구를 갖춘 API 설계로 옮겨 갔다.

단일 에이전트의 쓸모는 이 연결의 표준화와 함께 폭발했다. 처음에는 모든 연동이 손으로 짠 접착 코드였다. Model Context Protocol(MCP) 같은 표준의 등장은 모델이 자원을 발견하고 활용하는 방식을 하나로 묶었다. 우리는 이제 저장소, 슬랙 워크스페이스, 데이터베이스 같은 기업 환경 전체를 표준화된 서버 엔드포인트로 추상화할 수 있다. 이로써 단일 에이전트는 신기한 물건에서, 자기 맥락을 직접 끌어오고 정해진 샌드박스 안에서 자율 루프를 실행할 줄 아는 쓸 만한 일꾼으로 바뀌었다.

3층, 멀티 에이전트 오케스트레이션

단일 에이전트 패러다임(2층)은 실행을 입증했지만 규모에서 실패했다. 신뢰성을 설계해 내려면 우리는 범용 에이전트를 특화된 단위로 분해해야 한다. 우리는 디지털 장인에서 디지털 조립 라인으로 옮겨 가는 중이다. 이는 새로운 아키텍처 층, 곧 오케스트레이션을 요구한다.

2층에서 우리는 하나의 함수를 설계했다. 3층에서 우리는 토폴로지를 설계한다. 복잡성은 모델에서 핸드오프, 상태 관리, 워크플로 설계로 이주했다.

혁신은 타이밍의 함수다. 2023년 말에 나는 멀티 에이전트 팟캐스트 엔진을 지었는데, 나중에 구글의 NotebookLM이 된 것과 토폴로지적으로 동일했다. 기술적으로는 작동했지만 상업적으로는 성립하지 않았다. 2023년에 GPT-4 호출 네 개를 이어 붙인다는 것은 견디기 힘든 지연과 깨지기 쉬운 json 핸드오프를 뜻했다. 구글이 12개월 뒤 같은 개념으로 성공했을 때, 그것은 한 가지 중대한 교훈을 입증했다. 오케스트레이션 제품은 약한 토대를 메우려 할 때 실패한다. 그것은 바탕에 깔린 지능(1층)이 유틸리티로 다룰 만큼 값싸고 빠르고 믿을 만해질 때에야 성공한다.

오늘날 논쟁은 어느 모델인가에서 어떻게 그것들을 엮는가로 옮겨 갔다.

결정론적 통제(상태 기계)는 워크플로를 엄격한 방향성 비순환 그래프(DAG)로 다룬다. 예측 불가능성이 곧 버그인 고위험 환경(은행, 코딩)에서 쓰인다(예: LangGraph).
확률적 창발(멀티 에이전트 시스템)은 워크플로를 전문가들의 소셜 네트워크로 다룬다. 에이전트들은 합의가 설 때까지 대화한다. 해법으로 가는 길이 알려지지 않은 R&D와 딥 리서치 과제에서 쓰인다(예: AutoGen).

3층은 과제 분해를 풀지만 단단한 천장에 부딪힌다. 바로 시간적 근시다. 우리는 일회성 전문가를 지어 왔다. Ralph나 Devin 같은 진보된 장기 사고 루프조차 지금은 직렬화된 기억상실에 기댄다. 그것들은 로그 파일을 쓰고, 종료하고, 그 메모를 읽을 새 클론을 띄우는 식으로 작동한다. 지혜는 바깥에 남아 텍스트 파일에 갇혀 있을 뿐 모델에 있지 않다. 이 에이전트들은 곱씹지도, 무의식중에 처리하지도, 진화하지도 못한다. 그저 맥락을 다시 적재할 뿐이다. 과제를 푸는 데서 임무를 수행하는 데로 옮겨 가려면 우리는 외부화된 로그를 내부화된 상태로 바꾸어야 한다. 이것이 4층으로의 오름을 불가피하게 만든다.

4층, 장기 인지

업계는 상태 없는 지능에서 상태를 지닌 인지로 방향을 틀고 있다. 4층은 엔지니어가 몇 주에 걸쳐 사고의 흐름을 붙들어 가는 능력을 아키텍처로 그대로 옮겨 낸다. 그것은 AI를 반응형 엔진(시스템 1)에서, 추상적 목표를 지닌 지속적 인지 개체로 옮긴다.

우리는 추론 밀도(1층)와 인지 폭(4층)을 구별해야 한다.

1층(모델): 어려운 수학 문제를 30초 만에 풀 수 있다.
4층(아키텍처): 제품 출시를 30일에 걸쳐 풀어낼 수 있다. 가장 똑똑한 추론 모델조차 여전히 일회성 전문가다. 4층은 세션 리셋을 넘어 자아가 살아남도록 보장하는 상태 관리자다.

지금의 기억은 환상이다. RAG는 그저 일기를 쓰고 읽는 것과 비슷한 로깅일 뿐이다. 진짜 생물학적 기억은 구조적이다. 어떤 기술을 배울 때 당신은 그저 텍스트 요약을 쓰지 않는다. 시냅스의 파라미터가 바뀐다. 4층에 이르려면 우리는 읽기/쓰기에서 가소성을 지닌 아키텍처로 옮겨 가야 한다.

작업 기억(잠재 상태): 정적 토큰 윈도를 넘어, 턴을 가로질러 지속하는 압축된 고차원 잠재 상태를 지닌 미분 가능한 맥락으로.
일화 기억(그래프): 그저 검색된 텍스트 조각이 아니라, 결정과 결과로 이루어진 구조화된 지식 그래프.
절차 기억(파라미터 로그): 엔지니어링 최전선이다. 요령을 프롬프트로 건네는 대신 우리는 테스트 시점 훈련(TTT)이나 동적 LoRA 어댑터를 활용한다. 에이전트는 임무가 지속되는 동안 자기 파라미터를 국소적으로 갱신함으로써 말 그대로 배운다.

5층, 조직 워크플로

4층이 개인의 뇌라면 5층은 조직의 마음이다. 이 층은 과제 실행에서 전략적 오케스트레이션으로 옮겨 가는 전환을 나타낸다. 잘 굴러가는 회사에서 성과는 제품과 영업과 엔지니어링 사이의 보이지 않는 정렬에 달려 있다. 5층은 이 조직 상태 기계를 복제하는 아키텍처다.

SaaS에서 Service-as-Software(소프트웨어가 곧 서비스를 수행하는 모델)로의 전환은 이미 일어나고 있다. 우리는 사람을 위한 도구를 짓는 데서 그 일을 직접 해내는 시스템을 짓는 데로 옮겨 가고 있다. 이는 우리가 코드라 여기는 것의 근본적 확장을 요구한다. 병목은 더 이상 기술적 정확성(돌아가는가?)이 아니라 도메인 충실도다. 엔터프라이즈 영업 같은 복잡한 워크플로를 자동화하려면 시스템은 미묘한 인센티브, 협상의 동역학, 조직적 마찰을 비롯한 비즈니스 동역학을 담아내야 한다. 과제는 비즈니스 리더의 직관을 실행 가능한 토폴로지로 성공적으로 인코딩하는 일이다. 알고리즘이 곧 조직이다.

비즈니스는 숨은 의존성을 품은, 긴 시간에 걸친 다중 에이전트 게임이다. 프롬프트(제품을 출시하라)는 법무와 마케팅 사이의 교착을 무시하기에 실패한다. 5층은 이를 재귀적 목표 분해로 푼다.

전략 노드: Q4 목표를 월별 마일스톤으로 쪼갠다.
의존성 해소: 시스템은 마케팅이 제품의 UI가 끝나기 전에는 시작할 수 없음을 식별하고 일정을 자율적으로 협상한다.
반사실 시뮬레이션: 조직의 시스템 2. 실행에 앞서 세계 모델 시뮬레이션을 6개월 앞으로 돌린다.

이는 또 하나의 흥미로운 과제, 곧 진실을, 다시 말해 우주 사건 원장을 어떻게 설계할 것인가를 불러낸다. 다양한 에이전트 50개를 어떻게 정렬된 채로 유지할까? 우리는 대화에 기댈 수 없다. 우리에게는 공유된 진실이 필요하다. 한 후보는 이벤트 소싱 아키텍처를 본뜬 조직 피질이다.

원장: 모든 전략적 움직임은 변경 불가능한 트랜잭션이다(Product_Shipped_v1.2, Marketing_Started_Campaign).
거버넌스 층: 이는 Policy-as-Code를 가능하게 한다. PR_Agent가 게시하기 전에 원장은 그 텍스트를 Legal_Policy_Vector에 비추어 검증한다. 그것은 그저 데이터베이스가 아니다. 회사 전체에 걸친 분열된 실행을 막는 중추 신경계다.

6. AI/ML 엔지니어를 위한 함의

머신러닝 엔지니어에게 추상화의 위계는 방향 전환을 요구한다. 물음은 더 이상 *모델을 훈련할 수 있는가?*가 아니라 *당신은 인지의 어느 층을 최적화하고 있는가?*다.

6.1. 모델링의 미래: 규모에서 특정성으로

벤치마크 점수로 경쟁하는 대신 ML 엔지니어는 아키텍처적 특화에 더 집중할 것이다.

내재화된 시스템 2: 포워드 패스를 넘어서는 아키텍처를 연구하여, 에이전트 루프 자체를 파라미터 속에 구워 넣는 일.
텍스트에서 행위로: 우리는 고품질 인간 텍스트를 사실상 소진했다. 다음 지수 곡선은 행위 데이터, 곧 환경과 성공적으로 상호작용한 에이전트의 궤적에 있다. 앞으로 12개월에 걸쳐 이 데이터는 폭발할 것이다. 모델은 자기회귀적 json 생성을 우회하는 전용 행위 인코더를 진화시켜, 이산적 행위 포인터나 제어 벡터를 직접 예측할 것이다. 이는 행함을 말함과는 구별되는 별개의 양식으로 다룬다.
전문가 추론의 깊은 정렬: 법률 텍스트(어휘)로 모델을 미세 조정하는 것으로는 부족하다. 최전선은 보상 모델을 통해 추론 토폴로지를 바꾸는 일이다. 우리는 변호사가 무엇을 아는지 배우는 데서, 변호사가 위험을 어떻게 가늠하는지 배우는 데로 옮겨 가며, 그저 전문 용어가 아니라 그 도메인의 직관을 공유하는 모델을 만든다.

6.2. 인지 설계자

이 역할은 분산 시스템과 인지 과학을 결합한다. 목표는 비즈니스 도메인과 독립적으로 에이전트의 마음, 곧 사고의 구조를 구축하는 일이다.

인식론적 엔지니어링: 시스템이 어떻게 알고 어떻게 잊는지를 설계하는 일. 이는 에이전트가 몇 달에 걸쳐 정체성과 맥락을 유지하도록 위계적 기억 시스템(단순한 RAG를 넘어 그래프 기반 일화 기억으로)을 설계하는 일을 요구한다.
상태 직렬화: 상태 지속 문제를 푸는 일. 사고의 흐름을 데이터베이스에 직렬화했다가 24시간 뒤 맥락 손실 없이 다시 불러오려면 어떻게 해야 할까? 이는 사실상 지능을 재웠다가 깨우는 일, 곧 절전과 복귀(hibernate/resume)다.
메타 최적화: 다른 에이전트를 최적화하는 메타 에이전트를 짓는 일. 이는 에이전트 시스템의 자동화된 설계로, 엔지니어가 적합도 함수를 정의하면 시스템이 최적의 그래프 토폴로지를 반복적으로 탐색한다.

6.3. 버티컬 설계자

이 역할은 깊은 도메인 전문성과 워크플로 엔지니어링을 결합한다. 목표는 지저분하고 사람 중심적인 산업 워크플로를 결정론적 AI 그래프로 옮기는 일이다.

인지 매핑: 노련한 특허 변호사 옆에 앉아 그의 직관을 50개의 이산적 인지 단계로 분해하고, 그것을 토폴로지로 매핑하는 일
평가 주도 개발: 비즈니스 로직을 위한 단위 테스트를 만드는 일. 버티컬 설계자는 버티컬별 끝에서 끝까지 워크플로를 위한 평가 파이프라인을 짓는다.
핸드오프 설계: 인간 개입 마찰점을 설계하는 일. 자동화 루프를 망가뜨리지 않으면서 신뢰를 극대화하려면 정확히 언제 통제를 인간에게 넘겨야 하는지 아는 일.

7. 기업을 위한 함의

이 지형을 헤쳐 가는 기업에게 앞으로의 과제는 API나 도구를 사들여 AI를 도입하는 일을 한참 넘어선다. 그것은 프로세스를 다시 배선하여 인지를 통합하는 일이다.

7.1. 새로운 데이터 해자: 지식 베이스에서 행위 텔레메트리로

대다수 기업은 자기 경쟁 해자가 정적인 문서와 지식 베이스에 있다고 잘못 믿는다. 2026년에 텍스트는 상품이다. 진짜 해자는 행위 텔레메트리, 곧 매뉴얼이 부족할 때 당신의 전문가가 어떻게 문제를 푸는지에 관한 세밀한 기록이다. 가치를 잡아내려면 문서로 훈련하는 데서 결정으로 미세 조정하는 데로 옮겨 가야 한다. 고위 임원이 위기를 다룰 때 시스템은 그 결정의 궤적을 기록해야 한다. 어떤 기준이 쓰였는지, 어떤 휴리스틱이 적용되고 어떤 데이터가 무시되었는지, 그가 모호함을 어떻게 헤쳐 나갔는지를. 이 인간 행위 프로토콜은 4층 인지의 훈련 데이터가 되어, 사실상 전문가의 판단을 배우고 끌어올린다.

7.2. 프로토콜 디지털화: 회사의 방식을 인코딩하기

모든 조직은 그림자 프로토콜, 곧 실제로 일을 해내지만 공식 정책과 어긋나기 일쑤인 적히지 않은 휴리스틱과 부족적 지식 위에서 돌아간다. 버티컬 설계자의 역할은 이 그림자 프로토콜을 추적해 결정론적 가드레일로 단단히 굳히는 일이다. 이 과정은 기업 문화를 코드로 바꾼다. 인간의 직관을 실행 가능한 그래프로 매핑함으로써 기업은 사실상 자기 비즈니스 로직을 버전 관리한다. 이로써 최고의 직원이 가장 잘하는 날 보여 주는 높은 판단의 성과가 조직 전체의 기준선이 된다.

8. 정부를 위한 전략적 함의

AI를 선도하려는 한국의 야심은 분명하며, 상당한 자본 투입이 그것을 뒷받침한다. 그러나 엔지니어링 관점에서 보면 지금의 전략은 스택의 잘못된 층을 최적화할 위험이 있다. 다음 10년을 지키려면 우리는 가치가 실제로 쌓이는 곳을 반영하도록 주권 AI(Sovereign AI) 명제를 다듬어야 한다.

8.1. 풀스택 주권.

기반 모델은 필수적인 국가 인프라다. 그러나 2026~2030년의 경제적 잉여는 스택 위쪽으로 이주하고 있다. 날것의 지능(1층)은 상품화된 유틸리티가 되어 가고 있다. 우리에게는 이중 트랙 접근이 필요하다. 경쟁력 있는 국내 1층(기반)을 유지하되, 시장과 기술이 무르익을수록 4층과 5층으로 방향을 틀어야 한다. 우리는 전기를 생산하는 데서 엔진을, 그리고 산업 스택을 제조하는 데로 나아가야 한다.

8.2. 디지털화 경쟁.

2030년이면 정부와 산업의 완전한 디지털화는 전 지구적 필연이다. 경제적 우위를 가르는 변수는 이 일이 일어나느냐가 아니라 언제냐다. 한국의 비교 우위는 속도다. 우리는 국가의 법률적, 행정적, 산업적 텔레메트리를 오늘 깨끗하고 훈련 가능한 말뭉치로 디지털화해야 한다. 이것이 시간 기반 해자를 만든다. 다른 나라들이 아날로그적 마찰에 발목 잡혀 있는 동안, 한국의 에이전트들은 우리만의 독특한 산업 지형을 지연 없이 헤쳐 갈 것이다.

8.3. 거버넌스의 운영 체제.

전자정부에서 쌓아 온 한국의 유산은 강하지만, 다음 최전선은 자율 공공 인프라, 사실상 거버넌스의 리눅스다. 미국 같은 나라들이 자율 규제 프레임워크를 실험하는 동안, 한국의 촘촘한 디지털 인프라는 우리가 더 빨리 움직이도록 허락한다. 세금, 관세, 비자 처리를 위한 표준화된 에이전트 모듈을 개발하면서. 일단 국내에서 검증되고 나면 이 스택은, 서구의 낡은 관료제를 건너뛰는 현대적 국가 인프라를 찾는 신흥 경제에 고부가가치 수출품으로 변모한다. 우리는 그저 하드웨어(배와 칩)를 수출하던 데서 현대 국가의 운영 체제를 수출하는 데로 진화해야 한다.

결론

컴퓨팅의 역사는 솟아오르는 추상화로 규정된다. 우리는 지능을 최적화하는 데서 그것을 설계하는 데로 방향을 틀고 있다. 모델은 여전히 핵심으로 남지만, 진짜 일은 에이전트 토폴로지, 인지, 워크플로 설계로 옮겨 갔다. 다음 10년은 파라미터의 확률과 세계의 요구 사이를 잇고, 인간과 AI의 협업을 위한 새 기준을 세울 줄 아는 빌더들의 것이다. 발전소가 손안에 있으니, 이제 엔진을, 그리고 그 위에서 돌아갈 경제를 지을 때다.

Link to slide