Part 2에서는 에이전트 시스템이 단순히 작업을 수행하는 것을 넘어, 정보를 기억하고, 스스로 발전하며, 외부 시스템과 표준화된 방식으로 소통하고, 목표를 향해 주도적으로 나아가는 고급 기능들을 다루고 있습니다.
Chapter 8 Memory Management
이 챕터에서는 에이전트가 단발성 상호작용을 넘어 장기적인 일관성을 유지하기 위해 어떻게 메모리를 관리하는지 설명합니다.
• 두 가지 메모리 유형:
◦ Short-Term Memory (Contextual Memory): 현재 대화의 맥락(Context)을 유지하는 작업 기억입니다. LLM의 컨텍스트 윈도우(Context Window) 내에서 관리되며, 대화가 끝나면 사라지는 휘발성 정보입니다.
◦ Long-Term Memory (Persistent Memory): 대화 세션을 넘어서 지속되는 지식입니다. 벡터 데이터베이스(Vector Database) 등을 사용해 외부 저장소에 보관하며, 필요할 때 검색(Retrieval)하여 사용합니다.
• 구현 방식 (Google ADK 예시):
◦ Session : 개별 채팅 스레드를 추적합니다.
◦ State : 현재 대화 내에서 유효한 임시 데이터를 딕셔너리 형태로 저장합니다 (예: 사용자 이름, 현재 주문 상태 등),.
◦ Memory : 과거의 여러 상호작용에서 얻은 정보를 장기 저장소에 보관하고 검색할 수 있게 합니다.
Chapter 9 Learning and Adaptation
에이전트가 고정된 규칙을 따르는 것을 넘어, 경험과 데이터를 통해 스스로 성능을 개선하는 방법을 다룹니다.
• 핵심 메커니즘: 강화 학습(Reinforcement Learning)을 통해 보상을 최대화하거나, 사람의 피드백을 통해 학습합니다. 특히 Proximal Policy Optimization(PPO) 와 Direct Preference Optimization(DPO) 같은 알고리즘을 사용하여 모델이 급격한 성능 저하 없이 안정적으로 학습하도록 돕습니다,.
• 사례 연구 - SICA (Self-Improving Coding Agent): 스스로 코드를 작성하고, 그 성능을 평가한 뒤, 자신의 소스 코드를 직접 수정하여 더 나은 버전을 만들어내는 에이전트입니다. 이는 에이전트가 외부의 훈련 없이도 자체적으로 진화할 수 있음을 보여줍니다.
• 적응의 중요성: 정적인 환경이 아닌, 끊임없이 변화하는 환경에서 에이전트가 새로운 상황에 대처하고 개인화된 서비스를 제공하기 위해서는 학습과 적응이 필수적입니다.
Chapter 10 Model Context Protocol (MCP)
LLM이 외부 세계(데이터, 도구)와 연결되는 방식을 표준화하는 개방형 프로토콜(Open Standard)에 대해 설명합니다.
• 문제점: 기존에는 각 LLM마다 외부 도구나 데이터베이스를 연결하는 방식이 제각각이라 통합이 복잡했습니다.
• MCP : "USB-C 포트"처럼 모든 시스템에 적용 가능한 범용 연결 방식입니다. 클라이언트-서버 구조로 작동하며, MCP 서버가 도구(Tools)나 리소스(Resources)를 노출하면, MCP 클라이언트(LLM)가 이를 동적으로 발견하고 사용할 수 있습니다,.
• MCP 장점: 개발자는 한 번만 MCP 서버를 구축하면 다양한 LLM 애플리케이션(Claude, IDE 등)에서 해당 데이터나 도구를 즉시 사용할 수 있어 확장성과 재사용성이 크게 향상됩니다.
Chapter 11 Goal Setting and Monitoring
에이전트가 단순한 반응형 시스템에서 벗어나, 명확한 목적을 가지고 주도적으로 행동하게 만드는 패턴입니다.
• 목표 설정 (Goal Setting): 에이전트에게 "무엇을 달성해야 하는지" 명확하고 측정 가능한 목표(SMART Goals)를 부여합니다. 예를 들어 "비행기 표 예매"라는 목표를 위해 에이전트는 출발지, 목적지, 예산 등을 파악하고 계획을 세웁니다,.
• 모니터링 (Monitoring): 에이전트가 목표를 달성해가는 과정을 추적합니다. 단순히 코드를 생성하는 것뿐만 아니라, 생성된 코드가 품질 기준을 충족하는지 스스로 검토(Self-Review)하고, 부족하다면 다시 시도하는 피드백 루프를 포함합니다.
• 중요성: 복잡하고 다단계로 이루어진 작업을 자율적으로 수행하기 위해서는, 에이전트가 자신의 현재 상태가 성공으로 가고 있는지 실패하고 있는지를 판단할 수 있어야 합니다
'지식 > AI' 카테고리의 다른 글
| AI - Agentic Design Patterns - Part 1 (0) | 2026.01.21 |
|---|---|
| AI - LLM 이란? (1) | 2026.01.21 |
댓글