-
에이전트는 왜 매번 처음부터일까? — AI 기억 보조 MCP 서버 Memento 소개MEMENTO 2026. 2. 25. 23:59반응형
챗봇에게 "지난주에 말한 그 API 키 위치 다시 알려줘"라고 하면, 대부분의 에이전트는 묵묵부답이거나 "이전 대화는 기억하지 못합니다"라고 답한다. 세션만 바뀌어도 컨텍스트가 사라진다. 에이전트에게는 '기억'이 없기 때문이다. 이 글에서는 그 문제를 인정하고, 사람의 기억 구조를 모방한 Memento라는 MCP 서버로 에이전트에 지속적인 기억을 붙이는 방법을 소개한다.
문제: 에이전트는 매 대화가 첫 만남이다
- 세션 의존: 대화가 끊기면 이전 맥락이 전부 사라진다.
- 반복 설명: 프로젝트 규칙, 선호 설정, 과거 결정을 매번 다시 말해야 한다.
- 일관성 부족: 어제 추천한 방식과 오늘 추천이 달라질 수 있다.
즉, 기억이 없으니 매번 "처음부터" 대화하는 것과 다르지 않다. 사람이라면 당연히 기억할 일들을 에이전트는 저장·검색할 수단이 없었다.
해결 방향: 에이전트 전용 "기억 서버"
Memento는 Model Context Protocol(MCP) 기반의 기억 보조 서버다. 에이전트(또는 Cursor, Claude Desktop 같은 클라이언트)가 Memento에 연결하면:
- remember — 중요한 내용을 기억으로 저장
- recall — 질의로 관련 기억을 검색해 가져옴
- memory_injection — 현재 질의에 맞는 컨텍스트를 자동으로 주입
같은 도구들을 쓸 수 있다. 기억은 로컬 DB(SQLite)에 저장되며, 세션과 무관하게 유지된다.
사람의 기억 모델을 따르는 네 가지 타입
Memento는 심리학에서 말하는 기억 분류를 모사해 네 가지 타입을 지원한다.
타입 용도 유지 기간 작업기억 (working) 지금 하고 있는 일, 임시 메모 48시간 일화기억 (episodic) "언제 무슨 일이 있었는지" 경험·사건 90일 의미기억 (semantic) 지식, 사실, 재사용 가능한 정보 무기한 절차기억 (procedural) 절차, 방법, runbook 무기한 - 회의에서 나온 결정 → 일화기억 + 태그
meeting,decision - 팀의 코딩 컨벤션 → 의미기억 + 태그
best-practice - 배포 절차 → 절차기억 + 태그
procedure
이렇게 나누어 저장하면, recall 시 "지식만", "최근 경험만", "지금 작업 중인 것만"처럼 목적에 맞게 가져올 수 있다.
어떻게 찾아오나: 하이브리드 검색과 랭킹
기억이 많아지면 "뭐가 더 관련 있는지" 순서를 정해야 한다. Memento는 관련성 + 최근성 + 중요도 + 사용 이력을 한 번에 반영하는 랭킹 공식을 쓴다.
- 관련성: 임베딩 유사도, 키워드(BM25), 태그·타이틀 매칭
- 최근성: 오래된 기억일수록 점수 감쇠 (반감기 기반)
- 중요도: 사용자가 핀을 꽂거나, 타입별로 부스트를 줄 수 있음
- 중복 패널티: 비슷한 내용이 여러 개 나오지 않도록 다양성(MMR) 적용
그래서 "그 API 키 위치"처럼 모호한 질의도, 과거 대화에서 저장해 둔 기억을 recall로 불러오면 에이전트가 다시 답할 수 있다.
5분 안에 써보기: Cursor에서 Memento 연결
- 저장소 클론 및 빌드
git clone https://github.com/your-org/memento.git cd memento && npm install && npm run build - Cursor MCP 설정
Cursor 설정 또는.cursor/mcp.json에 Memento 서버를 추가한다.command는node,args는dist/server/index.js경로,env에DB_PATH등 필요 시 지정. (상세: Cursor MCP 설정 가이드) - 대화에서 사용
- "이 대화 요약해서 기억해줘" → 에이전트가 remember 호출
- "아까 말한 설정 다시 알려줘" → 에이전트가 recall 후 답변
에이전트가 Memento 도구를 호출하도록 프롬프트나 에이전트 설정에서 "작업 전 recall, 작업 후 remember" 같은 룰을 두면 더 일관되게 동작한다.
요약
- 문제: 에이전트는 세션 단위라 기억이 없어, 매번 처음부터 대화하는 것과 같다.
- 해결: Memento MCP 서버로 remember / recall / memory_injection을 두어, 로컬에 기억을 저장하고 검색·주입할 수 있다.
- 차별점: 작업·일화·의미·절차 기억을 구분하고, 관련성·최근성·중요도를 반영한 랭킹으로 "맞는 기억"을 가져온다.
다음에 할 일
- 저장소: Memento GitHub 에서 코드와 이슈 확인
- 문서: 사용자 매뉴얼, Cursor MCP 설정
- 실험: Cursor에서 Memento를 붙인 뒤, 한 번 remember로 저장하고 다른 세션에서 recall로 불러와 보자. "에이전트가 기억한다"는 경험을 직접 느끼는 게 다음 스텝이다.
에이전트가 매번 처음이 아니라, "지난번 이야기 기억해?"부터 시작하는 날을 위해.
반응형'MEMENTO' 카테고리의 다른 글
MCP 기반 장기 기억 시스템 아키텍처: “저장”이 아니라 “기억”을 설계하는 법 (0) 2026.02.17 AI 에이전트의 자기 객관화: memento '메타 메모리' 구현기 (0) 2026.01.14 RAG의 한계를 넘어서: Memento가 MIRIX 기반의 6계층 메모리를 선택한 이유 (0) 2025.11.25 AI에게 기억을 선물하다 (0) 2025.11.08