Agentmemory
AGENTMEMORY: Die lokale Speicher-Ebene für KI-Coding-Agenten – Null Datenbank-Abhängigkeiten, Millisekunden-Recall.
AGENTMEMORY ist eine leistungsstarke, lokale Memory-Ebene für Coding-Agenten, die ohne externe Datenbanken wie Redis oder Postgres auskommt. Mit Triple-Stream-Retrieval (BM25, Vektor, Graph) und 12 automatischen Hooks ermöglicht AGENTMEMORY eine Retrieval-Rate von 95,2 % und reduziert die Token-Nutzung pro Sitzung um 92 %. Es bietet eine nahtlose Integration für Tools wie Claude Code, Cursor und Windsurf sowie 51 native MCP-Tools für maximale Kontrolle.
2026-05-18
--K
Agentmemory Produktinformationen
AGENTMEMORY: Die ultimative Memory-Ebene für Ihre Coding-Agenten
In der modernen Softwareentwicklung sind KI-gestützte Coding-Agenten unverzichtbar geworden. Doch ein entscheidendes Puzzleteil fehlte bisher oft: ein zuverlässiges, schnelles und lokales Gedächtnis. Hier setzt AGENTMEMORY an. Als spezialisierte Speicher-Ebene bietet AGENTMEMORY genau das System, das Ihr Coding-Agent vom ersten Tag an hätte haben sollen. Erfassen Sie jede Sitzung, rufen Sie Informationen in Millisekunden ab und führen Sie das gesamte System überall aus – ganz ohne die Komplexität externer Datenbanken.
Was ist AGENTMEMORY?
AGENTMEMORY ist kein einfacher Vektorspeicher oder eine simple Bibliothek. Es handelt sich um eine vollständige Memory-Runtime, die speziell für die Anforderungen von Coding-Agenten entwickelt wurde. Basierend auf der leistungsstarken iii Engine, arbeitet AGENTMEMORY als ein einziger Prozess. Das bedeutet für Sie: Kein Redis, kein Kafka, kein Postgres und kein Neo4j. Der gesamte Stack läuft lokal auf Ihrer Maschine und speichert Daten direkt auf der Festplatte als JSON.
Die Architektur von AGENTMEMORY basiert auf drei primitiven Säulen, die ohne die übliche "Framework-Steuer" auskommen:
- Hooks: 12 automatische Erfassungshooks sind direkt in den Agenten integriert. Jeder Tool-Aufruf, jeder Prompt und jeder Stop wird zu einer komprimierten Beobachtung.
- Recall: Ein Triple-Stream-Retrieval-System kombiniert BM25, Vektoren und Wissensgraphen. Die Ergebnisse werden direkt auf dem Gerät neu bewertet (Reranking), mit einer P50-Latenz von unter 20 ms auf einem Standard-Laptop.
- Consolidate: Stündliche Sweeps komprimieren rohe Beobachtungen in semantische Erinnerungen. Duplikate werden zusammengeführt, veraltete Daten abgebaut und bei jedem Löschvorgang wird ein Audit-Log erstellt.
Herausragende Features von AGENTMEMORY
AGENTMEMORY bietet eine beeindruckende Liste an Funktionen, die darauf ausgelegt sind, die Effizienz und Genauigkeit Ihrer Coding-Agenten massiv zu steigern.
1. Triple-Stream Recall & Wissensgraph
Das Herzstück von AGENTMEMORY ist die hybride Suche. Durch die Kombination von lexikalischen (BM25), semantischen (Vektor) und relationalen (Graph) Scores erreicht das System eine Retrieval-Rate von 95,2 % (R@5) im LongMemEval-S Benchmark. Der integrierte Wissensgraph extrahiert Entitäten und Relationen während der Kompression und unterstützt zeitliche Kanten (Temporal Edges).
2. Massive Token-Ersparnis
Durch die intelligente Konsolidierung von Sitzungsdaten sorgt AGENTMEMORY für 92 % weniger Input-Token pro Sitzung. Dies senkt nicht nur die Kosten bei der Nutzung von LLM-Providern, sondern erhöht auch die Verarbeitungsgeschwindigkeit Ihres Agenten.
3. Umfangreiche Tool-Landschaft
Mit 51 MCP-Tools (Model Context Protocol) bietet AGENTMEMORY eine gewaltige Oberfläche für Funktionen wie memory_save, memory_recall, memory_smart_search und mehr. Zusätzlich stehen 121 REST-Endpunkte zur Verfügung, sodass Sie das System via Curl, Browser oder Proxy ansteuern können.
4. Volle Observability & UI
AGENTMEMORY liefert zwei erstklassige Benutzeroberflächen direkt mit:
- Viewer (Port 3113): Ein Echtzeit-Stream für Beobachtungen, ein Sitzungs-Explorer zur Wiedergabe vergangener Sessions und eine Visualisierung des Wissensgraphen.
- III Console (Port 3114): Ein Dashboard auf Engine-Ebene für Funktionen, Trigger und OpenTelemetry (OTEL) Spans.
5. Föderation & Export
Das System unterstützt Mesh Federation via Peer-to-Peer-Synchronisation über authentifiziertes HTTPS. Zudem können Erinnerungen direkt in einen sandboxed Obsidian-Vault exportiert werden, inklusive Frontmatter-Tags für die Obsidian-Graph-Ansicht.
Use Case: AGENTMEMORY im Einsatz
Stellen Sie sich vor, Sie arbeiten an einem komplexen Projekt mit einem Agenten wie Claude Code oder Cursor. Normalerweise verliert der Agent nach einigen Sitzungen den Kontext oder verbraucht Unmengen an Token, um sich an frühere Entscheidungen zu erinnern.
Mit AGENTMEMORY ändert sich dieser Workflow:
- Sitzungswiederherstellung: Importieren Sie Claude Code JSONL-Transkripte, und AGENTMEMORY rehydriert die gesamte Sitzung inklusive aller Beobachtungen und Tool-Nutzungen.
- Projektübergreifendes Gedächtnis: Der Agent greift auf semantische Erinnerungen aus früheren Projekten zu, erkennt wiederkehrende Muster und schlägt bewährte Lösungen vor.
- Lokale Kontrolle: Da alle Daten lokal bleiben, ist AGENTMEMORY ideal für sicherheitskritische Projekte, bei denen keine Daten in externe Cloud-Datenbanken abfließen dürfen.
Installation und How to Use
Die Einrichtung von AGENTMEMORY ist denkbar einfach und erfordert nur wenige Schritte.
Schritt 1: Installation
Installieren Sie das Paket global über NPM, um den Befehl agentmemory in Ihrem Pfad zu haben:
npm install -g @agentmemory/agentmemory
Schritt 2: Server starten
Starten Sie den Memory-Server auf Ihrer lokalen Maschine:
agentmemory
Der Server läuft standardmäßig auf Port 3111, während der Viewer auf Port 3113 erreichbar ist.
Schritt 3: Demo ausführen
Um die Funktionsweise des hybriden Suchsystems zu testen, können Sie die Demo starten, die automatisch drei Beispielsitzungen erstellt:
agentmemory demo
Integration in Agenten (Universal MCP JSON)
Für Agenten wie Claude Desktop, Cursor oder Windsurf können Sie die folgende Konfiguration in Ihre MCP-Einstellungen einfügen:
{
"mcpServers": {
"agentmemory": {
"command": "npx",
"args": ["-y", "@agentmemory/mcp"],
"env": {
"AGENTMEMORY_URL": "http://localhost:3111"
}
}
}
}
Vergleich: AGENTMEMORY vs. andere Lösungen
| Feature | AGENTMEMORY | Mem0 | Letta | Cognee | | :--- | :--- | :--- | :--- | :--- | | Retrieval R@5 | 95,2 % | 81,4 % | 73,8 % | 78,1 % | | Externe Abhängigkeiten | 0 | 2 (Qdrant, Neo4j) | 1 (Postgres) | 1 (Neo4j) | | REST Endpunkte | 121 | — | — | — | | MCP Tools | 51 | 12 | 18 | 9 | | Auto-Hooks | 12 | 0 | 0 | 0 |
Häufig gestellte Fragen (FAQ)
Benötigt AGENTMEMORY eine Internetverbindung? Nein. AGENTMEMORY läuft vollständig lokal auf Ihrer Maschine. Eine Internetverbindung wird nur benötigt, wenn Sie externe LLM-Provider wie Anthropic oder Gemini für die semantische Konsolidierung nutzen.
Welche LLM-Provider werden unterstützt? Standardmäßig ist Claude vorkonfiguriert. Sie können jedoch auch die Anthropic API, Gemini, MiniMax oder OpenRouter verwenden. Diese werden automatisch aus Ihren Umgebungsvariablen erkannt.
Wie sicher sind meine Daten? Da AGENTMEMORY keine externen Datenbanken nutzt, bleiben alle Informationen in Ihrem lokalen Dateisystem. Bei der Peer-to-Peer-Synchronisation (Federation) ist zudem ein Bearer-Token erforderlich.
Ist AGENTMEMORY Open Source? Ja, AGENTMEMORY ist unter der Apache-2.0 Lizenz lizenziert und wird offen entwickelt.
Mit AGENTMEMORY erhalten Coding-Agenten endlich das Langzeitgedächtnis, das sie für komplexe Aufgaben benötigen – effizient, sicher und blitzschnell.








