AI-Agenten in der Cloud: Persistente Erinnerung mit Bun, Vercel AI SDK und Neptune PostgreSQL
Key Takeaway
Ein AI‑Agent kann mit persistenter Erinnerung aufgebaut und in der Cloud bereitgestellt werden, indem man Bun, TypeScript, das Vercel AI SDK und Neptune’s PostgreSQL‑Datenbank kombiniert.
Projektaufbau mit Bun
- Bun init wird benutzt, um ein Projekt zu starten; TypeScript läuft ohne Transpilation.
- Abhängigkeiten:
@ai-sdk/openai,ai,zod.
Agenten‑Erstellung
- Nutzung des Vercel AI SDK:
streamTextliefert einenResponse-Stream. - Modell
gpt-4o-minials Basis. - Definition von „Tools“ als funktionsbasierte Aktionen (z. B.
getCurrentTime). - Tools enthalten Beschreibungen und Zod‑Schemata zur Eingabevalidierung.
API‑Endpoint
- Ein einfacher HTTP‑Server mit
Bun.serve. /chat-Route erwartet POST‑Anfrage mitpromptodermessage.- Eingaben werden über ein Zod‑Schema validiert.
- Stream‑Response wird via
toTextStreamResponse()zurückgegeben. - Parameter
stopWhen: stepCountIs(10)begrenzt die Agentenschritte auf 10.
Testing
- Bash‑Skript zum Testen des Endpoints (
test-stream.sh). --no-bufferermöglicht Echtzeit‑Streaming im Terminal.
Persistente Erinnerung
- Datenbankintegration über Neptune.
- Neptune MCP wird installiert (
curl ... | bash) und in IDE (z. B. Cursor) konfiguriert. - Datenbank wird per natürlicher Sprache von Neptune erstellt (GitHub‑Authentifizierung erforderlich).
- Migration
001_create_memories.sql: einfache Tabellememoriesmitid,contentundcreated_at. - Index auf
created_atfür effiziente Abfragen.
Tool-Integration für Memory
- Tools werden dem Agenten hinzugefügt, um auf die
memories-Tabelle zuzugreifen und Erinnerungen zu speichern bzw. abzurufen.
Deployment
- Nach lokaler Testvalidierung wird der komplette Stack, inkl. Persistenzschicht, auf Neptune deployed, wo sowohl der Server als auch die Datenbank verwaltet werden.
Weiterführende Schritte
- Optionalere Modelle für komplexe Aufgaben, Anpassung der Schrittgrenze, weitere Tools implementieren, UI für Interaktion.
Related queries
- Wie erstelle ich einen Persistenzlayer für einen AI-Agenten in Bun?
- Auf welche Kosten kann ich bei der Nutzung von Neptune für ein Live-PostgreSQL-Database stoßen?
- Welche Alternativen zum Vercel AI SDK gibt es für das Streaming eines Chat-Antwort-Streams?
Quelle: Neptune Blog
