home

Asynchron arbeitende Coding‑Agenten: DIY-Lösungen für Flexibilität und Sicherheit

Key Takeaway

Ein selbstgebauter, asynchroner Coding‑Agent kann mithilfe von Slack-, Github‑ und Modal‑Funktionen problemlos in der Cloud laufen und ist damit keine alleinige Differenzierung mehr für Anbieter von Coding‑Agenten.

Summary

Das Thema dreht sich um asynchron arbeitende Coding‑Agenten, also KI‑gestützte Agenten, die im Hintergrund laufen und ihre Ergebnisse später liefern. Benjamin Anderson erklärt, dass Modelle wie Claude Sonnet 3.5 oder GPT‑4o die Arbeit solcher Agenten ermöglicht haben, ohne perfekte Genauigkeit zu benötigen, solange Kosten und Zeit für Token und Prüfung vorhanden sind. Die Nachfrage nach Hintergrund‑Agents hat seit 2023 stark zugenommen; die Herausforderung ist nun, Aufgaben zu formulieren, zwischen Aufgaben umzuschalten und Ergebnisse zu testen. Existierende Cloud‑Agenten (Codex Web, Claude Code Web, Jules) und Produkte wie Cursor oder OpenAI/Anthropic/Google sind funktional, werden aber von Nutzern oft als unzuverlässig empfunden und bieten wenig Flexibilität. Anderson argumentiert, dass eigene Implementierungen von Vorteil sind, weil man Modelle und Tools beliebig kombinieren, zusätzliche Features (MCPs, Tools, Dateien, Code‑Ausführung) integrieren und die Sicherheit steuern kann. Durch ein DIY‑Projekt wurde ein System aufgebaut, das Slack für Trigger, ein GitHub‑App für Rechteverwaltung, serverlose Modal‑Funktionen für Orchestrierung und Agentenlauf sowie Claude‑Code/Codex im Headless‑Modus nutzt. Der Orchestrator-Container authentifiziert sich, sorgt für GitHub‑Token mit beschränkten Rechten und startet einen Agent‑Container mit klarem Arbeitsverzeichnis (entweder leer, oder aus einem Repository kloniert). Die ersten Iterationen hatten Probleme: Fehlende Rechte für Git‑Operationen, geteilte Speicherbereiche, fehlende Sichtbarkeit der Agentenoutputs. Lösungen: Vorab definierte Allowlist für Git‑Bash‑Befehle, Nutzung von Modal‑Sandboxes für isolierten Speicher, Übergabe von pty‑Option für headless‑Claude-Code, JSON‑Streaming der Logs, und Erstellung des CCViewer‑UI für Live‑Monitoring. CCViewer stellt JSONL‑Logs über einen HTTP‑Server bereit und visualisiert Aktionen von Claude‑Code/Codex. Der Viewer ist öffentlich, speichert Daten nicht, muss aber mit Vorsicht verwendet werden. Der Aufbau zeigte, dass solche Agenten mit ca. einem Tag bis einer Woche bis zur nutzbaren Version realisierbar sind. Anderson betont, dass der Nutzen eines cloud‑basierenden Agenten nicht mehr nur das “Running on the Cloud” ist, sondern echte Funktionalität, Sicherheit und Anpassbarkeit. Die Basis, die zu schlagen gilt, sind etablierte Produkte wie Claude Code und Codex. Abschließend glaubt er, dass Firmen wie Cognition und Cursor ihre eigenen Agenten und Modelle weiter optimieren werden und die Landschaft bis 2026 stark verändert sein wird.

Related queries:

Wie funktioniert die Integration von Slack und GitHub für einen asynchronen Coding Agenten?
Welche Sicherheitsmaßnahmen sind notwendig, wenn ein Agent in der Cloud zugriff auf GitHub-Repositories erhält?
Wie kann man die JSON‑Logs eines Coding Agenten in Echtzeit visualisieren?

Quelle: https://benanderson.work/blog/async-coding-agents/