home

BrowserWing: Token‑Effiziente Browser‑Automatisierung für LLM‑Workflows

Key Takeaway

BrowserWing wandelt Browseraktionen in Model‑Context‑Protocol (MCP) Befehle um, sodass KI‑Modelle Browser schnell und token‑effizient steuern können, ohne mit langsamen LLM‑Interaktionen zu kämpfen.

Summary

Funktionsumfang
• Verwaltung von Browser‑Instanzen (Start, Kontrolle, Persistenz von Sessions über Cookies).
• Visuelles Aufzeichnen von Skripten (Klicks, Eingaben, Navigation, Bearbeitung).
• Umwandlung von Skripten in MCP‑Befehle für die Integration in LLM‑Workflows.
• Konfiguration von OpenAI, Claude, DeepSeek und weiteren Modellen zur Datenextraktion.

Hardware‑/Software‑Anforderungen
Google Chrome oder Chromium muss installiert und zugänglich sein.

Startoptionen
Option A – Release herunterladen (empfohlen).
• Binary für das Betriebssystem aus den Releases holen.
• Auf http://localhost:8080 zugreifen.
Option B – Build aus Source.
• Abhängigkeiten (Go + pnpm) installieren (make install).
• Embedded‑Binary bauen (make build-embedded).
• Ausführen (./build/browserwing --port 8080).
• Alternativ alle Ziele bauen (make build-all, make package).

Warum BrowserWing?
• Breites Ökosystem von Skripten für schnelle Aufgabe‑Lösung.
• Token‑effizientes Design, hohe Performance.
• Zuverlässige, wiederholbare Automatisierung komplexer Web‑Aufgaben.
• Brücke zwischen aufgezeichneten Aktionen und LLM‑gesteuerten MCP‑Befehlen.
• Stabilität durch Cookie‑ und Speicher‑Management.
• Geeignet für Daten‑Extraktion, RPA, Tests und Agent‑geführtes Browsen.

Architektur
Browser‑Gateway, Skript‑Rewriter, MCP‑Export‑Modul, LLM‑Integrationsschicht.

Nutzungshinweise
• Browser‑Management (Profile, Cookies).
• Skriptaufzeichnung und Bearbeitung.
• MCP‑Export und Bereitstellung als Tool/Command.
• Aufruf über LLMs zur Orchestrierung von Browser-Interaktionen.

Beitrag
Pull‑Requests und Issues sind willkommen. Klare Reproduktionsschritte oder Begründungen erforderlich.

Lizenz
MIT‑Lizenz (siehe LICENSE).

Mehrsprachige Dokumentation
Verfügbar in Englisch, Simplified Chinese, Japanese, Spanish und Portugiesisch.

Quelle: https://github.com/browserwing/browserwing