home

Metrik: Echtzeit‑TTFT‑Monitoring für über 26 LLM‑Modelle – kostenloses, authentifizierungsfreies API

Key Takeaway

Metrik bietet über ein kostenloses, authentifizierungsfreies API in Echtzeit die TTFT‑Daten (Time to First Token) von mehr als 26 LLM‑Modellen an, wobei die Daten stündlich aktualisiert und mit Anbietern sowie Veränderungen verglichen werden.

Summary

  • Aufruf des API‑Endpoints erfolgt über https://metrik-dashboard.vercel.app/api/v1/ttft als GET‑Methode.
  • Die API liefert für jedes Modell die TTFT‑Metrik (in Millisekunden), Änderungen seit der letzten Stunde und den Status (z. B. „operational“).
  • Für jeden Provider (OpenAI, Anthropic, Google, xAI) werden aggregierte Statistiken bereitgestellt: Anzahl der Modelle, durchschnittliche TTFT, schnellstes und langsamstes Modell innerhalb des Providers.
  • In der Gesamtzusammenfassung werden Gesamtmodellzahl, globaler Durchschnitt, das schnellste und langsamste Modell angegeben.
  • Aktualisierungen finden stündlich statt; das letzte Änderungsdatum ist im Feld timestamp enthalten.
  • Keine Authentifizierung erforderlich; stattdessen ein Rate‑Limit von 100 Anfragen pro Stunde.
  • Response‑Header enthalten X-RateLimit-Limit, X-RateLimit-Remaining und X-RateLimit-Reset zur Anzeige des aktuellen Limit‑Status.
  • Beispielantwort (JSON) zeigt success, version, timestamp und die eigentlichen Daten unter data.
  • Fehlerantworten: 429 – Rate‑Limit überschritten, 503 – Keine Daten verfügbar, solange die erste stündliche Messung noch nicht erfolgt ist.
  • Für Entwickler werden Code‑Beispiele in JavaScript/Node.js und Python bereitgestellt, die zeigen, wie das schnellste Modell und der Durchschnitt abgerufen werden können.
  • Für Support oder höhere Limits kann per E‑Mail an meh.bouassami@gmail.com Kontakt aufgenommen werden.

Related queries

  • Wie erreiche ich die TTFT‑Daten für ein bestimmtes Modell aus der API?
  • Welche Modelle hat xAI am schnellsten?
  • Wie erstelle ich eine eigene Client‑App, die die Rate‑Limits von Metrik berücksichtigt?