home

Enterprise RAG Core V2.55 – Parallele Ingest‑Lanes & Consensus‑Engine für hochpräzises Wissensmanagement

Der Enterprise RAG Core liefert durch parallelen Ingest‑Lanes und einen Consensus‑Engine eine hochpräzise, konsistente Wissensbasis, die sowohl in Vektordatenbanken als auch in Graphdatenbanken gespeichert wird, um robuste Frage‑Antwort‑ und Rechenaufgaben zu ermöglichen.

Key Takeaway

Der Enterprise RAG Core liefert durch parallelen Ingest‑Lanes und einen Consensus‑Engine eine hochpräzise, konsistente Wissensbasis, die sowohl in Vektordatenbanken als auch in Graphdatenbanken gespeichert wird, um robuste Frage‑Antwort‑ und Rechenaufgaben zu ermöglichen.

Summary

  • Version & Status: V2.55, öffentliches Release‑Candidate, produktionsbereit, Code geprüft.
  • Architektur: Mikro‑Services in Python 3.11 (FastAPI, Pydantic V2), orchestriert mit LangGraph/LangChain.
  • Agent Service (Orchestrator): Query‑Decomposition Engine mit Plan‑and‑Solve Pattern. Automatische Sub‑Query‑Abhängigkeiten. Dynamisches Routing zu Vector‑Search, Graph‑Traversal oder Mathe‑Tools. Semantischer Cache (Redis + Embeddings) → <95 % Ähnlichkeit, ~40‑fach niedrigere Latenz, 80 % Token‑reduzierung. Streaming, Rate‑Limiting, Session‑Management.
  • Ingest Service (Multi‑Lane Engine): Triage für Dokumentkomplexität. Drei parallele Lanes: Lane A (Schnell‑Text, PyMuPDF), Lane B (Struktur‑aware, Docling), Lane C (Vision‑basierte Bilder, Ollama Vision). Solomon‑Consensus‑Engine vergleicht und verschmilzt Ergebnisse, löst Konflikte, extrahiert 8 Kern‑Entity‑Typen + 7 Beziehungstypen, validiert JSON‑Schema. Echt‑zeit WebSocket‑Status‑Feeds, Live‑Metriken.
  • Knowledge Service (Vector Layer): ChromaDB, custom HNSW, Cosine/L2, Metadaten‑Filtern, Score‑Normalisierung 0‑1.
  • Graph Service (Context Layer): Neo4j 5.x, strenges Ontologie‑Schema, Cypher‑Injection‑Protection, Traversals, Einzigartigkeits‑Constraints.
  • Shared Infrastructure & Security: Observability: OpenTelemetry, Jaeger, Prometheus, Grafana. Audit‑Logging, RBAC, JWT + API‑Keys, Input‑Sanitization.
  • Roadmap V3.0: Cross‑Encoder Reranking, Human‑in‑the‑Loop UI, Distributed Tracing UI.
  • Warum: Durch Lane‑Split + Consensus wird Falsch‑Positive‑Rate bei PDFs reduziert, Beziehungen bleiben konsistent.

Related queries:

Wie funktioniert der Consensus‑Engine im Ingest‑Service?
Welche KI‑Bibliotheken werden im RAG Core verwendet?
Wie reduziert der Agent Service die LLM‑Token‑Kosten?

Quelle: https://gist.github.com/2dogsandanerd/2a3d54085b2daaccbb1125601945ceeb