Cordon: Semantische Anomalie-Erkennung in Log-Dateien
Key Takeaway
Cordon identifiziert semantisch ungewöhnliche Logabschnitte, indem es wiederkehrende (auch kritische) Muster als „normal“ behandelt und anhand von Transformer‑Einbettungen sowie k‑NN‑Dichteschätzer auffällige Ereignisse hervorhebt.
Summary
- Projekt: GitHub‑Repository
calebevans/cordon– ein Open‑Source‑Tool zur semantischen Anomalie‑Erkennung in Log‑Dateien. - Methodik:
- Eingaben werden mittels Transformer‑Modellen in Einbettungs‑Vektoren umgewandelt.
- k‑Nearest‑Neighbors‑Dichteschätzung identifiziert Punkte mit geringer Nachbarschaftspräis.
- Wiederholte Muster (z. B. gleichbleibende Fehler) gelten als „normaler Hintergrund“ und werden ausgeblendet.
- Schlüsselfunktionen:
- Semantische Analyse statt reiner Schlüsselwort‑Suche.
- Multibackend‑Support: standardmäßig
sentence-transformers, optionalllama.cppfür Container‑GPU‑Beschleunigung. - GPU‑Beschleunigung (optionale NVIDIA‑CUDA‑Unterstützung) mit erstellbaren Batch‑Größen.
- Flexibles CLI‑Interface: einzelne oder mehrere Dateien, Anpassung von Fenstergröße, Nachbarn, Anomalie‑Prozentile, Batch‑Größen usw.
- Ausgabemöglichkeiten als XML oder reine Textfenster mit Score‑Angaben.
- Installation:
- PyPI‑Installation über
uvoderpip. - Source‑Build via Git‑Clone, optional
dev‑Abhängigkeiten undllama‑cpp. - Container‑Build mittels
make container-buildmit GPU‑Anweisungen im Container‑Guide.
- PyPI‑Installation über
- Verwendung:
- CLI-Beispiel:
cordon system.log --device cuda --batch-size 64 --output anomalies.xml. - Python‑API:
SemanticLogAnalyzermitAnalysisConfigfür erweiterte Einstellungen; Methodenanalyze_fileundanalyze_file_detailed.
- CLI-Beispiel:
- Beispielausgabe:
- Der Parser extrahiert „Block‑Linien“ mit Scores (z. B. 0.1746) und gruppiert ähnliche Muster.
- Das Beispiel aus einer Apache‑Log‑Datei zeigt, dass ein Cluster von
Directory index forbidden‑Fehlern als anomales Muster erkannt wird, während redundante Initialisierungs‑Logs als normal gelten.
- Dokumentation & Ressourcen:
- Detaillierte Artikel auf Red Hat Developer (Semantic anomaly detection with Cordon).
- README enthält komplette Befehls‑Liste, Beispielpfade, Konfigurationsparameter.
- Gesamtziel: Reduzierung massiver Log‑Dateien auf die wichtigsten, seltenen Ereignisse, sodass Analysten sofort die kritischsten Abschnitte prüfen können.
Related queries:
Wie nutzt man Cordon GPU‑Beschleunigung im Docker‑Container?
Welche Kommando‑Zeilen‑Optionen steuern die Anomalie‑Schwelle von Cordon?
Wo liegen die Voraussetzungen für die Verwendung des llama‑cpp‑Backends?
