Cordon: Semantische Anomalie-Erkennung in Log-Dateien

Key Takeaway

Cordon identifiziert semantisch ungewöhnliche Logabschnitte, indem es wiederkehrende (auch kritische) Muster als „normal“ behandelt und anhand von Transformer‑Einbettungen sowie k‑NN‑Dichteschätzer auffällige Ereignisse hervorhebt.

Summary

Projekt: GitHub‑Repository calebevans/cordon – ein Open‑Source‑Tool zur semantischen Anomalie‑Erkennung in Log‑Dateien.
Methodik:
- Eingaben werden mittels Transformer‑Modellen in Einbettungs‑Vektoren umgewandelt.
- k‑Nearest‑Neighbors‑Dichteschätzung identifiziert Punkte mit geringer Nachbarschaftspräis.
- Wiederholte Muster (z. B. gleichbleibende Fehler) gelten als „normaler Hintergrund“ und werden ausgeblendet.
Schlüsselfunktionen:
- Semantische Analyse statt reiner Schlüsselwort‑Suche.
- Multibackend‑Support: standardmäßig sentence-transformers, optional llama.cpp für Container‑GPU‑Beschleunigung.
- GPU‑Beschleunigung (optionale NVIDIA‑CUDA‑Unterstützung) mit erstellbaren Batch‑Größen.
- Flexibles CLI‑Interface: einzelne oder mehrere Dateien, Anpassung von Fenstergröße, Nachbarn, Anomalie‑Prozentile, Batch‑Größen usw.
- Ausgabemöglichkeiten als XML oder reine Textfenster mit Score‑Angaben.
Installation:
- PyPI‑Installation über uv oder pip.
- Source‑Build via Git‑Clone, optional dev‑Abhängigkeiten und llama‑cpp.
- Container‑Build mittels make container-build mit GPU‑Anweisungen im Container‑Guide.
Verwendung:
- CLI-Beispiel: cordon system.log --device cuda --batch-size 64 --output anomalies.xml.
- Python‑API: SemanticLogAnalyzer mit AnalysisConfig für erweiterte Einstellungen; Methoden analyze_file und analyze_file_detailed.
Beispielausgabe:
- Der Parser extrahiert „Block‑Linien“ mit Scores (z. B. 0.1746) und gruppiert ähnliche Muster.
- Das Beispiel aus einer Apache‑Log‑Datei zeigt, dass ein Cluster von Directory index forbidden‑Fehlern als anomales Muster erkannt wird, während redundante Initialisierungs‑Logs als normal gelten.
Dokumentation & Ressourcen:
- Detaillierte Artikel auf Red Hat Developer (Semantic anomaly detection with Cordon).
- README enthält komplette Befehls‑Liste, Beispielpfade, Konfigurationsparameter.
Gesamtziel: Reduzierung massiver Log‑Dateien auf die wichtigsten, seltenen Ereignisse, sodass Analysten sofort die kritischsten Abschnitte prüfen können.

Related queries:

Wie nutzt man Cordon GPU‑Beschleunigung im Docker‑Container?

Welche Kommando‑Zeilen‑Optionen steuern die Anomalie‑Schwelle von Cordon?

Wo liegen die Voraussetzungen für die Verwendung des llama‑cpp‑Backends?

Quelle: https://github.com/calebevans/cordon

Cordon: Semantische Anomalie-Erkennung in Log-Dateien

Cordon: Semantische Anomalie-Erkennung in Log-Dateien

Key Takeaway

Summary

Related queries:

Submit a Comment Cancel reply

Recent Posts

Recent Comments