Sparse‑Ternary‑FMA‑Kernel: 2‑Bit‑Kodierung für schnellere FHE‑ und Low‑Precision‑AI‑Anwendungen

Der sparse‑ternary‑fma‑Kernel beweist, dass eine 2‑Bit‑Kodierung, gezielte Sparse‑Verarbeitung und handoptimiertes AVX‑512‑SIMD‑Bauen massiv die Berechnungszeit in FHE‑ und Low‑Precision‑AI‑Anwendungen verkürzen kann. Durch die Kombination aus 2‑Bit‑Ternary‑Encoding, Sparse‑Processing und handoptimierter AVX‑512-FMA‑Implementierung erreicht man eine Durchsatz‑Verbesserung von 2,38‑fach und eine Latenz‑Reduktion von 26,12‑fach, was die praktische Nutzung von FHE beschleunigt.

Key Takeaway

Summary

Problemstellung: TFHE‑Kryptosysteme nutzen ternäre geheime Schlüssel (–1, 0, 1). Traditionelle 8‑ bzw. 32‑Bit‑Darstellungen führen zu bis zu 87,5 % Speicher‑ und Rechenineffizienz, was die praktische Nutzung von FHE stark verlangsamt.
Lösungsansatz:
- 2‑Bit‑Ternary‑Encoding: Packt 256 Triten in einen 512‑Bit‑AVX‑512‑Vektor und erhöht die Datendichte um 4×–16×.
- Sparse‑Processing: Bearbeitet ausschließlich Nicht‑Null‑Elemente, was bei typischen FHE‑Schlüsselverteilungen eine Geschwindigkeitssteigerung von > 16× ermöglicht.
- SIMD‑Acceleration: Handoptimierte AVX‑512 FMA‑Implementierung verarbeitet 8 Koeffizienten gleichzeitig, was die Durchsatzrate gegenüber einer skalaren Version um 2,38× erhöht.
Performance‑Belege:
- Durchsatz‑Verbesserung: 2,38‑fach
- Latenz‑Reduktion: 26,12‑fach
Sicherheits‑ und Verifikationsbasis: Ergebnisse werden im Cryptology ePrint‑Bericht „T‑Encrypt (t‑Enc) T‑FHE“ formal dokumentiert.
Code‑Basis:
- Spuren: C‑Bibliothek ohne externe Abhängigkeiten (`libsparsetfma.a`, `libsparsetfma.so`).
- Build‑Anleitung: `make` erzeugt Bibliotheken und `bin/benchmark`.
- API: Funktionen zum Kodieren/Entkodieren, Packen/Entpacken von Triten und zur Sparse‑Ternary‑FMA‑Operation.
Lizenz & Vision: MIT‑Lizenz, Off‑Source‑Open‑Source‑Community‑Aufbau, Ziel: effizientes client‑seitiges FHE und nächstgenerationes AI.

Related queries

Wie kann man sparse_ternary_fma in ein bestehendes FHE‑Framework integrieren?
Welche Vorteile liefert 2‑Bit‑Kodierung gegenüber 8‑Bit‑/32‑Bit‑Kodierung in TFHE?
Gibt es Benchmarks, die die Latenz‑Reduktion von 26,12× in realen FHE‑Anwendungen demonstrieren?

Quelle: https://github.com/HyperFoldUK/sparse-ternary-fma

Sparse‑Ternary‑FMA‑Kernel: 2‑Bit‑Kodierung für schnellere FHE‑ und Low‑Precision‑AI‑Anwendungen

Sparse‑Ternary‑FMA‑Kernel: 2‑Bit‑Kodierung für schnellere FHE‑ und Low‑Precision‑AI‑Anwendungen

Key Takeaway

Summary

Related queries

Submit a Comment Cancel reply

Recent Posts

Recent Comments