home

Sparse‑Ternary‑FMA‑Kernel: 2‑Bit‑Kodierung für schnellere FHE‑ und Low‑Precision‑AI‑Anwendungen

Der sparse‑ternary‑fma‑Kernel beweist, dass eine 2‑Bit‑Kodierung, gezielte Sparse‑Verarbeitung und handoptimiertes AVX‑512‑SIMD‑Bauen massiv die Berechnungszeit in FHE‑ und Low‑Precision‑AI‑Anwendungen verkürzen kann. Durch die Kombination aus 2‑Bit‑Ternary‑Encoding, Sparse‑Processing und handoptimierter AVX‑512-FMA‑Implementierung erreicht man eine Durchsatz‑Verbesserung von 2,38‑fach und eine Latenz‑Reduktion von 26,12‑fach, was die praktische Nutzung von FHE beschleunigt.

Key Takeaway

Der sparse‑ternary‑fma‑Kernel beweist, dass eine 2‑Bit‑Kodierung, gezielte Sparse‑Verarbeitung und handoptimiertes AVX‑512‑SIMD‑Bauen massiv die Berechnungszeit in FHE‑ und Low‑Precision‑AI‑Anwendungen verkürzen kann.

Summary

  • Problemstellung: TFHE‑Kryptosysteme nutzen ternäre geheime Schlüssel (–1, 0, 1). Traditionelle 8‑ bzw. 32‑Bit‑Darstellungen führen zu bis zu 87,5 % Speicher‑ und Rechenineffizienz, was die praktische Nutzung von FHE stark verlangsamt.
  • Lösungsansatz:
    • 2‑Bit‑Ternary‑Encoding: Packt 256 Triten in einen 512‑Bit‑AVX‑512‑Vektor und erhöht die Daten­dichte um 4×–16×.
    • Sparse‑Processing: Bearbeitet ausschließlich Nicht‑Null‑Elemente, was bei typischen FHE‑Schlüsselverteilungen eine Geschwindigkeitssteigerung von > 16× ermöglicht.
    • SIMD‑Acceleration: Handoptimierte AVX‑512 FMA‑Implementierung verarbeitet 8 Koeffizienten gleichzeitig, was die Durchsatz­rate gegenüber einer skalaren Version um 2,38× erhöht.
  • Performance‑Belege:
    • Durchsatz‑Verbesserung: 2,38‑fach
    • Latenz‑Reduktion: 26,12‑fach
  • Sicherheits‑ und Verifikationsbasis: Ergebnisse werden im Cryptology ePrint‑Bericht „T‑Encrypt (t‑Enc) T‑FHE“ formal dokumentiert.
  • Code‑Basis:
    • Spuren: C‑Bibliothek ohne externe Abhängigkeiten (`libsparsetfma.a`, `libsparsetfma.so`).
    • Build‑Anleitung: `make` erzeugt Bibliotheken und `bin/benchmark`.
    • API: Funktionen zum Kodieren/Entkodieren, Packen/Entpacken von Triten und zur Sparse‑Ternary‑FMA‑Operation.
  • Lizenz & Vision: MIT‑Lizenz, Off‑Source‑Open‑Source‑Community‑Aufbau, Ziel: effizientes client‑seitiges FHE und nächst­generationes AI.

Related queries

Wie kann man sparse_ternary_fma in ein bestehendes FHE‑Framework integrieren?
Welche Vorteile liefert 2‑Bit‑Kodierung gegenüber 8‑Bit‑/32‑Bit‑Kodierung in TFHE?
Gibt es Benchmarks, die die Latenz‑Reduktion von 26,12× in realen FHE‑Anwendungen demonstrieren?

Quelle: https://github.com/HyperFoldUK/sparse-ternary-fma