iclr-2026

Here are 14 public repositories matching this topic...

Firmamento-Technologies / TurboQuant

Near-optimal vector quantization from Google's ICLR 2026 paper — 95% recall, 5x compression, zero preprocessing, pure Python FAISS replacement

Updated Mar 28, 2026
Python

David-cripto / RealUID

Star

(ICLR 2026 Oral 🔥) Universal Inverse Distillation for Matching Models with Real-Data Supervision (No GANs)

diffusion-models generative-ai flow-matching iclr-2026

Updated Mar 6, 2026
Python

OnlyTerp / kvtc

Star

First open-source KVTC implementation (NVIDIA, ICLR 2026) -- 8-32x KV cache compression via PCA + adaptive quantization + entropy coding

compression pytorch nvidia transformer pca attention dynamic-programming quantization deflate entropy-coding memory-optimization kv-cache llm llm-inference kv-cache-compression iclr-2026

Updated Mar 27, 2026
Python

thanhquangtran / TS-Sobolev

Star

[ICLR 2026] Tree-Sliced Sobolev IPM

optimal-transport tree-sliced-wasserstein iclr-2026 sobolev-ipm

Updated Feb 27, 2026
Python

qqqqqqqzx / The-Achilles-Heel-of-LLMs

Star

Code for locating "critical neurons" in LLMs. We show that masking as few as 3 neurons can cripple a model's capabilities (ICLR 2026).

neural-networks ai-safety model-robustness interpretability-and-explainability llms mechanistic-interpretability iclr-2026 critical-neurons

Updated Mar 27, 2026
Python

thanhquangtran / FW-TSW

Star

[ICLR 2026] Revisiting Tree-Sliced Wasserstein Distance Through the Lens of the Fermat–Weber Problem

optimal-transport tree-sliced-wasserstein iclr-2026

Updated Feb 26, 2026
Python

JingbiaoMei / ExPO-HM

Star

🔬 Official implementation of ExPO-HM: Learning to Explain-then-Detect for Hateful Meme Detection (ICLR 2026). Novel multimodal RL approach for interpretable and explainable content moderation.

multimodal-learning explainable-ai content-moderation vision-language-models preference-optimization grpo iclr-2026 hateful-meme-detection multimodal-rl

Updated Mar 1, 2026
Python

Ryuketsukami / turboquant-compression

Star

Near-optimal vector quantization for LLM KV cache compression. Python implementation of TurboQuant (ICLR 2026) — PolarQuant + QJL for 3-bit quantization with minimal accuracy loss and up to 8x memory reduction.

Updated Mar 28, 2026
Python

Ryuketsukami / turboquant-skill

Star

AI agent skill implementing Google's TurboQuant compression algorithm (ICLR 2026) — 6x KV cache memory reduction, 8x speedup, zero accuracy loss. Compatible with Claude Code, Codex CLI, and all Agent Skills-compatible tools.