机器学习与深度学习笔记

Google TurboQuant 内存压缩算法详解：KV Cache 占用直降 6 倍

算法前沿解析

2026 年 4 月底，Google 发布了一项名为 TurboQuant 的重磅 AI 优化技术。本文带你硬核推导该算法是如何将长文本生成过程中的 KV Cache（键值缓存）体积压缩至原先的六分之一，且几乎无损模型推理性能。这无疑是消费级显卡部署大语言模型的一次极大突破。

阅读原文

AI for Science

科学 AI（AI for Science）正迎来算力革命。宾夕法尼亚大学最新提出的 Mollifier Layers 技术，通过在神经网络中融合经典数学平滑函数，大幅提升了求解含有噪声数据的逆向偏微分方程（PDEs）的稳定性和效率。本文记录了复现该算法核心机制的全过程。

查看笔记