← 终端返回主节点

机器学习与深度学习笔记

Google TurboQuant 内存压缩算法详解:KV Cache 占用直降 6 倍

2026 年 4 月底,Google 发布了一项名为 TurboQuant 的重磅 AI 优化技术。本文带你硬核推导该算法是如何将长文本生成过程中的 KV Cache(键值缓存)体积压缩至原先的六分之一,且几乎无损模型推理性能。这无疑是消费级显卡部署大语言模型的一次极大突破。

阅读原文

AI 破局科学计算:浅析 Mollifier Layers 在偏微分方程求解中的应用

科学 AI(AI for Science)正迎来算力革命。宾夕法尼亚大学最新提出的 Mollifier Layers 技术,通过在神经网络中融合经典数学平滑函数,大幅提升了求解含有噪声数据的逆向偏微分方程(PDEs)的稳定性和效率。本文记录了复现该算法核心机制的全过程。

查看笔记