克雷西 发自 凹非寺量子位 | 公众号 QbitAI 首个FP4精度的大模型训练框架来了,来自微软研究院! 在相同超参数的设置下,可以达到与FP8以及BF16相当的训练效果。 这意味着所需的存储和计算资源可以更少。