AI
1 分钟阅读
Google 发布 Gemma 4 QAT:量化和训练优化让大模型在手机上只需 1GB 内存
就在 Gemma 4 12B 和 MTP(多 Token 预测)发布不久,Google 又放出了新大招 —— 专门为边缘设备优化的 Gemma 4 QAT(Quantization-Aware Tra...