20:00Simon Willison精选 82
Google开源DiffusionGemma:扩散式语言模型正式回归
DiffusionGemma
Google将去年短暂发布的实验性Gemini Diffusion模型以开源形式回归,发布Apache 2许可的DiffusionGemma-26B-A4B-it模型。该模型基于扩散机制生成文本,此前预览版曾达到857 tokens/s的推理速度。NVIDIA目前在NIM云API上免费托管该模型供开发者试用。
扩散模型GemmaGoogle开源模型
推荐理由 · why
扩散式LLM首个开源权重发布,关注推理加速和新范式的研究者与工程师必看。