3 月 4 日消息,谷歌今天正式推出 Gemini 3.1 Flash-Lite,声称它是 Gemini 3 系列中速度最快、性价比最高的机型。他们还表示,3.1 Flash-Lite 专为高性能、大规模开发人员工作负载而设计,在其价格和型号级别上代表了非常高的质量。从今天开始,3.1 Flash-Lite 可以通过 Google AI Studio 中的 Gemini 界面向开发人员提供预览版,也可以通过 Vertex AI 向企业用户提供预览版。 3.1 Flash-Lite 每百万个输入代币(输入代币)的成本为 0.25 美元,每百万个输出代币(输出代币)的成本为 1.50 美元。根据Artificial Analysis基准测试,3.1 Flash-Lite的性能优于2.5 Flash,同时保持相同或更好的质量。第一个单词响应时间(第一个响应标记的时间)缩短了 2.5 倍,输出速度提高了 45%。谷歌表示,这种低延迟和高频工作流程至关重要,是开发人员创建响应式、重新设计的理想模型。一直以来的经历。 3.1 Flash-Lite在Arena.ai排名中获得1432分。它在多个跨模态推理和理解基准中优于其他类似模型。例如,它在 GPQA Diamond 测试中取得了 86.9% 的成绩,在 MMMU Pro 测试中取得了 76.8% 的成绩。这一性能甚至超过了上一代最大的型号,例如 2.5 Flash。除了本机性能外,Gemini 3.1 Flash-Lite还标配了AI Studio和Vertex AI“思维层面”能力。这使开发人员可以灵活地控制模型对特定任务“思考”的深度。也就是说,对于管理高频工作负载很重要。 3.1 Flash-Lite 可以处理大规模任务,例如大批量翻译和内容审核。内容非常经济。同时,他们可以执行需要深度推理的复杂任务,例如生成用户界面和仪表板、创建模拟环境以及遵循复杂的指令骚动。谷歌表示,AI Studio 和 Vertex AI 以及 Latitude、Cartwheel 和 Whering 等公司的早期开发人员已经在使用 3.1 Flash-Lite 大规模解决复杂问题。早期测试人员强调 3.1 Flash-Lite 的效率和推理能力。他们声称该模型可以近似: 定量模型的精度使他们能够处理复杂的输入并严格遵循指令以保持高度的一致性。 (纯文本)(本文由AI翻译,网易审阅编辑)

admin

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注