
谷歌发布Gemini 3.5 Flash:主打智能体与编程,速度提升4倍
谷歌正式推出Gemini 3.5系列模型,首发版本为Gemini 3.5 Flash。该模型旨在处理复杂的智能体(Agent)工作流,在编程和长程任务中表现卓越。Gemini 3.5 Flash不仅在多项基准测试中超越了Gemini 3.1 Pro,其输出速度更是比其他前沿模型快4倍。目前该模型已通过Gemini应用、API及企业平台向全球用户开放,而更高性能的Gemini 3.5 Pro预计将于下月发布。
核心要点
- 智能体导向:Gemini 3.5 Flash专为执行复杂的智能体工作流设计,强调“前沿智能与行动”的结合。
- 性能突破:在编程和智能体基准测试(如Terminal-Bench 2.1和MCP Atlas)中表现优异,超越了之前的Gemini 3.1 Pro。
- 极致速度:其每秒输出Token的速度是其他前沿模型的4倍,位于Artificial Analysis索引的“高智能-高速度”象限。
- 广泛可用性:已在Gemini应用、谷歌搜索AI模式、Google Antigravity开发平台及企业级平台上线。
- 后续计划:性能更强大的Gemini 3.5 Pro目前正在内部测试,计划于下月正式推出。
详细分析
专注于智能体与编程的深度优化
Gemini 3.5 Flash的发布标志着谷歌AI战略向“行动导向”的重大转变。该模型不仅具备理解能力,更强调在现实世界中的实用性,特别是在处理长程任务(long-horizon tasks)方面。根据官方数据,Gemini 3.5 Flash在Terminal-Bench 2.1中达到了76.2%的准确率,在MCP Atlas测试中达到83.6%,这证明了其在处理复杂指令和自动化操作方面的强大实力。此外,它在多模态理解上也表现出色,CharXiv推理测试得分高达84.2%。
速度与效率的行业新标杆
在保持前沿智能水平的同时,Gemini 3.5 Flash在推理速度上取得了显著突破。谷歌表示,该模型的Token输出速度比同类竞争模型快4倍。这种速度优势对于需要实时响应的智能体应用至关重要。通过在Artificial Analysis索引中占据右上角位置(即兼具高智能与极速),谷歌证明了开发者无需在模型能力与响应延迟之间做权衡,从而为大规模商业化应用扫清了障碍。
多渠道的生态系统集成
谷歌此次采取了全平台同步推进的策略。对于普通用户,Gemini 3.5 Flash已集成至Gemini应用和搜索功能中;对于开发者,谷歌推出了“智能体优先”的开发平台Google Antigravity,并在Google AI Studio和Android Studio中提供API支持。针对企业级客户,Gemini Enterprise Agent Platform也已同步更新。这种全方位的布局旨在迅速占领智能体开发者的生态位。
行业影响
Gemini 3.5 Flash的发布预示着AI行业正从“对话式AI”向“行动式AI(Agentic AI)”转型。通过大幅提升推理速度并降低复杂任务的门槛,谷歌正在重新定义前沿模型的标准。这不仅会加速企业自动化流程的落地,也将迫使竞争对手在模型响应速度和智能体执行能力上展开更激烈的竞争。此外,Gemini 3.5 Pro的预告也保持了谷歌在超大规模模型领域的持续压力。
常见问题
问题 1:Gemini 3.5 Flash与之前的Pro模型相比性能如何?
根据官方测试,Gemini 3.5 Flash在编程和智能体相关基准测试中已经超越了Gemini 3.1 Pro,例如在Terminal-Bench 2.1和GDPval-AA(1656 Elo)等指标上均表现更优。
问题 2:开发者如何接入Gemini 3.5 Flash?
开发者可以通过谷歌新推出的智能体开发平台 Google Antigravity 接入,也可以通过 Google AI Studio 或 Android Studio 中的 Gemini API 进行调用。
问题 3:Gemini 3.5 Pro什么时候发布?
谷歌表示 Gemini 3.5 Pro 目前已在内部使用,预计将在下个月(2026年6月)正式向公众推出。


