谷歌发布Gemini 3:宣称在数学、科学、多模态及智能体AI基准测试中领先
在经历一个多月的传闻和猜测后,谷歌于今日正式发布了其最新专有前沿模型家族Gemini 3。这是自2023年Gemini系列首次亮相以来,谷歌最全面的AI发布。Gemini 3作为完整的模型组合推出,包括旗舰模型Gemini 3 Pro、增强推理模式Gemini 3 Deep Think、支持视觉布局和动态视图的生成接口模型,以及用于多步任务执行的Gemini Agent。独立AI基准测试机构Artificial Analysis已将Gemini 3 Pro评为全球“AI新领导者”,得分73,使谷歌从之前的第九位跃升至首位。LMArena也报告Gemini 3 Pro在文本推理、视觉、编码和网页开发等所有主要评估轨道上均排名世界第一。
在经历一个多月的传闻和热烈猜测——包括Polymarket对发布日期的押注——之后,谷歌今天正式发布了Gemini 3,这是其最新的专有前沿模型家族,也是该公司自2023年Gemini系列首次亮相以来最全面的AI发布。这些模型是专有的(闭源),仅通过谷歌产品、开发者平台和付费API提供,包括Google AI Studio、Vertex AI、面向开发者的Gemini命令行界面(CLI),以及更广泛的集成开发环境(IDE)生态系统中的第三方集成。
Gemini 3作为一个完整的组合推出,包括:
* Gemini 3 Pro:旗舰前沿模型
* Gemini 3 Deep Think:增强推理模式
* 支持视觉布局和动态视图的生成接口模型
* 用于多步任务执行的Gemini Agent
* 嵌入在谷歌新一代以智能体为中心的开发环境Google Antigravity中的Gemini 3引擎。
“这是世界上最好的模型,领先幅度惊人!”谷歌DeepMind研究科学家Yi Tay在X上写道。事实上,独立的AI基准测试和分析机构Artificial Analysis已经将Gemini 3 Pro加冕为全球“AI新领导者”,在该机构的指数上获得了73分的最高分,使谷歌从之前凭借Gemini 2.5 Pro模型(得分为60,落后于OpenAI、Moonshot AI、xAI、Anthropic和MiniMax模型)排名第九的位置跃升。正如Artificial Analysis在X上所写:“谷歌首次拥有最智能的模型。”
另一个独立的排行榜网站LMArena报告称,Gemini 3 Pro在所有主要评估轨道上均排名世界第一,包括文本推理、视觉、编码和网页开发。在X上的@arena账户发布的一篇公开帖子中表示,该模型甚至超越了新发布的(数小时前)Grok-4.1,以及Claude 4.5和GPT-5级别的系统,在数学、长篇查询、创意写作等类别中表现出色。