返回列表
行业新闻AI创新科技

谷歌发布Gemini 3:宣称在数学、科学、多模态及智能体AI基准测试中领先

在经历一个多月的传闻和猜测后,谷歌于今日正式发布了其最新专有前沿模型家族Gemini 3。这是自2023年Gemini系列首次亮相以来,谷歌最全面的AI发布。Gemini 3作为完整的模型组合推出,包括旗舰模型Gemini 3 Pro、增强推理模式Gemini 3 Deep Think、支持视觉布局和动态视图的生成接口模型,以及用于多步任务执行的Gemini Agent。独立AI基准测试机构Artificial Analysis已将Gemini 3 Pro评为全球“AI新领导者”,得分73,使谷歌从之前的第九位跃升至首位。LMArena也报告Gemini 3 Pro在文本推理、视觉、编码和网页开发等所有主要评估轨道上均排名世界第一。

VentureBeat

在经历一个多月的传闻和热烈猜测——包括Polymarket对发布日期的押注——之后,谷歌今天正式发布了Gemini 3,这是其最新的专有前沿模型家族,也是该公司自2023年Gemini系列首次亮相以来最全面的AI发布。这些模型是专有的(闭源),仅通过谷歌产品、开发者平台和付费API提供,包括Google AI Studio、Vertex AI、面向开发者的Gemini命令行界面(CLI),以及更广泛的集成开发环境(IDE)生态系统中的第三方集成。

Gemini 3作为一个完整的组合推出,包括:
* Gemini 3 Pro:旗舰前沿模型
* Gemini 3 Deep Think:增强推理模式
* 支持视觉布局和动态视图的生成接口模型
* 用于多步任务执行的Gemini Agent
* 嵌入在谷歌新一代以智能体为中心的开发环境Google Antigravity中的Gemini 3引擎。

“这是世界上最好的模型,领先幅度惊人!”谷歌DeepMind研究科学家Yi Tay在X上写道。事实上,独立的AI基准测试和分析机构Artificial Analysis已经将Gemini 3 Pro加冕为全球“AI新领导者”,在该机构的指数上获得了73分的最高分,使谷歌从之前凭借Gemini 2.5 Pro模型(得分为60,落后于OpenAI、Moonshot AI、xAI、Anthropic和MiniMax模型)排名第九的位置跃升。正如Artificial Analysis在X上所写:“谷歌首次拥有最智能的模型。”

另一个独立的排行榜网站LMArena报告称,Gemini 3 Pro在所有主要评估轨道上均排名世界第一,包括文本推理、视觉、编码和网页开发。在X上的@arena账户发布的一篇公开帖子中表示,该模型甚至超越了新发布的(数小时前)Grok-4.1,以及Claude 4.5和GPT-5级别的系统,在数学、长篇查询、创意写作等类别中表现出色。

相关新闻

行业新闻

谷歌Vids视频编辑平台AI功能全面免费开放:含AI配音、智能剪辑与图像编辑

谷歌宣布其视频编辑平台Vids的多项AI功能现已向所有拥有Gmail账号的用户免费开放。此前,这些功能仅限付费用户使用。新开放的功能包括AI语音配音、自动去除冗余口语(转录修剪)以及AI图像编辑。转录修剪功能可自动识别并删除视频中的“嗯”、“啊”等冗余口语和长时间静默,显著提升视频质量。AI语音配音允许用户通过文本脚本生成专业配音,并提供七种声音选择。AI图像编辑工具则能帮助用户轻松修改视频图片,如去除背景、按描述编辑或将静态照片转为动态视频。谷歌希望通过此举,让更多用户轻松制作高质量视频内容。

行业新闻

Google AI开发者宣布:立即开始使用Gemini 3进行开发

Google AI开发者账号于2025年11月19日发布消息,鼓励开发者“立即开始使用Gemini 3进行开发”。此消息表明Gemini 3已可供开发者使用,预示着新的开发工具和可能性。该推文获得了少量转发和点赞,并有超过4000次浏览。

行业新闻

Google 发布 Gemini 3:AI推理、多模态融合与智能体行为实现质的飞跃

Google 正式发布 Gemini 3,官方定义其在更高层次的推理、多模态融合与智能体行为上实现了质的飞跃。Gemini 3 具备理解复杂场景、跨模态分析与自主执行任务的综合能力。其核心改进包括推理深度与问题分解能力,在博士级考试中表现出色;多模态理解能力显著提升,能处理图像、视频、音频与代码的融合任务;并引入了真正的“自主执行与验证”机制,通过 Google Antigravity 平台实现AI自动规划、编写代码和验证结果。此外,Gemini 3 还具备超长上下文理解能力和系统性思维,可用于学习、构建和规划等三大应用场景。