返回列表
行业新闻AI创新科技

谷歌发布Gemini 3:宣称在数学、科学、多模态及智能体AI基准测试中领先

在经历一个多月的传闻和猜测后,谷歌于今日正式发布了其最新专有前沿模型家族Gemini 3。这是自2023年Gemini系列首次亮相以来,谷歌最全面的AI发布。Gemini 3作为完整的模型组合推出,包括旗舰模型Gemini 3 Pro、增强推理模式Gemini 3 Deep Think、支持视觉布局和动态视图的生成接口模型,以及用于多步任务执行的Gemini Agent。独立AI基准测试机构Artificial Analysis已将Gemini 3 Pro评为全球“AI新领导者”,得分73,使谷歌从之前的第九位跃升至首位。LMArena也报告Gemini 3 Pro在文本推理、视觉、编码和网页开发等所有主要评估轨道上均排名世界第一。

VentureBeat

在经历一个多月的传闻和热烈猜测——包括Polymarket对发布日期的押注——之后,谷歌今天正式发布了Gemini 3,这是其最新的专有前沿模型家族,也是该公司自2023年Gemini系列首次亮相以来最全面的AI发布。这些模型是专有的(闭源),仅通过谷歌产品、开发者平台和付费API提供,包括Google AI Studio、Vertex AI、面向开发者的Gemini命令行界面(CLI),以及更广泛的集成开发环境(IDE)生态系统中的第三方集成。

Gemini 3作为一个完整的组合推出,包括:

  • Gemini 3 Pro:旗舰前沿模型
  • Gemini 3 Deep Think:增强推理模式
  • 支持视觉布局和动态视图的生成接口模型
  • 用于多步任务执行的Gemini Agent
  • 嵌入在谷歌新一代以智能体为中心的开发环境Google Antigravity中的Gemini 3引擎。

“这是世界上最好的模型,领先幅度惊人!”谷歌DeepMind研究科学家Yi Tay在X上写道。事实上,独立的AI基准测试和分析机构Artificial Analysis已经将Gemini 3 Pro加冕为全球“AI新领导者”,在该机构的指数上获得了73分的最高分,使谷歌从之前凭借Gemini 2.5 Pro模型(得分为60,落后于OpenAI、Moonshot AI、xAI、Anthropic和MiniMax模型)排名第九的位置跃升。正如Artificial Analysis在X上所写:“谷歌首次拥有最智能的模型。”

另一个独立的排行榜网站LMArena报告称,Gemini 3 Pro在所有主要评估轨道上均排名世界第一,包括文本推理、视觉、编码和网页开发。在X上的@arena账户发布的一篇公开帖子中表示,该模型甚至超越了新发布的(数小时前)Grok-4.1,以及Claude 4.5和GPT-5级别的系统,在数学、长篇查询、创意写作等类别中表现出色。

相关新闻

行业新闻

警惕“重新发明轮子”:从加密原则看现代网页设计的误区

本文基于Susam Pal的深度评论,探讨了软件开发中“不要自研加密算法(Don't roll your own crypto)”这一经典原则,并将其延伸至现代网页设计领域。作者指出,正如开发者应使用经过验证的加密库而非自创方案一样,网页设计也应遵循浏览器原生标准。文章批评了开发者在网页设计中过度自定义原生功能的倾向,强调了使用成熟、经过社区审查的工具对于保障用户体验和系统安全的重要性。

AI技术通过频谱图还原遇难飞行员声音,NTSB紧急封锁案卷系统
行业新闻

AI技术通过频谱图还原遇难飞行员声音,NTSB紧急封锁案卷系统

近日,有人员利用AI技术处理驾驶舱通话记录的频谱图图像,成功还原了已故飞行员的声音。这一行为引发了严重的安全与隐私担忧,迫使美国国家运输安全委员会(NTSB)暂时封锁了其案卷系统(docket system)的公开访问权限,以防止敏感数据被进一步滥用。

跨越国界的教育支持:向乌干达难民营运送笔记本电脑的挑战与希望
行业新闻

跨越国界的教育支持:向乌干达难民营运送笔记本电脑的挑战与希望

本文讲述了居住在乌干达西部难民营的刚果难民Django,在极端艰苦条件下坚持攻读伦敦大学远程计算机科学学位的励志故事。面对电力匮乏、网络受限以及唯一的笔记本电脑主板烧毁的困境,Django的遭遇引发了对远程教育普惠性及资源匮乏地区技术支持的深思。文章详细分析了数字鸿沟对弱势群体受教育权的实际影响。