2025年11月19日 的AI新闻

产品

Manus发布Browser Operator扩展:将任意浏览器升级为AI智能浏览器,提升工作效率

Manus公司推出了一款名为Manus Browser Operator的Chrome扩展程序,旨在将任何浏览器转变为具备AI能力的智能浏览器。该扩展能够自动化复杂的浏览器操作,并支持安全访问受保护的网站和系统,如研究平台和CRM工具。其核心功能包括安全的本地访问与会话复用,避免额外的登录验证和验证码,并能长期保持会话活跃。典型应用场景涵盖在数据库中查找资料、在CRM系统执行任务以及在付费平台提取数据。该扩展目前处于Beta测试阶段,逐步向Pro、Plus、Team高级用户开放,支持Chrome和Edge浏览器,旨在大幅提升日常工作效率。

Xiaohu.AI 日报
技术

Google发布Antigravity平台:AI智能体主导软件开发,深度集成Gemini 3模型

Google正式推出Google Antigravity平台,这是一个面向“AI智能体主导开发”的全新系统。它不再是传统IDE,而是具备自治能力的智能体协作平台,使AI能够独立规划、执行和验证完整的软件开发任务。Antigravity深度集成Gemini 3模型,是Google在“智能体式编码”方向的关键落地产品,旨在解决传统AI辅助工具的局限性,实现AI跨环境工作、规划复杂任务、自动执行操作并自行检查结果,从而重新定义AI时代的开发方式。

Xiaohu.AI 日报
行业新闻

谷歌Vids视频编辑平台AI功能全面免费开放:含AI配音、智能剪辑与图像编辑

谷歌宣布其视频编辑平台Vids的多项AI功能现已向所有拥有Gmail账号的用户免费开放。此前,这些功能仅限付费用户使用。新开放的功能包括AI语音配音、自动去除冗余口语(转录修剪)以及AI图像编辑。转录修剪功能可自动识别并删除视频中的“嗯”、“啊”等冗余口语和长时间静默,显著提升视频质量。AI语音配音允许用户通过文本脚本生成专业配音,并提供七种声音选择。AI图像编辑工具则能帮助用户轻松修改视频图片,如去除背景、按描述编辑或将静态照片转为动态视频。谷歌希望通过此举,让更多用户轻松制作高质量视频内容。

AI新闻资讯 - AI Base
产品

Quora Poe应用推出AI群聊功能,支持200人协作与多模态交互

Quora近日为其AI平台Poe推出了创新性的群聊功能,允许最多200名用户在单一对话中与不同的AI模型和机器人进行协作。该功能支持文本、图像、视频和音频生成等多种形式,旨在变革AI交互方式,为用户带来全新的互动体验。用户可以利用此功能规划旅行、创作Mood Board或参与智力游戏。Poe的群聊功能还具备实时同步聊天记录的特性,方便用户在不同设备间无缝切换。Quora表示,该功能已开发六个月,未来将根据用户反馈持续优化,并鼓励用户创建和分享自定义机器人以探索更多应用场景。

AI新闻资讯 - AI Base
行业新闻

Google AI开发者宣布:立即开始使用Gemini 3进行开发

Google AI开发者账号于2025年11月19日发布消息,鼓励开发者“立即开始使用Gemini 3进行开发”。此消息表明Gemini 3已可供开发者使用,预示着新的开发工具和可能性。该推文获得了少量转发和点赞,并有超过4000次浏览。

Google AI Developers(@googleaidevs) - Google AI Developers (@googleaidevs)
技术

Google推出Generative UI:AI从“语言输出”迈向“交互体验生成”新范式

Google Research宣布推出Generative UI(生成式界面)技术,使AI模型能根据用户提示即时生成完整的可视化、交互式用户界面,如网页、工具、游戏和应用程序。这项技术已集成至Gemini App的“动态视图”和Google Search的AI Mode中,标志着Google将生成式AI从单纯的语言输出扩展到交互体验生成。Generative UI旨在解决传统AI线性文本输出在呈现复杂知识和交互任务时的局限性,通过AI系统即时设计并实现交互式界面。其核心机制包括工具访问、系统级指令集和输出后处理,确保AI能生成可运行、结构清晰且安全的界面。该技术有望推动人机交互范式转型,使未来的界面根据用户需求由AI即时生成。

Xiaohu.AI 日报
行业新闻

Google 发布 Gemini 3:AI推理、多模态融合与智能体行为实现质的飞跃

Google 正式发布 Gemini 3,官方定义其在更高层次的推理、多模态融合与智能体行为上实现了质的飞跃。Gemini 3 具备理解复杂场景、跨模态分析与自主执行任务的综合能力。其核心改进包括推理深度与问题分解能力,在博士级考试中表现出色;多模态理解能力显著提升,能处理图像、视频、音频与代码的融合任务;并引入了真正的“自主执行与验证”机制,通过 Google Antigravity 平台实现AI自动规划、编写代码和验证结果。此外,Gemini 3 还具备超长上下文理解能力和系统性思维,可用于学习、构建和规划等三大应用场景。

Xiaohu.AI 日报
行业新闻

马斯克xAI发布Grok 4.1:幻觉率显著降低,暂无API访问

埃隆·马斯克的AI初创公司xAI近日推出了其最新大型语言模型Grok 4.1。该模型已在Grok.com、社交网络X以及iOS和Android移动应用上线,面向消费者开放。Grok 4.1在架构和可用性方面进行了重大增强,包括更快的推理速度、更高的情商和显著降低的幻觉率。根据公开基准测试,Grok 4.1表现优于Anthropic、OpenAI和谷歌(Gemini 2.5 Pro之前版本)的竞争模型。然而,值得注意的是,Grok 4.1目前尚未通过xAI的公共API提供给企业开发者,限制了其在需要后端集成的企业工作流中的应用。

VentureBeat
行业新闻

谷歌发布Gemini 3:宣称在数学、科学、多模态及智能体AI基准测试中领先

在经历一个多月的传闻和猜测后,谷歌于今日正式发布了其最新专有前沿模型家族Gemini 3。这是自2023年Gemini系列首次亮相以来,谷歌最全面的AI发布。Gemini 3作为完整的模型组合推出,包括旗舰模型Gemini 3 Pro、增强推理模式Gemini 3 Deep Think、支持视觉布局和动态视图的生成接口模型,以及用于多步任务执行的Gemini Agent。独立AI基准测试机构Artificial Analysis已将Gemini 3 Pro评为全球“AI新领导者”,得分73,使谷歌从之前的第九位跃升至首位。LMArena也报告Gemini 3 Pro在文本推理、视觉、编码和网页开发等所有主要评估轨道上均排名世界第一。

VentureBeat