2025年11月18日的AI新闻

行业新闻

ElevenLabs推出“Image & Video平台”：图像、视频、音频、音乐一站式AI生成，重塑内容创作效率

多模态AI公司ElevenLabs正式上线“Image & Video平台”，将图像生成、视频生成、声音合成、音乐创作和音效设计整合于一体。该平台旨在帮助创作者和营销人员告别多平台切换，实现从剧本到成品商业视频的一站式制作。新平台打通了视觉与音频能力，用户可直接在同一界面完成画面生成、视频制作、旁白添加、背景音乐和环境音效叠加，官方宣称最快几分钟即可产出可投放的营销视频。平台集成了Google Veo、OpenAI Sora、Kling等顶级多模态模型，并针对商业应用进行了优化，支持多种视频比例、内置商用安全素材库及多语种旁白替换功能，大幅提升AI内容生产效率。

AI新闻资讯 - AI Base•2025年11月18日

阅读全文原文

技术

谷歌DeepMind发布SIMA2：通用智能体在复杂3D虚拟世界中性能显著提升

谷歌DeepMind近日推出SIMA2，一款基于Gemini模型的通用智能体，旨在提升其在复杂3D游戏世界中的表现。SIMA2整合了Gemini2.5Flash Lite作为核心推理引擎，使其不仅能执行指令，还能与玩家互动，并能解释意图、回答问题。相比前身SIMA1的31%任务完成率，SIMA2的任务完成率已提升至62%，接近人类玩家的71%。该智能体还扩展了指令渠道，支持文本、语音、图形和表情符号，并通过自我改进机制在无需额外人类演示的情况下学习新任务。SIMA2与Genie3结合，展示了在全新3D环境中识别物体和完成任务的能力，标志着通用智能体向现实世界机器人迈进的重要一步。

AI新闻资讯 - AI Base•2025年11月18日

阅读全文原文

产品

ElevenLabs推出Image & Video（Beta）：一站式AI视听内容创作平台，整合顶尖多模态模型

ElevenLabs正式推出Image & Video（Beta）平台，旨在为创作者和营销人员提供一个集图像、视频、声音、音乐、音效生成于一体的全功能AI内容创作解决方案。该平台整合了Veo、Sora、Kling等多个顶尖多模态生成模型，用户可在同一平台内完成视觉内容创建、声音合成、旁白叠加、配乐编辑，并支持唇形同步、超分辨率增强和时间轴调节等功能，最终输出可用于商业与创意的视频内容。其目标是打造一个统一的创意平台，提升内容创作效率和质量。

Xiaohu.AI 日报•2025年11月18日

阅读全文原文

产品

Poe AI群聊功能上线：支持200人协作与多模型混搭，革新AI互动体验

知名AI平台Poe近日推出创新的“群聊”功能，将多模型AI与多人实时互动深度融合。该功能允许最多200名用户加入群聊，并与超过200种AI模型（包括文本、图像、视频、音频及自定义bot）共同进行协作和头脑风暴。用户可在同一聊天室中灵活调用如GPT-5.1、Claude4.5、Gemini2.5、Sora2和Veo3.1等顶级模型。群聊支持桌面端与移动端跨设备同步，确保协作不中断。Poe群聊适用于旅行规划、创意风暴、问答游戏等多样场景，旨在提升团队协作效率和用户体验，被视为AI民主化的重要一步。

AI新闻资讯 - AI Base•2025年11月18日

阅读全文原文

技术

xAI发布Grok 4.1：情感智能与人格一致性显著提升，LMArena榜单居首

xAI正式发布Grok 4.1，旨在打造更自然、可信的对话伙伴，而非单纯的答题机器。新版本在创造力、情感智能、人格一致性和协作性四大维度实现质变，尤其强调理解细微意图和连贯的人格表现。Grok 4.1引入高阶推理模型作为奖励模型，实现AI训练AI，并首次提出“人格一致性”优化目标。性能评估显示，Grok 4.1在LMArena通用能力榜单中位居榜首，情感智能、创意写作表现优异，并显著降低了幻觉发生率。

Xiaohu.AI 日报•2025年11月18日

阅读全文原文

2025年11月18日 的AI新闻

ElevenLabs推出“Image & Video平台”：图像、视频、音频、音乐一站式AI生成，重塑内容创作效率

谷歌DeepMind发布SIMA2：通用智能体在复杂3D虚拟世界中性能显著提升

ElevenLabs推出Image & Video（Beta）：一站式AI视听内容创作平台，整合顶尖多模态模型

Poe AI群聊功能上线：支持200人协作与多模型混搭，革新AI互动体验

xAI发布Grok 4.1：情感智能与人格一致性显著提升，LMArena榜单居首

2025年11月18日的AI新闻