2025年11月18日 的AI新闻

行业新闻

ElevenLabs推出“Image & Video平台”:图像、视频、音频、音乐一站式AI生成,重塑内容创作效率

多模态AI公司ElevenLabs正式上线“Image & Video平台”,将图像生成、视频生成、声音合成、音乐创作和音效设计整合于一体。该平台旨在帮助创作者和营销人员告别多平台切换,实现从剧本到成品商业视频的一站式制作。新平台打通了视觉与音频能力,用户可直接在同一界面完成画面生成、视频制作、旁白添加、背景音乐和环境音效叠加,官方宣称最快几分钟即可产出可投放的营销视频。平台集成了Google Veo、OpenAI Sora、Kling等顶级多模态模型,并针对商业应用进行了优化,支持多种视频比例、内置商用安全素材库及多语种旁白替换功能,大幅提升AI内容生产效率。

AI新闻资讯 - AI Base
技术

谷歌DeepMind发布SIMA2:通用智能体在复杂3D虚拟世界中性能显著提升

谷歌DeepMind近日推出SIMA2,一款基于Gemini模型的通用智能体,旨在提升其在复杂3D游戏世界中的表现。SIMA2整合了Gemini2.5Flash Lite作为核心推理引擎,使其不仅能执行指令,还能与玩家互动,并能解释意图、回答问题。相比前身SIMA1的31%任务完成率,SIMA2的任务完成率已提升至62%,接近人类玩家的71%。该智能体还扩展了指令渠道,支持文本、语音、图形和表情符号,并通过自我改进机制在无需额外人类演示的情况下学习新任务。SIMA2与Genie3结合,展示了在全新3D环境中识别物体和完成任务的能力,标志着通用智能体向现实世界机器人迈进的重要一步。

AI新闻资讯 - AI Base
产品

ElevenLabs推出Image & Video(Beta):一站式AI视听内容创作平台,整合顶尖多模态模型

ElevenLabs正式推出Image & Video(Beta)平台,旨在为创作者和营销人员提供一个集图像、视频、声音、音乐、音效生成于一体的全功能AI内容创作解决方案。该平台整合了Veo、Sora、Kling等多个顶尖多模态生成模型,用户可在同一平台内完成视觉内容创建、声音合成、旁白叠加、配乐编辑,并支持唇形同步、超分辨率增强和时间轴调节等功能,最终输出可用于商业与创意的视频内容。其目标是打造一个统一的创意平台,提升内容创作效率和质量。

Xiaohu.AI 日报
产品

Poe AI群聊功能上线:支持200人协作与多模型混搭,革新AI互动体验

知名AI平台Poe近日推出创新的“群聊”功能,将多模型AI与多人实时互动深度融合。该功能允许最多200名用户加入群聊,并与超过200种AI模型(包括文本、图像、视频、音频及自定义bot)共同进行协作和头脑风暴。用户可在同一聊天室中灵活调用如GPT-5.1、Claude4.5、Gemini2.5、Sora2和Veo3.1等顶级模型。群聊支持桌面端与移动端跨设备同步,确保协作不中断。Poe群聊适用于旅行规划、创意风暴、问答游戏等多样场景,旨在提升团队协作效率和用户体验,被视为AI民主化的重要一步。

AI新闻资讯 - AI Base
技术

xAI发布Grok 4.1:情感智能与人格一致性显著提升,LMArena榜单居首

xAI正式发布Grok 4.1,旨在打造更自然、可信的对话伙伴,而非单纯的答题机器。新版本在创造力、情感智能、人格一致性和协作性四大维度实现质变,尤其强调理解细微意图和连贯的人格表现。Grok 4.1引入高阶推理模型作为奖励模型,实现AI训练AI,并首次提出“人格一致性”优化目标。性能评估显示,Grok 4.1在LMArena通用能力榜单中位居榜首,情感智能、创意写作表现优异,并显著降低了幻觉发生率。

Xiaohu.AI 日报