返回列表
行业新闻AI创新科技

ElevenLabs推出“Image & Video平台”:图像、视频、音频、音乐一站式AI生成,重塑内容创作效率

多模态AI公司ElevenLabs正式上线“Image & Video平台”,将图像生成、视频生成、声音合成、音乐创作和音效设计整合于一体。该平台旨在帮助创作者和营销人员告别多平台切换,实现从剧本到成品商业视频的一站式制作。新平台打通了视觉与音频能力,用户可直接在同一界面完成画面生成、视频制作、旁白添加、背景音乐和环境音效叠加,官方宣称最快几分钟即可产出可投放的营销视频。平台集成了Google Veo、OpenAI Sora、Kling等顶级多模态模型,并针对商业应用进行了优化,支持多种视频比例、内置商用安全素材库及多语种旁白替换功能,大幅提升AI内容生产效率。

AI新闻资讯 - AI Base

多模态AI领域的领先企业ElevenLabs近日重磅宣布,其全新的“Image & Video平台”已正式上线。这一更新标志着ElevenLabs不再仅仅是一个语音工具,而是转型为一个集图像生成、视频生成、声音合成、音乐创作、音效设计于一体的超级AI内容工厂。此举旨在彻底改变创作者和营销人员的工作流程,使他们能够告别多平台来回切换的繁琐,实现从剧本构思到成品级商业视频的一站式制作。

新平台的核心亮点在于其“一站闭环”能力,将视觉生成与ElevenLabs引以为傲的音频能力彻底打通。用户可以首先生成画面和动态视频,然后直接在同一界面叠加专业级旁白、背景音乐和环境音效,整个流程实现零缝隙衔接。官方宣称,从概念提出到生成可直接投放的营销视频,最快只需几分钟,这无疑将重新定义AI内容生产的效率。

“Image & Video平台”集结了强大的模型矩阵,一次性集成了全球顶级的多模态模型,包括Google Veo(以超长一致性视频著称)、OpenAI Sora(提供电影级画面质感)、Kling(擅长超现实物理动效),以及Nanobanana、Flux Kontext、Seedream等新锐黑马。这些视觉模型将与ElevenLabs自研的全球最自然AI语音技术和最新的音乐生成模型相结合,使用户能够随心所欲地混搭“最强视觉”与“最强听觉”,从而生成远超单一模型拼凑效果的内容。

该平台明确专为商业应用而生,针对创作者和营销人员进行了深度优化。它支持直接输出竖屏或横屏等多种比例,以适配抖音、小红书、TikTok、YouTube等主流短视频平台。平台内置商业安全语音与音乐库,确保生成内容可直接用于广告投放。此外,用户还可以一键替换旁白语言,轻松制作多语种版本,拓展全球市场。平台还提供完整的事件线编辑器,支持精确到帧的音画同步调整,满足专业级制作需求。

根据官方演示案例,仅需一段30秒的文案,用户即可在平台内完成一系列操作:首先生成品牌故事板图像,接着将其转化为流畅视频,然后添加CEO级别自然旁白,叠加情绪化背景音乐和环境音效,最终导出4K商用成品。整个过程无需在Premiere、Midjourney、Runway、Suno等多个工具之间来回倒文件。AIbase编辑部评论指出,ElevenLabs此举直接将“文本到视频”的天花板又抬高了一大截,更重要的是它一次性解决了最难的音画同步问题。当视觉生成与声音生成两大王者合体,独立创作者与中小企业将迎来真正的降维打击时代。

相关新闻

行业新闻

谷歌Vids视频编辑平台AI功能全面免费开放:含AI配音、智能剪辑与图像编辑

谷歌宣布其视频编辑平台Vids的多项AI功能现已向所有拥有Gmail账号的用户免费开放。此前,这些功能仅限付费用户使用。新开放的功能包括AI语音配音、自动去除冗余口语(转录修剪)以及AI图像编辑。转录修剪功能可自动识别并删除视频中的“嗯”、“啊”等冗余口语和长时间静默,显著提升视频质量。AI语音配音允许用户通过文本脚本生成专业配音,并提供七种声音选择。AI图像编辑工具则能帮助用户轻松修改视频图片,如去除背景、按描述编辑或将静态照片转为动态视频。谷歌希望通过此举,让更多用户轻松制作高质量视频内容。

行业新闻

Google AI开发者宣布:立即开始使用Gemini 3进行开发

Google AI开发者账号于2025年11月19日发布消息,鼓励开发者“立即开始使用Gemini 3进行开发”。此消息表明Gemini 3已可供开发者使用,预示着新的开发工具和可能性。该推文获得了少量转发和点赞,并有超过4000次浏览。

行业新闻

Google 发布 Gemini 3:AI推理、多模态融合与智能体行为实现质的飞跃

Google 正式发布 Gemini 3,官方定义其在更高层次的推理、多模态融合与智能体行为上实现了质的飞跃。Gemini 3 具备理解复杂场景、跨模态分析与自主执行任务的综合能力。其核心改进包括推理深度与问题分解能力,在博士级考试中表现出色;多模态理解能力显著提升,能处理图像、视频、音频与代码的融合任务;并引入了真正的“自主执行与验证”机制,通过 Google Antigravity 平台实现AI自动规划、编写代码和验证结果。此外,Gemini 3 还具备超长上下文理解能力和系统性思维,可用于学习、构建和规划等三大应用场景。