ElevenLabs Image & Video Beta：一站式AI视听创作平台发布

ElevenLabs正式推出Image & Video（Beta）平台，旨在为创作者和营销人员提供一个集图像、视频、声音、音乐、音效生成于一体的全功能AI内容创作解决方案。该平台整合了Veo、Sora、Kling等多个顶尖多模态生成模型，用户可在同一平台内完成视觉内容创建、声音合成、旁白叠加、配乐编辑，并支持唇形同步、超分辨率增强和时间轴调节等功能，最终输出可用于商业与创意的视频内容。其目标是打造一个统一的创意平台，提升内容创作效率和质量。

ElevenLabs正式推出Image & Video（Beta）平台，这是一个专为创作者与营销人员设计的全功能AI内容创作平台。该平台将图像、视频、声音、音乐、音效生成功能集于一体，旨在提供一站式的视听内容创作体验。

Image & Video（Beta）通过整合当前顶尖的多模态生成模型，如Veo、Kling、Sora、Wan、Seedance、Nanobanana、Flux Kontext、Seedream等，使用户能够快速创建视觉内容。在ElevenLabs平台内，用户可以直接进行声音合成、旁白叠加、配乐编辑，并最终输出可用于商业与创意的视频内容。

该平台支持以下核心工作流程：

图像/视频生成：利用世界领先模型，适用于制作广告短片、动画分镜、封面缩略图、品牌视频等多种内容，并可通过多模型组合探索不同风格。
音频创作与叠加：可导入至ElevenLabs Studio进行音频合成与配乐，支持选择ElevenLabs提供的声音库或使用用户自己的声音克隆，并可叠加音效、背景音乐。
唇形同步与语音替换：系统支持将合成语音与生成视频实现精准唇形匹配（Lip Sync），并可对已有视频进行声音替换，方便多语种分发或角色配音更换。
分镜与资产快速生成：可创建静态图像用于分镜板、视频脚本规划、品牌元素图像，并可快速精修导出为素材包。
Captions & Subtitles（字幕系统）：自动识别语音并生成字幕，支持多语言与时间轴同步。
编辑功能与时间轴操作：可使用Studio进行时间线编辑、旁白替换、音乐分层等，提供类似视频剪辑软件的操作体验。

ElevenLabs强调，整个创作过程无需跨平台跳转，真正实现“一站式AI视听创作”，旨在打造一个统一的创意平台。通过整合业内最先进的多模态模型与自身强大的语音技术，该平台使得任何人都可以从创意到成品，在一个平台内完成所有步骤。

该平台尤其适用于内容创作者、YouTuber、播客主持人、品牌营销团队、广告公司、教育内容制作人、线上培训讲师、游戏开发者、动画制作者等。

附加功能亮点包括：

Topaz 超分辨率增强：支持视频和图片的清晰度提升。
Studio 时间轴操作：支持精细化视频剪辑与合成。
全流程语音控制：从旁白到角色对白一体生成。

ElevenLabs推出Image & Video（Beta）：一站式AI视听内容创作平台，整合顶尖多模态模型

相关新闻

GitNexus：零服务器代码智能引擎，浏览器内构建交互式知识图谱

Lightpanda推出专为AI和自动化设计的无头浏览器

Anthropic发布Claude官方代码插件目录：高质量精选，提升AI应用