ElevenLabs推出Image & Video(Beta):一站式AI视听内容创作平台,整合顶尖多模态模型
ElevenLabs正式推出Image & Video(Beta)平台,旨在为创作者和营销人员提供一个集图像、视频、声音、音乐、音效生成于一体的全功能AI内容创作解决方案。该平台整合了Veo、Sora、Kling等多个顶尖多模态生成模型,用户可在同一平台内完成视觉内容创建、声音合成、旁白叠加、配乐编辑,并支持唇形同步、超分辨率增强和时间轴调节等功能,最终输出可用于商业与创意的视频内容。其目标是打造一个统一的创意平台,提升内容创作效率和质量。
ElevenLabs正式推出Image & Video(Beta)平台,这是一个专为创作者与营销人员设计的全功能AI内容创作平台。该平台将图像、视频、声音、音乐、音效生成功能集于一体,旨在提供一站式的视听内容创作体验。
Image & Video(Beta)通过整合当前顶尖的多模态生成模型,如Veo、Kling、Sora、Wan、Seedance、Nanobanana、Flux Kontext、Seedream等,使用户能够快速创建视觉内容。在ElevenLabs平台内,用户可以直接进行声音合成、旁白叠加、配乐编辑,并最终输出可用于商业与创意的视频内容。
该平台支持以下核心工作流程:
* **图像/视频生成**:利用世界领先模型,适用于制作广告短片、动画分镜、封面缩略图、品牌视频等多种内容,并可通过多模型组合探索不同风格。
* **音频创作与叠加**:可导入至ElevenLabs Studio进行音频合成与配乐,支持选择ElevenLabs提供的声音库或使用用户自己的声音克隆,并可叠加音效、背景音乐。
* **唇形同步与语音替换**:系统支持将合成语音与生成视频实现精准唇形匹配(Lip Sync),并可对已有视频进行声音替换,方便多语种分发或角色配音更换。
* **分镜与资产快速生成**:可创建静态图像用于分镜板、视频脚本规划、品牌元素图像,并可快速精修导出为素材包。
* **Captions & Subtitles(字幕系统)**:自动识别语音并生成字幕,支持多语言与时间轴同步。
* **编辑功能与时间轴操作**:可使用Studio进行时间线编辑、旁白替换、音乐分层等,提供类似视频剪辑软件的操作体验。
ElevenLabs强调,整个创作过程无需跨平台跳转,真正实现“一站式AI视听创作”,旨在打造一个统一的创意平台。通过整合业内最先进的多模态模型与自身强大的语音技术,该平台使得任何人都可以从创意到成品,在一个平台内完成所有步骤。
该平台尤其适用于内容创作者、YouTuber、播客主持人、品牌营销团队、广告公司、教育内容制作人、线上培训讲师、游戏开发者、动画制作者等。
附加功能亮点包括:
* **Topaz 超分辨率增强**:支持视频和图片的清晰度提升。
* **Studio 时间轴操作**:支持精细化视频剪辑与合成。
* **全流程语音控制**:从旁白到角色对白一体生成。