返回列表
产品AI创新多模态

ElevenLabs推出Image & Video(Beta):一站式AI视听内容创作平台,整合顶尖多模态模型

ElevenLabs正式推出Image & Video(Beta)平台,旨在为创作者和营销人员提供一个集图像、视频、声音、音乐、音效生成于一体的全功能AI内容创作解决方案。该平台整合了Veo、Sora、Kling等多个顶尖多模态生成模型,用户可在同一平台内完成视觉内容创建、声音合成、旁白叠加、配乐编辑,并支持唇形同步、超分辨率增强和时间轴调节等功能,最终输出可用于商业与创意的视频内容。其目标是打造一个统一的创意平台,提升内容创作效率和质量。

Xiaohu.AI 日报

ElevenLabs正式推出Image & Video(Beta)平台,这是一个专为创作者与营销人员设计的全功能AI内容创作平台。该平台将图像、视频、声音、音乐、音效生成功能集于一体,旨在提供一站式的视听内容创作体验。

Image & Video(Beta)通过整合当前顶尖的多模态生成模型,如Veo、Kling、Sora、Wan、Seedance、Nanobanana、Flux Kontext、Seedream等,使用户能够快速创建视觉内容。在ElevenLabs平台内,用户可以直接进行声音合成、旁白叠加、配乐编辑,并最终输出可用于商业与创意的视频内容。

该平台支持以下核心工作流程:
* **图像/视频生成**:利用世界领先模型,适用于制作广告短片、动画分镜、封面缩略图、品牌视频等多种内容,并可通过多模型组合探索不同风格。
* **音频创作与叠加**:可导入至ElevenLabs Studio进行音频合成与配乐,支持选择ElevenLabs提供的声音库或使用用户自己的声音克隆,并可叠加音效、背景音乐。
* **唇形同步与语音替换**:系统支持将合成语音与生成视频实现精准唇形匹配(Lip Sync),并可对已有视频进行声音替换,方便多语种分发或角色配音更换。
* **分镜与资产快速生成**:可创建静态图像用于分镜板、视频脚本规划、品牌元素图像,并可快速精修导出为素材包。
* **Captions & Subtitles(字幕系统)**:自动识别语音并生成字幕,支持多语言与时间轴同步。
* **编辑功能与时间轴操作**:可使用Studio进行时间线编辑、旁白替换、音乐分层等,提供类似视频剪辑软件的操作体验。

ElevenLabs强调,整个创作过程无需跨平台跳转,真正实现“一站式AI视听创作”,旨在打造一个统一的创意平台。通过整合业内最先进的多模态模型与自身强大的语音技术,该平台使得任何人都可以从创意到成品,在一个平台内完成所有步骤。

该平台尤其适用于内容创作者、YouTuber、播客主持人、品牌营销团队、广告公司、教育内容制作人、线上培训讲师、游戏开发者、动画制作者等。

附加功能亮点包括:
* **Topaz 超分辨率增强**:支持视频和图片的清晰度提升。
* **Studio 时间轴操作**:支持精细化视频剪辑与合成。
* **全流程语音控制**:从旁白到角色对白一体生成。

相关新闻

产品

Manus发布Browser Operator扩展:将任意浏览器升级为AI智能浏览器,提升工作效率

Manus公司推出了一款名为Manus Browser Operator的Chrome扩展程序,旨在将任何浏览器转变为具备AI能力的智能浏览器。该扩展能够自动化复杂的浏览器操作,并支持安全访问受保护的网站和系统,如研究平台和CRM工具。其核心功能包括安全的本地访问与会话复用,避免额外的登录验证和验证码,并能长期保持会话活跃。典型应用场景涵盖在数据库中查找资料、在CRM系统执行任务以及在付费平台提取数据。该扩展目前处于Beta测试阶段,逐步向Pro、Plus、Team高级用户开放,支持Chrome和Edge浏览器,旨在大幅提升日常工作效率。

产品

Quora Poe应用推出AI群聊功能,支持200人协作与多模态交互

Quora近日为其AI平台Poe推出了创新性的群聊功能,允许最多200名用户在单一对话中与不同的AI模型和机器人进行协作。该功能支持文本、图像、视频和音频生成等多种形式,旨在变革AI交互方式,为用户带来全新的互动体验。用户可以利用此功能规划旅行、创作Mood Board或参与智力游戏。Poe的群聊功能还具备实时同步聊天记录的特性,方便用户在不同设备间无缝切换。Quora表示,该功能已开发六个月,未来将根据用户反馈持续优化,并鼓励用户创建和分享自定义机器人以探索更多应用场景。

产品

Poe AI群聊功能上线:支持200人协作与多模型混搭,革新AI互动体验

知名AI平台Poe近日推出创新的“群聊”功能,将多模型AI与多人实时互动深度融合。该功能允许最多200名用户加入群聊,并与超过200种AI模型(包括文本、图像、视频、音频及自定义bot)共同进行协作和头脑风暴。用户可在同一聊天室中灵活调用如GPT-5.1、Claude4.5、Gemini2.5、Sora2和Veo3.1等顶级模型。群聊支持桌面端与移动端跨设备同步,确保协作不中断。Poe群聊适用于旅行规划、创意风暴、问答游戏等多样场景,旨在提升团队协作效率和用户体验,被视为AI民主化的重要一步。