返回列表
产品AI创新科技

谷歌Gemini更新:支持多张参考图像引导AI视频生成,提升用户控制力

谷歌近日更新了Gemini应用,引入了全新的AI视频生成控制方式。用户现在可以在单个视频提示中上传多张参考图像,系统将根据这些图像和文本生成视频及音频,从而更直接地掌控最终视频的外观和声音。此功能此前已在谷歌的扩展视频AI平台Flow中测试。此外,Veo3.1版本相比Veo3.0在纹理真实感、输入保真度和音频质量方面均有显著提升。此次更新旨在提升AI工具的灵活性和可定制性,满足创作者多样化的需求。

AI新闻资讯 - AI Base

近日,谷歌对Gemini应用进行了更新,为用户提供了全新的AI视频生成控制方式。用户现在可以在单个视频提示中上传多张参考图像。系统将根据这些图像及文本生成视频和音频,这一新功能使用户能够更直接地掌控最终视频的外观和声音。谷歌此前已在其扩展视频AI平台Flow中测试了这一功能。Flow不仅支持扩展现有视频片段和拼接多个场景,还提供了比Gemini应用更高的视频配额。根据谷歌的说法,自10月中旬发布的Veo3.1版本相比Veo3.0在纹理真实感、输入保真度和音频质量方面都有显著提升。通过这次更新,用户能够更灵活地利用AI工具,创造出更符合自己需求的内容。多参考图像的上传功能,意味着创作者可以在视频制作中融入更多的个性化元素,为观众提供更丰富的视觉和听觉体验。在当前AI技术飞速发展的时代,谷歌的这一举措展示了其在视频生成领域的持续创新。随着用户需求的多样化,AI工具的灵活性和可定制性愈发重要,Gemini的新功能无疑将吸引更多创作者的关注与使用。

相关新闻

产品

Manus发布Browser Operator扩展:将任意浏览器升级为AI智能浏览器,提升工作效率

Manus公司推出了一款名为Manus Browser Operator的Chrome扩展程序,旨在将任何浏览器转变为具备AI能力的智能浏览器。该扩展能够自动化复杂的浏览器操作,并支持安全访问受保护的网站和系统,如研究平台和CRM工具。其核心功能包括安全的本地访问与会话复用,避免额外的登录验证和验证码,并能长期保持会话活跃。典型应用场景涵盖在数据库中查找资料、在CRM系统执行任务以及在付费平台提取数据。该扩展目前处于Beta测试阶段,逐步向Pro、Plus、Team高级用户开放,支持Chrome和Edge浏览器,旨在大幅提升日常工作效率。

产品

Quora Poe应用推出AI群聊功能,支持200人协作与多模态交互

Quora近日为其AI平台Poe推出了创新性的群聊功能,允许最多200名用户在单一对话中与不同的AI模型和机器人进行协作。该功能支持文本、图像、视频和音频生成等多种形式,旨在变革AI交互方式,为用户带来全新的互动体验。用户可以利用此功能规划旅行、创作Mood Board或参与智力游戏。Poe的群聊功能还具备实时同步聊天记录的特性,方便用户在不同设备间无缝切换。Quora表示,该功能已开发六个月,未来将根据用户反馈持续优化,并鼓励用户创建和分享自定义机器人以探索更多应用场景。

产品

ElevenLabs推出Image & Video(Beta):一站式AI视听内容创作平台,整合顶尖多模态模型

ElevenLabs正式推出Image & Video(Beta)平台,旨在为创作者和营销人员提供一个集图像、视频、声音、音乐、音效生成于一体的全功能AI内容创作解决方案。该平台整合了Veo、Sora、Kling等多个顶尖多模态生成模型,用户可在同一平台内完成视觉内容创建、声音合成、旁白叠加、配乐编辑,并支持唇形同步、超分辨率增强和时间轴调节等功能,最终输出可用于商业与创意的视频内容。其目标是打造一个统一的创意平台,提升内容创作效率和质量。