谷歌Gemini更新:支持多张参考图像引导AI视频生成,提升用户控制力
谷歌近日更新了Gemini应用,引入了全新的AI视频生成控制方式。用户现在可以在单个视频提示中上传多张参考图像,系统将根据这些图像和文本生成视频及音频,从而更直接地掌控最终视频的外观和声音。此功能此前已在谷歌的扩展视频AI平台Flow中测试。此外,Veo3.1版本相比Veo3.0在纹理真实感、输入保真度和音频质量方面均有显著提升。此次更新旨在提升AI工具的灵活性和可定制性,满足创作者多样化的需求。
近日,谷歌对Gemini应用进行了更新,为用户提供了全新的AI视频生成控制方式。用户现在可以在单个视频提示中上传多张参考图像。系统将根据这些图像及文本生成视频和音频,这一新功能使用户能够更直接地掌控最终视频的外观和声音。谷歌此前已在其扩展视频AI平台Flow中测试了这一功能。Flow不仅支持扩展现有视频片段和拼接多个场景,还提供了比Gemini应用更高的视频配额。根据谷歌的说法,自10月中旬发布的Veo3.1版本相比Veo3.0在纹理真实感、输入保真度和音频质量方面都有显著提升。通过这次更新,用户能够更灵活地利用AI工具,创造出更符合自己需求的内容。多参考图像的上传功能,意味着创作者可以在视频制作中融入更多的个性化元素,为观众提供更丰富的视觉和听觉体验。在当前AI技术飞速发展的时代,谷歌的这一举措展示了其在视频生成领域的持续创新。随着用户需求的多样化,AI工具的灵活性和可定制性愈发重要,Gemini的新功能无疑将吸引更多创作者的关注与使用。