谷歌Gemini更新：多图引导AI视频生成，增强用户创作控制

谷歌Gemini更新：支持多张参考图像引导AI视频生成，提升用户控制力

谷歌近日更新了Gemini应用，引入了全新的AI视频生成控制方式。用户现在可以在单个视频提示中上传多张参考图像，系统将根据这些图像和文本生成视频及音频，从而更直接地掌控最终视频的外观和声音。此功能此前已在谷歌的扩展视频AI平台Flow中测试。此外，Veo3.1版本相比Veo3.0在纹理真实感、输入保真度和音频质量方面均有显著提升。此次更新旨在提升AI工具的灵活性和可定制性，满足创作者多样化的需求。

2025年11月17日 01:19

AI新闻资讯 - AI Base

近日，谷歌对Gemini应用进行了更新，为用户提供了全新的AI视频生成控制方式。用户现在可以在单个视频提示中上传多张参考图像。系统将根据这些图像及文本生成视频和音频，这一新功能使用户能够更直接地掌控最终视频的外观和声音。谷歌此前已在其扩展视频AI平台Flow中测试了这一功能。Flow不仅支持扩展现有视频片段和拼接多个场景，还提供了比Gemini应用更高的视频配额。根据谷歌的说法，自10月中旬发布的Veo3.1版本相比Veo3.0在纹理真实感、输入保真度和音频质量方面都有显著提升。通过这次更新，用户能够更灵活地利用AI工具，创造出更符合自己需求的内容。多参考图像的上传功能，意味着创作者可以在视频制作中融入更多的个性化元素，为观众提供更丰富的视觉和听觉体验。在当前AI技术飞速发展的时代，谷歌的这一举措展示了其在视频生成领域的持续创新。随着用户需求的多样化，AI工具的灵活性和可定制性愈发重要，Gemini的新功能无疑将吸引更多创作者的关注与使用。

谷歌Gemini更新：支持多张参考图像引导AI视频生成，提升用户控制力

相关新闻

GitNexus：零服务器代码智能引擎，浏览器内构建交互式知识图谱

Lightpanda推出专为AI和自动化设计的无头浏览器

Anthropic发布Claude官方代码插件目录：高质量精选，提升AI应用