LongCat-Video-Avatar 1.5开源：美团发布商业级数字人视频模型

美团LongCat-Video-Avatar 1.5正式开源：从高拟真迈向商业级数字人应用

美团技术团队正式开源LongCat-Video-Avatar 1.5数字人视频模型。该版本在唇形同步、物理合理性、长视频稳定性、多人互动及推理效率等方面实现了全面提升。作为从SOTA研究向商业级应用跨越的重要里程碑，该模型旨在复杂商业场景中提供稳定、自然的高质量视频输出，推动数字人技术走向真实应用舞台。

2026年7月5日 00:00

美团技术团队

版本发布：美团技术团队正式开源 LongCat-Video-Avatar 1.5，标志着该模型从开源 SOTA 迈向商业级应用。
性能跃升：在唇形同步、物理合理性、长视频稳定性、多人互动和高效推理五个维度实现了全面突破。
商业适配：专注于解决复杂商业场景下的稳定性问题，支持自然、高质量的内容输出。
应用愿景：推动数字人视频生成从实验室环境走向“千人千面”的真实商业舞台。

详细分析

技术性能的全面进化

LongCat-Video-Avatar 1.5 在核心技术指标上进行了深度优化。通过提升唇形同步的精确度与物理合理性，模型生成的数字人形象在视觉表现上更加自然。特别是在长视频稳定性方面的改进，解决了数字人视频在长序列生成中容易出现的崩溃或失真问题，确保了输出内容的连贯性与可靠性。

商业化落地的深度适配

与传统的实验室模型不同，1.5 版本更加强调“真可用”。通过引入多人互动支持和优化推理效率，该模型能够适应更复杂的商业交互场景。这意味着数字人不再局限于简单的单向展示，而是能够处理更具动态性和交互性的任务，满足商业应用中对效率和质量的双重需求。

行业影响

美团此次开源 LongCat-Video-Avatar 1.5，为数字人视频生成领域树立了新的商业级标准。其对推理效率和长视频稳定性的关注，直接触及了数字人技术在大规模商业化落地中的痛点。这一举措不仅降低了企业构建高质量数字人应用的门槛，也将加速数字人技术在直播、营销、客服等多元商业场景中的普及与演进。

常见问题

LongCat-Video-Avatar 1.5 相比前代有哪些核心改进？

该版本在唇形同步、物理合理性、长视频稳定性、多人互动和推理效率上实现了全面提升，旨在实现从高拟真到商业级可用的跨越。

该模型如何支持复杂商业场景？

模型通过优化长视频稳定性和多人互动能力，确保在复杂环境下依然能稳定输出自然、高质量的视频内容，并兼顾了高效推理以满足商业时效性要求。

美团LongCat-Video-Avatar 1.5正式开源：从高拟真迈向商业级数字人应用

核心要点

详细分析

技术性能的全面进化

商业化落地的深度适配

行业影响

常见问题

LongCat-Video-Avatar 1.5 相比前代有哪些核心改进？

该模型如何支持复杂商业场景？

相关新闻

美团正式开源 LongCat-2.0：1.6T 参数规模，创新架构赋能 Agentic Coding 与国产算力适配

LongCat开源VitaBench 2.0：首个真实生活场景长期动态智能体评测基准

美团开源海报生成AIGC技术体系：打造“生成-编辑-评判”全链路闭环