
美团开源 LongCat-Video-Avatar 1.5:从高拟真到商业级可用的数字人视频模型跃迁
美团技术团队近日正式开源 LongCat-Video-Avatar 1.5,这是一款旨在将数字人视频生成从实验室 SOTA 提升至商业级应用水平的深度学习模型。该版本在唇形同步、物理合理性、长视频稳定性、多人互动及推理效率五大核心领域实现了显著突破,解决了复杂商业场景下数字人输出不稳定的痛点,标志着数字人技术正式进入“真可用”时代。

美团技术团队近日正式开源 LongCat-Video-Avatar 1.5,这是一款旨在将数字人视频生成从实验室 SOTA 提升至商业级应用水平的深度学习模型。该版本在唇形同步、物理合理性、长视频稳定性、多人互动及推理效率五大核心领域实现了显著突破,解决了复杂商业场景下数字人输出不稳定的痛点,标志着数字人技术正式进入“真可用”时代。

美团技术团队在国际自然语言处理顶会ACL 2026中共有6篇论文被收录。这些研究涵盖了大模型评测、复杂流程推理、竞赛级数学思维优化、强化学习优化及生成式推荐等前沿领域,展示了美团在构建生成式AI新范式方面的深度探索与技术实力。

美团LongCat团队正式发布全新推理评测基准General 365。在对26款主流大模型的实测中,即便是目前性能领先的Gemini 3 Pro准确率也仅为62.8%,而绝大多数受测模型得分均低于60分的及格线。这一结果揭示了当前AI模型在复杂推理任务上的局限性,为行业树立了更具挑战性的评测标尺。

美团技术团队近期分享了其在AI Coding领域的深度实践,通过Agent评测思路成功完成了31万行代码的重构。针对AI生成代码可能带来的系统性混乱,团队建立了技术债梳理、规则建设、重构SOP及Pre-PR机制,将原本高成本的专项重构转化为随迭代持续进行的日常动作,为大规模AI代码管理提供了可借鉴的范式。

美团技术团队正式发布LARYBench(Latent Action Representation Yielding Benchmark),这是一个旨在评估从大规模视觉数据中学习通用隐式动作表征的系统化评测基准。研究表明,通用视觉模型在动作泛化与控制精度上显著优于专门的具身动作专家模型,并证实了具身动作表征可从大规模人类视频数据中自然涌现,为具身智能研究提供了重要参考。

美团LongCat团队正式发布LongCat-AudioDiT模型,旨在解决零样本TTS音色克隆中的技术瓶颈。该模型创新性地摒弃了梅尔谱等中间表示,直接在波形潜空间内进行基于扩散模型的文本转语音(TTS)建模。通过这种方式,模型从根源上阻断了数据转换过程中产生的级联误差,使AI能够直接学习声音本身的规律,显著提升了音色克隆的还原度与自然度。

美团技术团队正式开源 LongCat-Flash-Prover 模型,旨在解决 AI 在数学定理证明中的严谨性难题。该模型专注于数学形式化与严苛逻辑链条的构建,改变了以往 AI 仅追求“答对数值”的模式,有效规避了自然语言歧义导致的证明失效,标志着 AI 在复杂推理领域取得了重要进展。

美团技术团队正式发布并开源原生多模态模型 LongCat-Next 及其离散分词器。该模型旨在探索 AI 通往物理世界的路径,通过将视觉和语音作为核心能力,使 AI 能够更好地感知、理解并作用于真实世界。此次开源旨在邀请开发者共同构建具备真实世界交互能力的 AI 系统。

美团数据平台近期分享了其在BI领域的最新探索。通过构建以指标平台为核心的新一代架构,美团重点建设了“自动语义”和“增强计算”两大核心能力。该架构旨在解决传统BI平台在个性化数据集驱动下普遍存在的指标口径不一致及查询性能低下等核心痛点,实现了从数据集驱动向指标驱动的技术转型。
OpenMed是由开发者maziyarpanahi推出的开源医疗AI项目,近期在GitHub Trending榜单引起广泛关注。该项目核心主打“本地优先”理念,旨在为医疗领域提供可私有化部署的AI解决方案。作为开源医疗AI领域的新势力,OpenMed强调数据的本地化处理,为医疗行业在智能化应用与患者隐私保护之间寻找到了关键平衡点。
Superpowers 是由开发者 obra 在 GitHub 上发布的开源项目,旨在为编程智能体提供一套完整的软件开发方法论。该项目通过一系列可组合的技能和初始指令,构建了一个行之有效的智能体技能框架,旨在优化 AI 在软件开发过程中的协作效率与执行逻辑。
知名开发者 Addy Osmani 在 GitHub 上发布了 agent-skills 项目,旨在为 AI 编程智能体提供一套生产级的工程技能。该项目通过将工作流、质量门禁和最佳实践进行编码化,提升 AI 智能体在实际软件开发环境中的可靠性与专业性,标志着 AI 辅助编程向标准化工程迈进。

知名科技媒体 Tech in Asia 发布了“亚洲50家正在崛起的AI初创公司”榜单。该榜单聚焦于亚洲地区最具创新力和增长潜力的AI企业,指出这些初创公司具备在未来成长为行业领军者的巨大潜力。本文将基于此报道,分析亚洲AI生态的崛起及其对全球科技格局的深远影响。

一名开发者在Fable平台正式关闭之前,利用该工具成功创作并发布了80款涵盖街机、益智、逻辑及策略等多种类型的迷你游戏。这些作品目前已整合至MiniGames World平台,为用户提供包括《Photon Darts》、《Gridlock》和《Comet Chain》在内的丰富免费在线游戏体验,展示了高效的内容创作能力。

据《华尔街日报》报道,亚马逊的一项网络安全研究以及首席执行官安迪·贾西(Andy Jassy)与白宫的直接对话,促使美国政府发布了出口管制指令。该指令直接导致人工智能巨头 Anthropic 停止了对其 Fable 5 和 Mythos 5 模型的访问权限。亚马逊的研究报告指出,这些模型在特定条件下可能存在安全隐患,从而引发了政府对高端 AI 技术出口的严厉监管。

毕马威(KPMG)近期撤回了一份关于人工智能使用情况的研究报告,原因是该报告中出现了明显的“AI幻觉”内容。这一事件再次印证了人工智能在处理涉及自身行业的事实性信息时,依然存在严重的准确性问题。该事件凸显了即便是在专业咨询机构中,过度依赖AI生成内容也可能导致严重的专业信誉风险。
英国德比郡一名警官因涉嫌在多起案件中使用人工智能(AI)技术“制造证据”而正接受调查。此事件引发了对执法部门滥用AI技术以及司法公正性的严重关切。目前相关部门已介入,旨在核实受影响案件的具体范围及该行为对法律程序的破坏程度。

据TechCrunch报道,亚马逊首席执行官安迪·贾西(Andy Jassy)可能是引发Anthropic安全担忧的关键人物。这些担忧直接导致Anthropic在周五切断了全球范围内对其两款AI模型的访问。这一举动发生在政府可能采取严厉打击措施之前,凸显了大型科技公司领导层在AI安全监管中的影响力。该事件反映了云服务巨头与AI初创公司在合规与安全领域的深度交织。

据TechCrunch报道,OpenAI正面临来自美国多个州总检察长的联合调查。虽然目前参与调查的具体州份名单尚未公开,但调查范围已明确指向OpenAI的广告政策及其对健康数据的处理方式。这一行动显示出地方监管机构对生成式AI巨头在商业实践和数据隐私合规性方面的审查正在显著加强。

智谱AI正式发布其迄今为止最强大的开源模型GLM-5.2。该模型不仅支持1M(百万级)超长上下文窗口,还在独立完成长程任务方面保持领先,为构建复杂智能体应用提供核心支持。在外部技术限制背景下,智谱AI通过此次“激进开源”重申了科学无国界及AGI应服务于全人类的理念。模型已向特定用户开放,API将于下周上线。