
LARYBench发布:美团定义具身动作表征新基准,揭示通用视觉模型显著优势
美团技术团队正式发布LARYBench(Latent Action Representation Yielding Benchmark),这是一个旨在评估从大规模视觉数据中学习通用隐式动作表征的系统化基准。研究表明,通用视觉模型在动作泛化与控制精度上均优于专门的具身专家模型,并首次证实具身动作表征可从大规模人类视频数据中涌现,为具身智能研究提供了重要度量工具。

美团技术团队正式发布LARYBench(Latent Action Representation Yielding Benchmark),这是一个旨在评估从大规模视觉数据中学习通用隐式动作表征的系统化基准。研究表明,通用视觉模型在动作泛化与控制精度上均优于专门的具身专家模型,并首次证实具身动作表征可从大规模人类视频数据中涌现,为具身智能研究提供了重要度量工具。

美团技术团队在国际自然语言处理顶级会议ACL 2026中表现出色,共有6篇论文被收录。这些研究成果涵盖了大模型评测、复杂流程推理、竞赛级数学思维优化、强化学习优化及生成式推荐等多个前沿领域。本文将深度解析美团在这些技术方向上的布局,探讨其如何通过科研创新驱动生成式AI的技术演进与应用落地。

美团LongCat团队正式提出并开源了WBench,这是全球首个针对交互式视频世界模型的系统性多轮评测基准。WBench被形象地比喻为“CT扫描仪”,旨在精准定位世界模型在从“被动观看”向“主动交互”演进过程中的技术卡点。该基准的发布为评估AI在复杂动态环境中的交互能力提供了标准化工具,标志着世界模型研究进入了可量化、可诊断的新阶段。

美团LongCat团队正式发布全新推理评测基准General 365。在对26款主流模型的实测中,顶尖模型Gemini 3 Pro的准确率仅为62.8%,而绝大多数模型得分未能达到60分的及格线。这一结果揭示了当前AI模型在复杂推理任务中的普遍局限性,General 365也因此成为衡量模型逻辑推理能力的新标尺。

本文介绍了美团技术团队在AI生成代码占比超过90%的背景下,如何通过Agent评测思路应对AI带来的系统混乱挑战。通过技术债梳理、规则建设、重构SOP及Pre-PR机制,团队成功完成了31万行代码的重构实践,将高成本的专项重构转化为随迭代持续进行的日常动作,为AI时代的软件工程管理提供了新范式。

美团技术团队正式发布并开源了原生多模态模型 LongCat-Next 及其核心组件离散分词器。该模型是美团在“物理世界 AI”路径上的重要探索,旨在通过将视觉和语音能力原生集成,使 AI 能够像人类一样感知、理解并作用于真实物理环境。此次开源旨在通过技术共享,邀请全球开发者共同构建更具现实交互能力的智能系统。

美团数据平台近期分享了其在BI领域的创新实践,通过构建以指标平台为核心的新一代BI架构,重点建设自动语义和增强计算两大核心能力。该方案针对性地解决了传统BI平台在个性化数据集驱动下普遍存在的口径混乱及查询性能瓶颈,实现了数据治理与分析效率的显著提升。

美团技术团队宣布正式开源LongCat-Video-Avatar 1.5,这是一款标志着从开源SOTA迈向商业级应用的数字人视频模型。该版本在唇形同步、物理合理性、长视频稳定性、多人互动及高效推理五大核心领域实现了全面跃升,旨在解决复杂商业场景下的高质量内容输出难题,推动数字人技术从实验演练走向真实商业舞台。

美团LongCat团队正式发布LongCat-AudioDiT模型,通过在波形潜空间直接应用扩散模型,彻底抛弃了传统的梅尔谱中间表示。该技术突破了零样本TTS音色克隆的瓶颈,从根源上阻断了数据转换过程中的级联误差,为实现更高质量、更真实的声音克隆提供了全新的技术路径。
Agent-Reach是由开发者Panniantong推出的开源项目,旨在为AI智能体提供“全网视野”。该工具通过统一的命令行界面(CLI),支持在无需支付API费用的情况下,读取和搜索Twitter、Reddit、YouTube、GitHub以及国内主流平台Bilibili和红小书(XiaoHongShu)的内容,极大地降低了开发者构建具备实时信息获取能力AI Agent的门槛。
Meshery作为一款定位为“云原生管理器”的开源项目,近期在GitHub Trending榜单上表现强劲。该项目旨在为云原生环境提供核心管理能力,通过开源社区的协作,解决云原生架构中的复杂管理挑战。本文将基于其最新的动态,分析其在云原生生态中的定位及行业意义。
cua是一个专为“计算机使用智能体”(Computer-Use Agents)打造的开源基础设施项目。该项目通过提供标准化的沙箱环境、软件开发工具包(SDK)以及基准测试工具,解决了AI智能体在不同操作系统(包括macOS、Linux和Windows)上进行训练与评估的难题。cua的出现为开发者构建能够直接操作桌面系统的自主AI提供了关键的底层支持,标志着AI自动化技术向全系统交互迈出了重要一步。

2026年第一季度,AI应用市场迎来重大转折。最新报告显示,ChatGPT的市场份额已滑落至50%以下。同时,受中国和印度市场影响,亚洲地区的AI应用下载量在2026年Q1首次出现下降。这一数据反映了全球AI竞争格局的剧烈变动以及亚洲核心市场的增长放缓。

Wolfram Research 宣布推出 Wolfram Language 和 Mathematica 的第 15 个主版本。该版本标志着科学计算与人工智能的深度融合,在每个笔记本中内置了 AI 助手,并引入了革命性的符号音乐处理能力。此外,新版本在时间序列分析、分类数据计算、偏微分方程(PDE)求解以及 GPU 加速等方面进行了大规模升级,旨在为现代科研和工程提供更强大的计算环境。

NVIDIA 宣布其 NVIDIA XR AI 框架正式进入公测阶段(Public Beta)。该框架专为开发者设计,旨在为 AR 眼镜及各类 XR 设备构建先进的多模态 AI 智能体。通过这一工具,开发者能够利用 NVIDIA 的技术积累,将具备感知与交互能力的智能助手引入可穿戴设备,开启“解放双手”的 AI 交互新时代。

Coherent公司在德克萨斯州谢尔曼(Sherman)正式为其扩建的制造大楼举行奠基仪式。作为AI系统连接的关键组件供应商,Coherent专注于生产激光器、光学元件及化合物半导体。此次扩建旨在通过提升光学基础设施的产能,支持AI系统对高速数据传输的需求,并继续运营其全球首个6英寸磷化铟(InP)制造设施。
英国政府宣布与Google DeepMind达成合作伙伴关系,共同开发一款全新的AI驱动原型系统。该项目旨在通过人工智能技术优化住房建设的规划与决策流程,通过技术手段缩短审批周期,从而加速英国国内的房屋建设进度,解决长期以来的住房供应挑战。

谷歌于2026年6月16日正式推出Android 17及Wear OS 7操作系统。此次更新重点引入了全新的多任务处理工具、家长控制功能及安全工具,并对智能手表体验进行了显著升级。伴随发布的Pixel Drop更新更是将谷歌最新的Gemini AI模型扩展至旗下设备,进一步强化了移动端的AI原生体验。

荷兰应用科学研究组织(TNO)联合SURF和荷兰法医研究所(NFI)正在开发GPT-NL,这是一个专为荷兰语环境设计的主权语言模型。该项目旨在通过建立独立的人工智能生态系统,确保在数据隐私、版权和透明度方面符合公共价值,减少对非欧洲供应商的依赖,从而加强荷兰及欧洲的数字自主权。
谷歌研究博客(Google Research Blog)发布了关于“地球AI”(Earth AI)在自然修复领域应用的最新进展。该研究强调了AI技术正从基础的像素级图像处理转向复杂的生态修复规划,旨在通过技术创新应对气候变化,并推动全球可持续发展的进程。

根据彭博社记者Mark Gurman的最新报道,苹果公司正计划在2027年推出多款创新硬件。其中最受关注的是配备摄像头的AirPods,旨在增强AI功能体验,预计于2027年下半年发布。此外,传闻还提到了苹果的第二款折叠屏iPhone。这些动态显示了苹果在WWDC之后,正加速将AI技术与硬件深度融合的长期布局。

谷歌与Xreal联合开发的Project Aura项目正式定名为Xreal Aura,并已开启预订。该设备作为市场上第二款搭载Android XR系统的硬件产品,预订金为99美元。官方预计将于2026年秋季在美国、英国、日本、加拿大和韩国正式发售。此次预订的开启标志着谷歌在空间计算领域的软件生态正通过合作伙伴硬件实现快速扩张。

高通在增强现实世界博览会(AWE)上正式推出了Snapdragon Reality Elite芯片,旨在为下一代XR(扩展现实)设备提供核心动力。尽管智能眼镜领域目前仍处于起步阶段,但该芯片的发布预示着更强大的可穿戴设备即将到来。高通此举标志着其在XR底层硬件领域的进一步深耕,旨在通过提升算力来优化智能眼镜的用户体验。

Snap公司正式向公众推出了其备受期待的增强现实(AR)眼镜——Specs。这款被定义为“内置于透明AR眼镜中的可穿戴计算机”的产品定价为2,195美元,标志着Snap在高端AR硬件市场的重大布局。目前,消费者已可通过官方网站以200美元的可退还定金进行预订,预计该产品将于今年秋季在美国、英国等地区正式发货。这一举动显示了Snap将AR技术从实验室推向大众消费市场的决心。

根据WordPress VIP的最新调查,60%的美国消费者表示,品牌营销信息中出现“AI”一词会降低其购买意愿。尽管企业日益将AI搜索视为重要的流量获取渠道,但消费者对AI生成的答案仍持谨慎和怀疑态度。这一发现揭示了企业AI战略与消费者信任之间的显著错位。

在HPE Discover拉斯维加斯大会上,HPE与英伟达宣布扩展其“HPE AI Factory with NVIDIA”解决方案。此次更新重点针对智能体AI(Agentic AI)从原型走向生产的需求,推出了包括NVIDIA Vera CPU和NVIDIA Agent Toolkit在内的关键技术,旨在为企业构建下一代AI工厂,加速智能体时代的规模化应用。