2026年6月22日 的AI新闻

美团BI架构演进:基于指标平台与分析引擎解决数据口径与性能难题
技术实践

美团BI架构演进:基于指标平台与分析引擎解决数据口径与性能难题

美团数据平台近期分享了其在新一代BI架构上的探索实践。通过构建以指标平台为核心的体系,美团利用“自动语义”和“增强计算”两大核心能力,有效应对了传统BI模式下常见的数据口径不一致及查询效率低下等痛点,实现了从个性化数据集驱动向标准化指标驱动的转型,为企业级数据治理提供了新思路。

美团技术团队
美团发布原生多模态 LongCat-Next:当视觉和语音成为AI的母语
开源项目

美团发布原生多模态 LongCat-Next:当视觉和语音成为AI的母语

美团技术团队正式发布并开源原生多模态模型 LongCat-Next 及其核心离散分词器。该模型代表了美团在“物理世界 AI”领域的深度探索,通过将视觉和语音信息作为原生语言进行处理,旨在打破模态间的隔阂。此次开源不仅提供了模型架构,还开放了关键的分词技术,旨在赋能开发者构建能够感知、理解并直接作用于真实物理世界的智能系统,标志着多模态 AI 从简单的图文理解向复杂的环境交互迈进。

美团技术团队
美团LongCat发布General 365推理评测集:Gemini 3 Pro仅获62.8分,多数模型不及格
行业新闻

美团LongCat发布General 365推理评测集:Gemini 3 Pro仅获62.8分,多数模型不及格

美团LongCat团队正式推出General 365推理评测基准,旨在为大语言模型的推理能力树立新标尺。在对26款主流模型的实测中,目前表现最强的Gemini 3 Pro准确率仅为62.8%,而绝大多数模型未能达到60分的及格线。这一结果揭示了当前顶尖AI模型在复杂推理任务上仍存在显著局限性,为行业评估模型真实性能提供了重要参考。

美团技术团队
美团技术团队实践:利用Agent评测思路管理AI Coding,完成31万行代码重构
行业新闻

美团技术团队实践:利用Agent评测思路管理AI Coding,完成31万行代码重构

美团技术团队分享了在AI生成代码占比超过90%的背景下,如何通过Agent评测思路进行31万行代码的重构实践。文章核心介绍了通过技术债梳理、Rule建设、重构SOP及Pre-PR机制,将高成本的重构工作转化为日常迭代动作,旨在解决AI生成代码可能带来的混乱,提升系统稳定性与开发效率。

美团技术团队
美团开源LongCat-Flash-Prover:推动AI从数值计算迈向严谨数学定理证明
开源项目

美团开源LongCat-Flash-Prover:推动AI从数值计算迈向严谨数学定理证明

美团技术团队正式开源专门用于数学形式化与定理证明的模型——LongCat-Flash-Prover。该模型旨在解决AI在复杂推理中逻辑链条不严谨的问题,强调数学证明不仅要“算得对”,更要“证得严”。通过攻克自然语言的模糊性挑战,LongCat-Flash-Prover实现了从“猜答案”到“严谨证明”的跨越,为AI处理极度严苛的逻辑推理课题提供了新的解决方案。

美团技术团队
美团正式开源 LongCat-Video-Avatar 1.5:从高拟真迈向商业级应用的数字人视频模型
开源项目

美团正式开源 LongCat-Video-Avatar 1.5:从高拟真迈向商业级应用的数字人视频模型

美团技术团队宣布开源 LongCat-Video-Avatar 1.5,这是一款标志着数字人视频技术从 SOTA 研究迈向商业级应用的重要模型。该版本在唇形同步、物理合理性、长视频稳定性、多人互动及推理效率五大核心维度实现了全面突破,旨在解决复杂商业场景下的高质量内容输出难题,推动数字人视频生成走向真实应用舞台。

美团技术团队
LARYBench发布:定义具身动作表征“ImageNet”,通用视觉模型展现跨代优势
研究突破

LARYBench发布:定义具身动作表征“ImageNet”,通用视觉模型展现跨代优势

美团技术团队发布了LARYBench(Latent Action Representation Yielding Benchmark),这是一个旨在从大规模视觉数据中学习通用隐式动作表征的系统化评测基准。研究表明,通用视觉模型在动作泛化和控制精度上显著优于专门的具身专家模型,证明了具身动作表征可以从大规模人类视频数据中涌现,为具身智能的发展提供了重要指引。

美团技术团队
美团发布LongCat-AudioDiT:突破零样本TTS音色克隆上限,重塑语音合成范式
研究突破

美团发布LongCat-AudioDiT:突破零样本TTS音色克隆上限,重塑语音合成范式

美团LongCat团队正式发布LongCat-AudioDiT模型,该模型通过在波形潜空间直接进行基于扩散模型的文本转语音(TTS),彻底抛弃了梅尔谱等传统中间表示。这一创新从根源上阻断了数据转换带来的级联误差,旨在突破零样本音色克隆的技术瓶颈,实现更高精度的声音复刻。

美团技术团队
ACL 2026美团论文精选:从能力评测到推理优化,构建生成新范式
行业新闻

ACL 2026美团论文精选:从能力评测到推理优化,构建生成新范式

美团技术团队在自然语言处理领域顶级会议ACL 2026中共有6篇论文被收录。这些研究成果涵盖了大模型评测、复杂流程推理、竞赛级数学思维优化、强化学习优化以及生成式推荐等前沿技术方向。本文将深度解析美团如何通过这些技术创新,在提升大模型逻辑推理能力与实际应用效果方面构建生成式AI的新范式。

美团技术团队
codebase-memory-mcp:高性能代码智能MCP服务器,支持158种语言并降低99% Token消耗
开源项目

codebase-memory-mcp:高性能代码智能MCP服务器,支持158种语言并降低99% Token消耗

DeusData 推出的 codebase-memory-mcp 是一款专为代码智能设计的高性能 MCP 服务器。该工具通过将代码库索引为持久化知识图谱,实现了毫秒级的仓库处理速度和亚毫秒级的查询响应。它支持多达 158 种编程语言,能够显著降低 99% 的 Token 消耗。其采用单一静态二进制文件设计,具备零依赖特性,为开发者提供了极简且高效的代码上下文管理方案。

GitHub Trending
全球首个开源Agentic视频制作系统OpenMontage上线:500多项智能体技能重塑创作流
开源项目

全球首个开源Agentic视频制作系统OpenMontage上线:500多项智能体技能重塑创作流

OpenMontage是由开发者calesthio推出的全球首个开源Agentic(智能体)视频制作系统。该系统集成了12条流水线、52个工具以及超过500个智能体技能,旨在将AI编程助手转化为功能完备的视频制作工作室。这一开源项目的发布,标志着AI驱动的视频内容创作进入了高度自动化与智能体协作的新阶段,为开发者和创作者提供了强大的开源工具链。

GitHub Trending
Palmier Pro:专为AI原生设计的macOS视频编辑器开源发布
开源项目

Palmier Pro:专为AI原生设计的macOS视频编辑器开源发布

Palmier Pro 是一款近期在 GitHub 上备受关注的开源项目,其核心定位是“专为 AI 打造的 macOS 视频编辑器”。该项目由 palmier-io 开发,旨在通过 AI 技术重塑 macOS 平台上的视频剪辑体验。作为一款针对苹果生态优化的工具,它代表了视频剪辑软件从“功能叠加”向“AI 原生”转型的最新趋势,为创作者提供了更智能的生产力选择。

GitHub Trending
Twenty:专为AI设计的Salesforce开源替代方案,开启CRM新纪元
开源项目

Twenty:专为AI设计的Salesforce开源替代方案,开启CRM新纪元

Twenty 是一款在 GitHub 上引起广泛关注的开源 CRM 项目,其核心定位是作为 Salesforce 的开源替代方案。该项目强调“专为 AI 设计”,旨在通过开源的灵活性与 AI 的深度集成,为现代企业提供更高效、透明的客户关系管理工具。作为开源领域的挑战者,Twenty 正试图重塑 AI 时代的客户关系管理格局。

GitHub Trending
三星与SK海力士利润预期因内存短缺大幅上调
行业新闻

三星与SK海力士利润预期因内存短缺大幅上调

受全球内存市场供应短缺影响,存储巨头三星电子与SK海力士的利润预期显著增长。根据行业研究机构TrendForce的最新观察,由于服务器DRAM具备更高的利润空间,供应商正调整生产策略,优先保障此类高利润产品的供应。这一趋势反映了在资源有限的情况下,半导体巨头正通过优化产品组合来最大化盈利能力。

Tech in Asia
军工科技巨头UVision冲刺纳斯达克:拟以40亿美元估值开启IPO之路
投融资

军工科技巨头UVision冲刺纳斯达克:拟以40亿美元估值开启IPO之路

武器制造商UVision正计划在纳斯达克上市,目标估值定为40亿美元。该公司凭借其先进的HERO系列巡飞弹(Loitering Munitions)在国防市场占据重要地位。其产品线涵盖了从单兵便携式到车载发射的多种系统,展现了极高的作战灵活性。此次上市不仅是UVision发展的里程碑,也反映了资本市场对高科技防御系统日益增长的兴趣。

Tech in Asia
解决Claude Code冷启动:Recall本地项目记忆工具,节省Token并保护隐私
开源项目

解决Claude Code冷启动:Recall本地项目记忆工具,节省Token并保护隐私

Recall是一款专为Claude Code设计的全本地项目记忆工具,旨在解决AI在每次会话开始时丢失上下文的“冷启动”问题。通过在本地记录会话并使用传统Python算法生成摘要,Recall能让用户在不消耗额外Token的情况下,快速恢复项目进度。该工具完全在本地运行,无需API密钥或外部模型,确保了代码和隐私的安全,是Claude Code订阅用户的理想效率补充工具。

Hacker News
技术教程

提升个人网站SEO:JSON-LD结构化数据深度解析与实战指南

本文详细介绍了JSON-LD(JSON链接数据)在个人网站中的应用及其重要性。通过在网页中嵌入结构化数据,开发者可以显著提升搜索引擎爬虫对网站语义结构的理解,从而获得更丰富的链接预览效果并潜在地提高搜索排名。文章从基础语法入手,解析了如何利用Schema.org标准构建机器可读的网页描述,是提升个人站点专业度与可见性的关键技术指南。

Hacker News