返回列表
行业新闻AI创新科技

Anthropic发布Claude Sonnet 4.6:旗舰级AI性能,成本仅为五分之一,加速企业AI部署

Anthropic于周二发布了Claude Sonnet 4.6模型,该模型以中等成本提供接近旗舰级的AI智能,对AI行业带来了显著的重新定价影响。Sonnet 4.6在编码、计算机使用、长上下文推理、代理规划、知识工作和设计方面进行了全面升级,并支持100万token的上下文窗口(测试版)。该模型已成为claude.ai和Claude Cowork的默认模型,定价保持在每百万token 3美元/15美元,与前代Sonnet 4.5相同。这意味着企业现在能以Sonnet模型五分之一的成本获得此前需要Opus级模型才能达到的性能,这对于每天进行数百万次API调用的企业来说,将大幅降低AI代理的运行成本。

VentureBeat

Anthropic于周二发布了Claude Sonnet 4.6模型,这标志着AI行业的一次重大重新定价事件。该模型以中等成本提供了接近旗舰级的智能水平,正值企业竞相部署AI代理和自动化编码工具的空前时期。Sonnet 4.6在编码、计算机使用、长上下文推理、代理规划、知识工作和设计等多个方面进行了全面升级。它在测试版中支持100万token的上下文窗口。目前,Sonnet 4.6已成为claude.ai和Claude Cowork的默认模型,其定价保持在每百万token 3美元/15美元,与前代Sonnet 4.5相同。这一价格细节是本次发布最关键的信息。Anthropic的旗舰Opus模型每百万token的成本为15美元/75美元,是Sonnet价格的五倍。然而,现在Sonnet 4.6能够提供此前需要Opus级模型才能实现的性能,包括在实际的、具有经济价值的办公任务中。对于数千家每天进行数百万次API调用的企业而言,这一成本变化将彻底改变一切。为什么大规模运行AI代理的成本大幅下降?要理解此次发布的意义,需要了解它所处的当前环境。过去一年,AI行业主要由“氛围编码”(vibe coding)和代理式AI(agentic AI)两大现象主导。Anthropic面向开发者的终端工具Claude Code已成为硅谷的一种文化力量,工程师们通过自然语言对话构建整个应用程序。《纽约时报》在一月份报道了它的迅速崛起,The Verge最近也宣称Claude Code正经历一个真正的“高光时刻”。与此同时,OpenAI也通过Codex桌面应用程序和更快的推理芯片展开攻势。其结果是,AI模型不再是孤立地进行评估。它们被评估为自主代理内部的引擎——这些系统可以运行数小时,进行数千次工具调用。

相关新闻

美团BI架构演进:以指标平台为核心解决数据口径与查询性能难题
行业新闻

美团BI架构演进:以指标平台为核心解决数据口径与查询性能难题

美团技术团队分享了其在BI领域的最新探索实践。通过构建以指标平台为核心的新一代BI架构,美团引入了“自动语义”与“增强计算”两大核心能力。该架构旨在解决传统BI平台在个性化数据集驱动下普遍存在的数据口径混乱及查询性能低下等核心痛点,实现了数据治理与分析效率的显著提升。

美团31万行代码重构实践:基于Agent评测思路的AI Coding管理新范式
行业新闻

美团31万行代码重构实践:基于Agent评测思路的AI Coding管理新范式

本文深入探讨美团技术团队在31万行代码重构中的前沿实践。面对AI生成代码占比超过90%带来的管理挑战,团队提出“约束AI能力”的核心理念,通过Agent评测思路,构建了包含技术债梳理、规则建设、重构SOP及Pre-PR机制的完整体系,成功将高成本的重构专项转化为随迭代持续进行的日常动作,为AI时代的软件工程提供了重要参考。

美团LongCat开源General 365评测集:Gemini 3 Pro仅获62.8分,树立推理新标尺
行业新闻

美团LongCat开源General 365评测集:Gemini 3 Pro仅获62.8分,树立推理新标尺

美团LongCat团队正式发布General 365推理评测集,旨在为大模型推理能力建立更严苛的标准。在对26款主流模型的实测中,目前顶尖的Gemini 3 Pro准确率仅为62.8%,而绝大多数模型未能达到60分的及格线。这一结果揭示了当前AI模型在复杂推理任务上的局限性,为行业提供了全新的性能衡量基准。