返回列表
行业新闻AI安全创新

Anthropic与OpenAI免费工具揭示传统SAST盲点,颠覆应用安全市场

Anthropic的Claude Code Security和OpenAI的Codex Security相继推出,这两款基于大型语言模型(LLM)推理的漏洞扫描工具,揭示了传统静态应用安全测试(SAST)工具在检测特定漏洞类别上的结构性盲点。它们发现的漏洞是基于模式匹配的SAST从未设计检测的。目前,这两款工具均免费提供给企业客户,预示着应用安全采购模式将发生永久性改变。Anthropic的Claude Opus 4.6在开源代码库中发现了500多个未知高危漏洞,包括CGIF库中的堆缓冲区溢出,证明了其推理能力的强大。

VentureBeat

OpenAI于3月6日推出了Codex Security,正式进入应用安全市场。此前14天,Anthropic凭借Claude Code Security已经搅动了这一市场。这两款扫描工具都采用大型语言模型(LLM)推理而非传统的模式匹配技术。它们共同证明,传统的静态应用安全测试(SAST)工具在检测某些特定漏洞类别上存在结构性盲点。企业安全堆栈正面临挑战。Anthropic和OpenAI独立发布了基于推理的漏洞扫描器,并且都发现了模式匹配SAST从未设计检测的漏洞类别。这两家公司在私人市场估值合计超过1.1万亿美元,它们之间的竞争压力意味着检测质量将比任何单一供应商独立提供都要快地提升。无论是Claude Code Security还是Codex Security都不能完全取代现有的安全堆栈,但这两款工具将永久性地改变采购模式。目前,它们都免费提供给企业客户。在董事会询问正在试用哪款扫描器及其原因之前,您需要了解以下对比和七项行动。Anthropic和OpenAI如何从不同架构得出相同结论?Anthropic在2月5日发布Claude Opus 4.6的同时,公布了其零日漏洞研究成果。Anthropic表示,Claude Opus 4.6在生产环境的开源代码库中发现了500多个此前未知的、高严重性漏洞,这些漏洞在经过数十年的专家审查和数百万小时的模糊测试后依然存在。例如,在CGIF库中,Claude通过对LZW压缩算法的推理,发现了一个堆缓冲区溢出漏洞,而即使在100%代码覆盖率的情况下,覆盖引导模糊测试也无法捕获到这个缺陷。Anthropic于2月20日发布了Claude Code Security的有限研究预览版,供企业和团队客户使用,并为开源维护者提供免费的快速访问权限。Anthropic的传播负责人Gabby Curtis在接受VentureBeat独家采访时表示,Anthropic构建Claude Code Security是为了提高安全性。

相关新闻

美团BI架构演进:以指标平台为核心解决数据口径与查询性能难题
行业新闻

美团BI架构演进:以指标平台为核心解决数据口径与查询性能难题

美团技术团队分享了其在BI领域的最新探索实践。通过构建以指标平台为核心的新一代BI架构,美团引入了“自动语义”与“增强计算”两大核心能力。该架构旨在解决传统BI平台在个性化数据集驱动下普遍存在的数据口径混乱及查询性能低下等核心痛点,实现了数据治理与分析效率的显著提升。

美团31万行代码重构实践:基于Agent评测思路的AI Coding管理新范式
行业新闻

美团31万行代码重构实践:基于Agent评测思路的AI Coding管理新范式

本文深入探讨美团技术团队在31万行代码重构中的前沿实践。面对AI生成代码占比超过90%带来的管理挑战,团队提出“约束AI能力”的核心理念,通过Agent评测思路,构建了包含技术债梳理、规则建设、重构SOP及Pre-PR机制的完整体系,成功将高成本的重构专项转化为随迭代持续进行的日常动作,为AI时代的软件工程提供了重要参考。

美团LongCat开源General 365评测集:Gemini 3 Pro仅获62.8分,树立推理新标尺
行业新闻

美团LongCat开源General 365评测集:Gemini 3 Pro仅获62.8分,树立推理新标尺

美团LongCat团队正式发布General 365推理评测集,旨在为大模型推理能力建立更严苛的标准。在对26款主流模型的实测中,目前顶尖的Gemini 3 Pro准确率仅为62.8%,而绝大多数模型未能达到60分的及格线。这一结果揭示了当前AI模型在复杂推理任务上的局限性,为行业提供了全新的性能衡量基准。