返回列表
行业新闻AI安全创新

Anthropic与OpenAI免费工具揭示传统SAST盲点,颠覆应用安全市场

Anthropic的Claude Code Security和OpenAI的Codex Security相继推出,这两款基于大型语言模型(LLM)推理的漏洞扫描工具,揭示了传统静态应用安全测试(SAST)工具在检测特定漏洞类别上的结构性盲点。它们发现的漏洞是基于模式匹配的SAST从未设计检测的。目前,这两款工具均免费提供给企业客户,预示着应用安全采购模式将发生永久性改变。Anthropic的Claude Opus 4.6在开源代码库中发现了500多个未知高危漏洞,包括CGIF库中的堆缓冲区溢出,证明了其推理能力的强大。

VentureBeat

OpenAI于3月6日推出了Codex Security,正式进入应用安全市场。此前14天,Anthropic凭借Claude Code Security已经搅动了这一市场。这两款扫描工具都采用大型语言模型(LLM)推理而非传统的模式匹配技术。它们共同证明,传统的静态应用安全测试(SAST)工具在检测某些特定漏洞类别上存在结构性盲点。企业安全堆栈正面临挑战。Anthropic和OpenAI独立发布了基于推理的漏洞扫描器,并且都发现了模式匹配SAST从未设计检测的漏洞类别。这两家公司在私人市场估值合计超过1.1万亿美元,它们之间的竞争压力意味着检测质量将比任何单一供应商独立提供都要快地提升。无论是Claude Code Security还是Codex Security都不能完全取代现有的安全堆栈,但这两款工具将永久性地改变采购模式。目前,它们都免费提供给企业客户。在董事会询问正在试用哪款扫描器及其原因之前,您需要了解以下对比和七项行动。Anthropic和OpenAI如何从不同架构得出相同结论?Anthropic在2月5日发布Claude Opus 4.6的同时,公布了其零日漏洞研究成果。Anthropic表示,Claude Opus 4.6在生产环境的开源代码库中发现了500多个此前未知的、高严重性漏洞,这些漏洞在经过数十年的专家审查和数百万小时的模糊测试后依然存在。例如,在CGIF库中,Claude通过对LZW压缩算法的推理,发现了一个堆缓冲区溢出漏洞,而即使在100%代码覆盖率的情况下,覆盖引导模糊测试也无法捕获到这个缺陷。Anthropic于2月20日发布了Claude Code Security的有限研究预览版,供企业和团队客户使用,并为开源维护者提供免费的快速访问权限。Anthropic的传播负责人Gabby Curtis在接受VentureBeat独家采访时表示,Anthropic构建Claude Code Security是为了提高安全性。

相关新闻

ACL 2026美团技术团队入选论文解读:涵盖大模型评测与推理优化新范式
行业新闻

ACL 2026美团技术团队入选论文解读:涵盖大模型评测与推理优化新范式

美团技术团队在ACL 2026国际顶级学术会议中共有6篇论文被收录。这些研究成果涵盖了大模型评测、复杂流程推理、竞赛级数学思维优化、强化学习优化以及生成式推荐等前沿领域。本文将深入探讨美团在自然语言处理(NLP)领域的最新技术突破,展示其在构建生成式AI新范式方面的探索与实践。

美团LongCat发布General 365推理评测:Gemini 3 Pro仅获62.8分,揭示大模型推理短板
行业新闻

美团LongCat发布General 365推理评测:Gemini 3 Pro仅获62.8分,揭示大模型推理短板

美团LongCat团队正式发布General 365推理评测基准,旨在为大语言模型的推理能力树立新标尺。在对全球26款主流模型的实测中,目前表现最强的Gemini 3 Pro准确率仅为62.8%,而绝大多数模型未能达到60分的及格线。这一结果暴露了当前顶尖AI模型在复杂推理任务中的局限性,引发了行业对大模型逻辑能力评估的深度思考。

欧盟对Anthropic封锁AI访问表示担忧:Fable 5安全防护遭“越狱”挑战
行业新闻

欧盟对Anthropic封锁AI访问表示担忧:Fable 5安全防护遭“越狱”挑战

2026年6月25日,欧盟对人工智能公司Anthropic限制其AI服务访问的行为表达了关切。Anthropic回应称,此次限制措施是由于发现用户能够“越狱”(jailbreak)其Fable 5模型的安全防护栏。这一事件凸显了顶尖AI模型在安全合规与全球可用性之间面临的严峻挑战,引发了监管机构对AI安全机制的进一步关注。