返回列表
OpenAI发布首款自研推理芯片Jalapeño:由博通代工,旨在降低对英伟达依赖
产品发布OpenAI半导体人工智能

OpenAI发布首款自研推理芯片Jalapeño:由博通代工,旨在降低对英伟达依赖

OpenAI于2026年6月24日正式揭晓了其首款定制推理处理器“Jalapeño”。该芯片由OpenAI与博通(Broadcom)合作设计并制造,专门针对OpenAI推理系统的独特需求进行了优化。据OpenAI介绍,该芯片在开发过程中得到了其自身AI模型的辅助。初步测试结果显示,Jalapeño在每瓦性能上显著优于目前市面上的主流替代方案,特别是在运行实时编程模型时具有极低的运营成本。此举标志着OpenAI在减少对英伟达硬件依赖、提升算力自主性方面迈出了关键一步。

Hacker News

核心要点

  • 首款自研芯片亮相:OpenAI正式发布名为“Jalapeño”的定制推理处理器,由博通(Broadcom)负责设计与制造。
  • AI辅助研发:OpenAI透露,其自身的AI模型在Jalapeño芯片的开发过程中发挥了辅助作用。
  • 卓越的能效表现:早期测试数据显示,该芯片的每瓦性能(performance-per-watt)显著优于当前最先进的替代产品。
  • 专注推理负载:Jalapeño专为推理任务设计,旨在优化实时编程模型等特定工作负载的运行效率与成本。
  • 战略去英伟达化:此举是OpenAI减少对英伟达(Nvidia)GPU依赖、寻求算力自主化的重要战略行动。

详细分析

深度定制的推理处理器:Jalapeño

OpenAI发布的Jalapeño是一款专门针对推理系统需求设计的处理器。与通用的GPU不同,Jalapeño作为一种“AI加速器”,专注于执行已训练好的AI模型以响应用户指令。OpenAI在公告中特别强调了该芯片在处理实时编码模型时的低运行成本优势。值得注意的是,OpenAI在研发过程中采用了“AI设计AI”的模式,利用其现有的AI模型辅助芯片开发,这体现了软件与硬件协同进化的最新趋势。目前,该芯片仍处于测试阶段,但初步表现已达到预期。

摆脱硬件依赖与算力自主化

尽管英伟达目前在AI硬件市场占据主导地位,但OpenAI、谷歌和亚马逊等科技巨头都在积极研发自研芯片。OpenAI总裁Greg Brockman在公司内部播客中解释称,公司对自身的工作负载有深刻理解,开发Jalapeño是为了填补现有硬件无法满足的特定需求,从而加速技术突破。通过与博通的合作,OpenAI能够更精准地控制算力成本和供应链安全,降低因过度依赖单一供应商而带来的潜在风险。这一合作计划早在2025年10月就已官宣,如今终于迎来了实物成果。

行业影响

Jalapeño的问世标志着顶级AI公司进入了硬件自主化的新阶段。通过自研芯片,OpenAI不仅能优化特定模型(如编程模型)的运行效率,还能显著降低大规模推理的电力消耗和运营成本。这可能会改变AI基础设施市场的竞争格局,促使更多下游企业关注能效比而非单纯的算力峰值。同时,这也为其他AI初创公司提供了参考路径,即通过软硬一体化优化来提升核心竞争力。

常见问题

Jalapeño芯片的主要用途是什么?

Jalapeño是一款推理处理器(AI加速器),专门用于运行已经构建好的AI模型以响应用户命令。它特别优化了实时编程模型的运行效率,旨在降低大规模推理任务的运营成本。

谁负责制造这款芯片?

该芯片是由OpenAI设计,并与博通(Broadcom)深度合作进行制造的。博通在定制芯片设计和供应链方面提供了核心支持。

它的性能表现如何?

根据OpenAI提供的早期测试结果,Jalapeño在每瓦性能(performance-per-watt)上表现卓越,显著优于目前市面上最先进的同类硬件方案。

相关新闻

Gemini 3.5 Flash 正式集成“计算机使用”功能:赋能跨平台智能体自动化
产品发布

Gemini 3.5 Flash 正式集成“计算机使用”功能:赋能跨平台智能体自动化

Google DeepMind 宣布在 Gemini 3.5 Flash 中原生集成“计算机使用”(Computer Use)功能。该功能允许开发者构建能够跨浏览器、移动端和桌面环境进行观察、推理及操作的智能体。相比之前的独立模型,此次集成提升了长程任务和企业自动化(如软件测试和专业应用协作)的性能。同时,Google 引入了对抗性训练及企业级安全防护机制,以降低提示词注入风险并确保操作安全。

Facebook推出创作者AI伴侣应用:集成智能助手开启测试
产品发布

Facebook推出创作者AI伴侣应用:集成智能助手开启测试

Facebook(Meta)正式推出一款专为创作者设计的AI伴侣应用程序。该应用目前正处于针对特定创作者的测试阶段,其核心功能是集成了Facebook近期发布的AI创作者助手。此举旨在通过人工智能技术为创作者提供专属的智能支持,优化内容创作流程并提升平台互动体验。

NVIDIA 发布 NeMo AutoModel:旨在加速 Transformers 模型微调流程
产品发布

NVIDIA 发布 NeMo AutoModel:旨在加速 Transformers 模型微调流程

NVIDIA 在 Hugging Face 博客发布最新动态,推出 NeMo AutoModel 工具。该工具核心目标在于优化并加速 Transformers 架构模型的微调(Fine-Tuning)过程。作为 NVIDIA NeMo 生态的延伸,此举旨在提升开发者在适配大语言模型时的效率,降低计算资源消耗,进一步强化了 NVIDIA 与 Hugging Face 在 AI 开发生态中的协作。