返回列表
行业新闻AI芯片技术合作

OpenAI首次弃用英伟达,部署Cerebras芯片实现“近乎即时”代码生成

OpenAI于周四推出了GPT-5.3-Codex-Spark模型,这是一款精简的代码生成模型,旨在实现近乎即时的响应时间。此次部署标志着OpenAI首次在其传统的英伟达主导基础设施之外,与Cerebras Systems建立了重要的推理合作伙伴关系。Cerebras是一家专注于低延迟AI工作负载的晶圆级处理器制造商。此举正值OpenAI面临与英伟达关系紧张、ChatGPT引入广告、获得五角大楼合同以及内部组织变动等关键时刻。OpenAI表示,GPU仍是其训练和推理管道的基础,而Cerebras则补充了对极低延迟工作流的需求,以提升实时编码等用例的响应速度。

VentureBeat

OpenAI于周四推出了GPT-5.3-Codex-Spark,这是一款精简的代码生成模型,旨在实现近乎即时的响应时间。此举标志着该公司首次在其传统的英伟达主导基础设施之外,建立了重要的推理合作伙伴关系。该模型运行在Cerebras Systems的硬件上,Cerebras是一家位于桑尼维尔的芯片制造商,其晶圆级处理器专门用于处理低延迟的AI工作负载。

此次合作正值OpenAI的关键时刻。该公司目前正面临与长期芯片供应商英伟达关系紧张、ChatGPT引入广告引发的批评、新宣布的五角大楼合同,以及内部组织动荡(包括一个专注于安全的团队被解散,至少一名研究员辞职抗议)等局面。

OpenAI发言人向VentureBeat表示:“GPU在我们的训练和推理管道中仍然是基础性的,并为广泛使用提供了最具成本效益的token。Cerebras通过在需要极低延迟的工作流中表现出色,补充了这一基础,从而收紧了端到端循环,使得像Codex中的实时编码等用例在迭代时感觉更具响应性。”

这种谨慎的措辞——强调GPU“仍然是基础性的”,同时将Cerebras定位为“补充”——突显了OpenAI在多元化芯片供应商的同时,不疏远AI加速器领域主导力量英伟达所必须保持的微妙平衡。

OpenAI表示,速度提升会带来功能上的权衡,但开发者会接受。Codex-Spark代表了OpenAI首个专为实时编码协作而构建的模型。该公司声称,当在超低延迟硬件上运行时,该模型每秒可提供超过1000个token,但它拒绝提供具体的延迟指标,例如首个token生成时间。

相关新闻

语言模型的“修辞陷阱”:为何“不是X而是Y”成了AI写作的标签?
行业新闻

语言模型的“修辞陷阱”:为何“不是X而是Y”成了AI写作的标签?

本文深入探讨了大语言模型(LLM)中常见的语言特征,特别是“否定平行结构”(如“不是X,而是Y”)的过度使用及其引发的连锁反应。文章指出,随着AI检测器的兴起,像Grammarly这样的工具开始引导用户修改此类模式以规避AI指控,但这可能导致人类写作失去节奏感和意图。作者认为,修辞手法本身并无好坏,关键在于其承载的内容,而过度追求规避检测正在异化人类的表达方式。

苹果智能眼镜战略曝光:效仿Apple Watch模式,意在颠覆传统眼镜行业
行业新闻

苹果智能眼镜战略曝光:效仿Apple Watch模式,意在颠覆传统眼镜行业

根据彭博社Mark Gurman的最新消息,苹果公司在智能眼镜市场的战略与其智能手表战略如出一辙。苹果不仅计划在智能眼镜领域与Meta等科技巨头竞争,更旨在颠覆整个传统眼镜行业。正如Apple Watch发布时不仅针对科技竞品,还瞄准了斯沃琪、化石和精工等传统钟表品牌,苹果的智能眼镜也将目光投向了更广阔的传统市场。

环保活动家艾琳·布罗克维奇剑指数据中心透明度:开启全新使命
行业新闻

环保活动家艾琳·布罗克维奇剑指数据中心透明度:开启全新使命

著名环保活动家艾琳·布罗克维奇(Erin Brockovich)近期宣布了一项针对数据中心行业的新使命。此次行动的核心目标是挑战数据中心运营中的“保密性”问题。作为长期致力于环境正义的代表人物,布罗克维奇的介入预示着科技基础设施领域将面临更严格的公众监督与透明度要求。