AI Pulse

OpenAI自研推理芯片Jalapeño,让ChatGPT更快更省更稳

OpenAI自研推理芯片Jalapeño,让ChatGPT更快更省更稳

OpenAI与博通联合发布了名为Jalapeño的AI推理芯片。这是OpenAI首次设计自己的处理器,目标是让ChatGPT、Codex、API以及未来的智能体产品跑得更好、更省、更稳。

成本是AI产品速度和可用性的关键限制因素。通用芯片(比如GPU)为大范围工作负载设计,对LLM推理不是最优解。Jalapeño从零开始为现代大语言模型量身打造,不是从老的AI负载改造而来。它优化了关键内核、内存移动、网络和服务模式——这些正是ChatGPT每天运行的东西。

Jalapeño的设计目标是兼顾顶级加速器的功率和吞吐量,同时达到专用推理系统才有的低延迟。它通过减少数据移动,平衡计算、内存和网络资源,让实际利用率更接近理论峰值。

早期测试显示,Jalapeño的每瓦性能显著优于当前最先进水平。具体比NVIDIA H100或B200高多少,OpenAI没有公布具体倍数。

芯片从设计到制造流片只用了9个月。OpenAI称这是高性能半导体领域最快的ASIC开发周期。关键原因之一是OpenAI用自己训练的模型加速了设计和优化过程。

工程样品已经在实验室中运行ML工作负载,包括GPT‑5.3‑Codex‑Spark,运行频率和功耗都达到生产目标。

Jalapeño计划2026年底开始部署。它与微软等合作伙伴一起,建千兆瓦规模的数据中心。这是一条多代产品路线图的第一步,后续还会不断扩展。

博通的Tomahawk网络芯片被用于平台的大规模生产,帮助连接成千上万的Jalapeño芯片一起工作。

OpenAI把这套策略称为“全栈”:不只是做前沿模型或产品,还设计底层的芯片架构、内核、内存系统、网络、调度、部署系统和产品体验。目标是让计算更充裕,AI更快、更可靠、更便宜。

当效率提升传导到产品端,用户会看到:ChatGPT回答更快、Codex执行更多步骤而不用等、API产品更便宜、高峰时段访问更稳定。OpenAI总裁Greg Brockman说,Jalapeño是长期全栈基础设施战略的一部分,目标是让AI对人和企业都更快速、更可靠、更实惠。

Jalapeño的量化性能指标(如TOPS、延迟)未公开,与英伟达产品的硬碰硬对比目前缺失。量产规模、首批部署多少芯片都未明确。芯片的成本和定价策略如何,对API价格的具体影响未知。OpenAI也没有说是否打算对外销售芯片,还是仅供内部使用。

阅读原文
📚 相关主题 商业合作

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部