OpenAI自研推理芯片Jalapeño，让ChatGPT更快更省更稳

📅 2026 年 6 月 25 日 📖 约 5 分钟 OpenAI AI芯片商业合作

OpenAI与博通联合发布了名为Jalapeño的AI推理芯片。这是OpenAI首次设计自己的处理器，目标是让ChatGPT、Codex、API以及未来的智能体产品跑得更好、更省、更稳。

成本是AI产品速度和可用性的关键限制因素。通用芯片（比如GPU）为大范围工作负载设计，对LLM推理不是最优解。Jalapeño从零开始为现代大语言模型量身打造，不是从老的AI负载改造而来。它优化了关键内核、内存移动、网络和服务模式——这些正是ChatGPT每天运行的东西。

Jalapeño的设计目标是兼顾顶级加速器的功率和吞吐量，同时达到专用推理系统才有的低延迟。它通过减少数据移动，平衡计算、内存和网络资源，让实际利用率更接近理论峰值。

早期测试显示，Jalapeño的每瓦性能显著优于当前最先进水平。具体比NVIDIA H100或B200高多少，OpenAI没有公布具体倍数。

芯片从设计到制造流片只用了9个月。OpenAI称这是高性能半导体领域最快的ASIC开发周期。关键原因之一是OpenAI用自己训练的模型加速了设计和优化过程。

工程样品已经在实验室中运行ML工作负载，包括GPT‑5.3‑Codex‑Spark，运行频率和功耗都达到生产目标。

Jalapeño计划2026年底开始部署。它与微软等合作伙伴一起，建千兆瓦规模的数据中心。这是一条多代产品路线图的第一步，后续还会不断扩展。

博通的Tomahawk网络芯片被用于平台的大规模生产，帮助连接成千上万的Jalapeño芯片一起工作。

OpenAI把这套策略称为“全栈”：不只是做前沿模型或产品，还设计底层的芯片架构、内核、内存系统、网络、调度、部署系统和产品体验。目标是让计算更充裕，AI更快、更可靠、更便宜。

当效率提升传导到产品端，用户会看到：ChatGPT回答更快、Codex执行更多步骤而不用等、API产品更便宜、高峰时段访问更稳定。OpenAI总裁Greg Brockman说，Jalapeño是长期全栈基础设施战略的一部分，目标是让AI对人和企业都更快速、更可靠、更实惠。

Jalapeño的量化性能指标（如TOPS、延迟）未公开，与英伟达产品的硬碰硬对比目前缺失。量产规模、首批部署多少芯片都未明确。芯片的成本和定价策略如何，对API价格的具体影响未知。OpenAI也没有说是否打算对外销售芯片，还是仅供内部使用。

📚 相关主题商业合作

📬 订阅 AI Pulse