OpenAI发布自研推理芯片，AI服务成本有望降低

📅 2026 年 6 月 25 日 📖 约 3 分钟 TechCrunch AI芯片商业

周三，OpenAI发布了其首款定制推理处理器，该芯片由OpenAI与博通合作设计制造。这款名为Jalapeño的新处理器专为满足OpenAI推理系统的独特需求而设计。OpenAI表示，其自身的人工智能模型也参与了芯片的开发过程。

尽管该芯片仍在测试中，但OpenAI称早期结果显示，其每瓦性能显著优于当前最先进的替代产品。

双方的合作关系于去年十月正式公布，但OpenAI的芯片计划早已传闻不断，旨在减少该公司对英伟达GPU的依赖。谷歌和亚马逊均已构建了用于类似目的的定制芯片，通常被称为“AI加速器”——即专门为加速机器学习工作负载而设计的硅芯片。

在博通合作消息公布后不久，OpenAI总裁格雷格·布罗克曼在公司内部播客中解释了其芯片开发策略。

“我们对工作负载有深刻理解，”布罗克曼在节目中表示，“我们一直在寻找那些服务不足的特定工作负载，并思考如何构建能够加速实现可能性的产品。”

Jalapeño专为推理而设计，即根据用户指令运行预训练AI模型的过程。在公告中，OpenAI强调了该芯片在运行实时编码模型时的低运营成本。像预训练这类性能密集型任务可能仍将依赖英伟达硬件，但即便是推理成本的小幅降低，也能显著改善公司的盈利状况。

优化推理系统可能成为未来AI经济的关键因素，并且这种优化很可能发生在技术栈的每一层。OpenAI已在构建Codex等智能体产品及其驱动模型，以及运行这些模型的数据中心。正如公司在公告中所解释的，涉足专用芯片领域让OpenAI在这一进程中走得更远。

“OpenAI不仅开发前沿模型或在其基础上构建产品，还在设计底层基础设施：芯片架构、内核、内存系统、网络、调度、部署系统以及产品体验，”公司写道。“由于OpenAI贯穿整个技术栈，每一层都可以围绕同一目标进行优化：让模型更快、更可靠、更实惠，惠及用户。”

📚 相关主题商业

📬 订阅 AI Pulse