OpenAI发布自研推理芯片,AI服务成本有望降低
周三,OpenAI发布了其首款定制推理处理器,该芯片由OpenAI与博通合作设计制造。这款名为Jalapeño的新处理器专为满足OpenAI推理系统的独特需求而设计。OpenAI表示,其自身的人工智能模型也参与了芯片的开发过程。
尽管该芯片仍在测试中,但OpenAI称早期结果显示,其每瓦性能显著优于当前最先进的替代产品。
双方的合作关系于去年十月正式公布,但OpenAI的芯片计划早已传闻不断,旨在减少该公司对英伟达GPU的依赖。谷歌和亚马逊均已构建了用于类似目的的定制芯片,通常被称为“AI加速器”——即专门为加速机器学习工作负载而设计的硅芯片。
在博通合作消息公布后不久,OpenAI总裁格雷格·布罗克曼在公司内部播客中解释了其芯片开发策略。
“我们对工作负载有深刻理解,”布罗克曼在节目中表示,“我们一直在寻找那些服务不足的特定工作负载,并思考如何构建能够加速实现可能性的产品。”
Jalapeño专为推理而设计,即根据用户指令运行预训练AI模型的过程。在公告中,OpenAI强调了该芯片在运行实时编码模型时的低运营成本。像预训练这类性能密集型任务可能仍将依赖英伟达硬件,但即便是推理成本的小幅降低,也能显著改善公司的盈利状况。
优化推理系统可能成为未来AI经济的关键因素,并且这种优化很可能发生在技术栈的每一层。OpenAI已在构建Codex等智能体产品及其驱动模型,以及运行这些模型的数据中心。正如公司在公告中所解释的,涉足专用芯片领域让OpenAI在这一进程中走得更远。
“OpenAI不仅开发前沿模型或在其基础上构建产品,还在设计底层基础设施:芯片架构、内核、内存系统、网络、调度、部署系统以及产品体验,”公司写道。“由于OpenAI贯穿整个技术栈,每一层都可以围绕同一目标进行优化:让模型更快、更可靠、更实惠,惠及用户。”