推理芯片量产降成本,AI产品或更便宜
推理是AI公司服务用户时最大的瓶颈和成本中心。一家名为Etched的初创公司正在从硬件侧解决这个问题。
2022年成立的Etched今年初由台积电成功制造出芯片,并已拿到10亿美元合同订单。它的产品不是单一芯片,而是一套完整系统,包含定制机架和软件,称为“前沿推理集群”。设计目标是让前沿模型运行推理更快、更便宜、更节能。
创始人Gavin Uberti和Robert Wachen都从哈佛退学,成为Thiel fellow后创立了公司。但这条路并不顺利——2023年他们很难吸引投资者,几乎每个月都在烧钱,大多数大机构都拒绝了他们。转折发生在2024年底:公司完成一轮未公开的5亿美元融资,投后估值50亿美元。至今累计融资8亿美元。
这轮投资者的名单很显眼:机构包括VentureTech Alliance、Jane Street、Hudson River Trading、Two Sigma;AI界重量级天使有Andrej Karpathy、Geoffrey Hinton、Fei-Fei Li、Arthur Mensch和Scott Wu;还有亿万富翁Stanley Druckenmiller和Peter Thiel。
Etched面临的竞争激烈。Cerebras今年率先IPO,Groq刚融资6.5亿美元。亚马逊、谷歌、微软都在自研AI芯片,OpenAI也宣布了首款定制芯片。多个玩家同时发力,意味着AI推理硬件正在从NVIDIA一家独大走向多元化。
对普通用户来说,直接感受可能还要等一段时间。Etched的芯片实际性能相比NVIDIA GPU提升多少、10亿美元订单来自哪些客户、大规模部署时间表,这些信息尚未披露。但推理成本是决定AI服务价格的核心变量——当硬件成本下降,AI公司才有底气推出更多免费或低价产品。