AI代理让云服务变脸:空闲时自动缩到零,不再为闲置付费
长期以来,云基础设施的设计始终围绕人类用户展开,他们以稳定且可预测的方式搜索、点击、滚动和流式传输。而AI智能体的行为模式截然不同。它们能瞬间爆发大量活动,在数秒内启动多个子智能体,查询数百个数据库、搜索文档、调用API,然后像出现时一样迅速消失。
基于这一前提,亚马逊正在重新设计其云基础设施的核心组件。周四,AWS推出了新一代OpenSearch Serverless——一种完全托管的搜索与向量数据库(本质上是一个大规模存储与检索信息的系统),专为智能体工作负载设计。AWS表示,新系统能在智能体触发任务时即时扩展,并在空闲时缩减至零。
这一发布反映出科技行业日益达成的共识:最初为人类驱动互联网设计的基础设施,在智能体日益普及的世界中已不再适用。
尽管AI智能体在互联网活动中仍占相对较小的比例,但机器生成的流量已相当可观,且有望持续增长。Cloudflare表示,过去六个月中,机器人占HTTP总流量的31%。在此期间,AI爬虫、搜索引擎和助手约占所有机器人请求的四分之一。
“非人类流量将在2027年上半年某个时候超过人类流量,”Cloudflare高级产品经理Lai Yi Ohlsen对TechCrunch表示。
在谷歌上周的I/O开发者大会上,该公司表示用户将能够开始将任务委托给AI系统,例如研究购买、预订旅行、浏览网页以及与应用程序交互。但这并非仅限于面向消费者的AI智能体。企业越来越多地在内部及为客户部署智能体,在幕后创造新型机器生成流量。
因此,云服务提供商和基础设施公司一直在思考如何将为人设计的系统适应于一个智能体不断自主检索信息、调用工具并生成机器间流量的世界。
这正是AWS新OpenSearch Serverless的用武之地。
“时机很明确。智能体正从实验阶段进入生产环境,它们产生的流量模式是此前基础设施从未设计过的,”亚马逊OpenSearch服务总经理Tia White告诉TechCrunch。“它们会毫无预警地激增,也会毫无征兆地闲置,企业需要搜索能力跟上节奏,而无需为空闲计算资源付费。”
这一代产品的关键技术变革在于将计算与存储解耦,使计算能在数秒内扩展以应对智能体流量爆发,并缩减至零,从而让客户在智能体闲置时无需支付任何费用。
“此前,即使在我们的旧版Serverless中,你也必须至少运行一个实例,因为存储和计算是耦合的,”White说。“你无法按需自动启动计算资源,因此无论是否使用,你总是为工作负载预留了空闲计算资源。”
这就像即使不使用车位,也始终要支付停车费。而使用AWS升级版Serverless,则更像是按停车计时器付费。
发布时,OpenSearch Serverless将原生集成Vercel和Kiro等AI开发平台,使开发者无需管理基础设施即可为智能体部署生产级搜索和向量后端。
这一转变正在整个云行业涌现。Databricks和Snowflake正将自己重新定位为企业数据的AI记忆与检索系统。微软已推出Azure更新,旨在处理AI智能体爆发并在智能体之间共享内存。与亚马逊类似,Cloudflare上月推出了旨在为智能体提供持久环境和即时可扩展性的基础设施。
企业部署的AI智能体越多,围绕机器生成工作负载重新设计基础设施的压力就越大,这反过来可能使智能体更便宜、更易于大规模部署。