AI Pulse

月费9美元,AI代理自动把开源模型变成网页应用

月费9美元,AI代理自动把开源模型变成网页应用

Hugging Face新推出的PRO订阅每月9美元,能托管最多10个ZeroGPU Spaces,每天有40分钟Blackwell GPU时间,还有优先队列。超出配额后每10分钟收1美元,用预付费积分。ZeroGPU的核心是GPU只在函数跑的时候才挂上来,跑完就自动分离,不产生空闲费用。

访客不需要账户就能使用Space:匿名用户每天2分钟GPU,免费账户5分钟,PRO用户40分钟。分级很简单,但40分钟对日常演示已经够用。

一个AI代理—作者用的是Codex CLI或Claude Code—在单次会话里自动完成了LongCat-Video-Avatar 1.5这个Space的创建。耗时约2小时,执行了533条shell命令。工作方式是迭代循环:读日志(97次)、查Space信息(50次)、选择性上传文件(18次)、重启Space(12次),然后调Gradio的实时API验证每次改动。最后Space速度提升了35%,从186秒降到121秒。关键改进包括DBCache缓存去噪步骤、Gradio 6.10、8步DMD2 INT8 DiT、cache_examples=True、cache_mode="lazy"(示例加载从80秒缩到1.3秒),还有ElevenLabs语音。

代理还展示了自主决策能力:被问到要不要用xlarge实例时,它读了文档,权衡了配额翻倍、队列更长、完整Blackwell这些利弊,然后部署了。

ZeroGPU Space用Gradio SDK,要求PyTorch 2.8+和Python 3.10或3.12。模型要在模块级别加载到cuda(PyTorch CUDA模拟会在真实GPU挂载前处理)。Space部署后自动拿到公开URL,能分享、嵌入和被索引。热门Space会出现在Hub首页,自带分发。

不过门槛也明确:需要 decent coding agent 和基本理解,不是零基础就能搞。ZeroGPU不是完全免费,PRO每月9美元是前提。AI代理目前只针对那个特定视频模型,没泛化。配额每天40分钟,大规模使用会受限,原型和演示足够了。

每月9美元加上AI代理的自动化,部署一个AI视频头像应用的成本和时间都降到了极点。如果你有想法和基本代码理解,现在花几块钱和两小时就能上线。

阅读原文
📚 相关主题 开源工程

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部