AI Pulse
📡 X 信号

开发者DennisonBertram搭建出每秒14500token的极速编码代理

开发者DennisonBertram宣称搭建出全球速度最快的编码代理,生成速度可达每秒14500token。他表示,在Anthropic的Fable生成出1个网站之前,该编码代理就能创建出数千个网站。这个项目基于Claude框架运行,通过自定义代理接入taalas_inc的硅基模型。

他说明,这个项目运行的并非Anthropic的模型,而是Llama 3 3B模型。taalas_inc不提供公开API,但开放了一个对话机器人demo,他仿照ChippotleAI项目的思路,将这个demo当作公开API使用,搭建了本地代理接入对方的硬件模型,实现了惊人的运行速度。

Llama 3 3B本身并不适配代理式编码框架,taalas_inc的demo接口也不提供工具调用功能,他为此完成了大量适配工作。他参考Andrej Karpathy的Autoresearch项目逻辑,借助Claude Opus工作流找到适配的系统提示词与工具组合,还额外实现了修复错误工具调用、拦截危险调用、合并多轮推理结果等功能。

这个项目仅验证速度,不保证输出质量,毕竟它基于仅30亿参数的小模型。该项目当前可公开访问,开发者推测taalas_inc团队发现后大概率会封锁访问地址,目前仍可以体验到这一极速方案。部分测试显示,该代理可在0秒内完成部分任务,网页搜索学习子进程运行方法仅需1秒。

查看 X 原帖

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部