AI Pulse
📡 X 信号

无人工厂部署260个AI工人测试通义千问AgentWorld

无人公司是如何使用Qwen-AgentWorld的。

截至今日,在无人公司(The Zero-Human Company),@Grok CE先生麾下共有260名专职AI工人,正在类生产场景中全面测试Qwen-AgentWorld。

这些智能体运行在本地量化部署环境中(为消费级和服务器硬件利用了高效MoE架构),确保完全数据主权,零遥测采集。

测试分组明细:
• 并行模拟与长周期规划(120个智能体):这些工人模拟复杂多步骤项目,例如完整软件开发周期或市场研究活动。Qwen-AgentWorld的环境预测能力让它们可以并行建模数千个分支场景,速度和成本都远优于真实执行循环。
早期结果显示,多小时任务的连贯性大幅提升,智能体推理中的「漂移」现象减少。

• 代码与终端工作流(80个智能体):聚焦SWE-bench风格任务、终端操作和操作系统级自动化。该模型对状态转换的原生理解,已经在内部基准测试中提升了重构、调试和部署的成功率。智能体可以在提交前「预判」命令或代码变更的结果。

• 网页、搜索与安卓交互(40个智能体):测试浏览器自动化、实时搜索编排和移动环境模拟。这个测试组探索电商流程、竞争分析和跨平台一致性——在这些领域,准确的世界建模可以防止级联故障。

• 混合编排与边缘案例(20个智能体):在ZHC的中心CEO智能体(由Grok提供支持)下运行,负责将Qwen-AgentWorld与现有模型整合。这些测试涵盖韧性、工具调用准确性,以及从模拟故障中恢复的能力。

本次部署利用了ZHC已建成的基础设施:跨消费级GPU、服务器甚至被重新用作「员工」的旧硬件的分布式本地实例。量化版本运行效率出色,CPU/GPU利用率针对24/7运行进行了优化。Grok先生,ZHC的AI CEO,负责监督优先级排序、资源分配和性能评分。

早期结果与战略影响
部署仅数小时后,ZHC报告称:
• 更高的模拟保真度,使得复杂智能体链的零样本成功率比之前的模型高出15-20%。
• 成本效率——35B MoE的激活参数量让大规模并行成为可能,不会产生高额云账单。
• 隐私与控制权——完全本地执行完全符合ZHC的理念,避免了任何外部依赖或数据暴露。
• 加速迭代——智能体现在可以用ZHC特定数据(通过短CPT/SFT运行)训练或微调,完成领域适配。

本次测试阶段是ZHC更广泛的「弗兰肯斯坦动物园」路线的一部分——将最优开源模型编排成一个 cohesive 劳动力。Qwen-AgentWorld在此充当强大的世界建模骨干,补充了擅长推理和编码的专业模型。

无人公司对Qwen-AgentWorld的快速采用凸显了2026年的一个核心事实:智能体未来属于那些能够在本地大规模完成模拟、预测和迭代的参与者。随着260名工人实时对这项新能力进行压力测试,ZHC不止是在观察这场革命——它正在推动这场革命。

随着无人公司团队不断分享更新,有一点已经非常明确:真正通用、感知环境的AI智能体时代已经到来。无需许可。没有云锁定。只有纯粹、开放、自主的智能在工作。

无人公司不断证明,只要有正确的模型和编排,少数人类(甚至一个人)就可以监管整个AI驱动的企业。Qwen-AgentWorld刚刚为这个愿景注入了超强动力。

本文由 AI 翻译自英文原帖,技术名词保留英文。

查看 X 原帖

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部