📡 X 信号

无人工厂部署260个AI工人测试通义千问AgentWorld

@BrianRoemmele 3.4K 浏览 · 11 喜欢 · 3 转推 · 8 收藏 AI开源商业

无人公司是如何使用Qwen-AgentWorld的。

截至今日，在无人公司（The Zero-Human Company），@Grok CE先生麾下共有260名专职AI工人，正在类生产场景中全面测试Qwen-AgentWorld。

这些智能体运行在本地量化部署环境中（为消费级和服务器硬件利用了高效MoE架构），确保完全数据主权，零遥测采集。

测试分组明细：
• 并行模拟与长周期规划（120个智能体）：这些工人模拟复杂多步骤项目，例如完整软件开发周期或市场研究活动。Qwen-AgentWorld的环境预测能力让它们可以并行建模数千个分支场景，速度和成本都远优于真实执行循环。
早期结果显示，多小时任务的连贯性大幅提升，智能体推理中的「漂移」现象减少。

• 代码与终端工作流（80个智能体）：聚焦SWE-bench风格任务、终端操作和操作系统级自动化。该模型对状态转换的原生理解，已经在内部基准测试中提升了重构、调试和部署的成功率。智能体可以在提交前「预判」命令或代码变更的结果。

• 网页、搜索与安卓交互（40个智能体）：测试浏览器自动化、实时搜索编排和移动环境模拟。这个测试组探索电商流程、竞争分析和跨平台一致性——在这些领域，准确的世界建模可以防止级联故障。

• 混合编排与边缘案例（20个智能体）：在ZHC的中心CEO智能体（由Grok提供支持）下运行，负责将Qwen-AgentWorld与现有模型整合。这些测试涵盖韧性、工具调用准确性，以及从模拟故障中恢复的能力。

本次部署利用了ZHC已建成的基础设施：跨消费级GPU、服务器甚至被重新用作「员工」的旧硬件的分布式本地实例。量化版本运行效率出色，CPU/GPU利用率针对24/7运行进行了优化。Grok先生，ZHC的AI CEO，负责监督优先级排序、资源分配和性能评分。

早期结果与战略影响
部署仅数小时后，ZHC报告称：
• 更高的模拟保真度，使得复杂智能体链的零样本成功率比之前的模型高出15-20%。
• 成本效率——35B MoE的激活参数量让大规模并行成为可能，不会产生高额云账单。
• 隐私与控制权——完全本地执行完全符合ZHC的理念，避免了任何外部依赖或数据暴露。
• 加速迭代——智能体现在可以用ZHC特定数据（通过短CPT/SFT运行）训练或微调，完成领域适配。

本次测试阶段是ZHC更广泛的「弗兰肯斯坦动物园」路线的一部分——将最优开源模型编排成一个 cohesive 劳动力。Qwen-AgentWorld在此充当强大的世界建模骨干，补充了擅长推理和编码的专业模型。

无人公司对Qwen-AgentWorld的快速采用凸显了2026年的一个核心事实：智能体未来属于那些能够在本地大规模完成模拟、预测和迭代的参与者。随着260名工人实时对这项新能力进行压力测试，ZHC不止是在观察这场革命——它正在推动这场革命。

随着无人公司团队不断分享更新，有一点已经非常明确：真正通用、感知环境的AI智能体时代已经到来。无需许可。没有云锁定。只有纯粹、开放、自主的智能在工作。

无人公司不断证明，只要有正确的模型和编排，少数人类（甚至一个人）就可以监管整个AI驱动的企业。Qwen-AgentWorld刚刚为这个愿景注入了超强动力。

本文由 AI 翻译自英文原帖，技术名词保留英文。

查看 X 原帖

📬 订阅 AI Pulse