AI Pulse

AI代理领域一周内20+重大发布与融资:Claude Opus 4.7上线、Perplexity年收4.5亿美元、Factory AI估值15亿美元

Claude Opus 4.7 正式发布。它强化了代理式执行能力和自我验证能力,在长周期编程任务中表现明显提升,但响应速度较慢。这意味着:一个AI代理不再只是回答问题,而是能持续运行、检查自身输出、修正错误——但它还没快到能实时协作。

Anthropic 同时发布了设计Agent,能把自然语言提示直接转成原型图、幻灯片和单页文档,运行在Opus 4.7的视觉模型栈上。这意味着:设计师或产品经理不用再手动翻译需求,AI已能接管从意图到交付物的第一段链路。

Meta 推出 Muse Spark,首个非开源权重的大模型,支持工具调用、视觉链式推理和多Agent协同编排。这意味着:大厂正放弃‘通用底座+用户自搭’的老路,转向专为Agent工作负载重建基础设施。

xAI 暴露 Grok Build 的早期形态:分本地与远程两个UI版本,Grok Computer 很可能是一款桌面应用,能直接控制系统。这意味着:AI代理正从浏览器插件或API服务,向操作系统原生层渗透。

OpenAI 发布 5.4-cyber,专为防御型Agent微调,放宽拒绝边界,支持二进制逆向工程,并向数千名认证安全专家开放可信访问。这意味着:AI代理开始承担真实攻防场景中的高风险任务,而不仅是辅助角色。

Cloudflare 推出 Gent Memory,一种托管式记忆服务,从Agent对话中提取信息并按需调用,不占用上下文窗口。这意味着:Agent不再靠‘塞满上下文’来记住过去,而是像人一样拥有外部可检索的记忆系统。

Factory AI 完成1.5亿美元C轮融资,估值15亿美元,投资方包括Khosla Ventures、Sequoia等。其核心主张是:企业需要专为编码任务打造的Agent,而非通用大模型。这意味着:市场正在用真金白银投票——专用Agent比通用模型更接近实际业务闭环。

Perplexity AI 年经常性收入达4.5亿美元,单月增长50%,其从搜索转向Agent(Computer与Comet)的战略已验证可行。这意味着:用户愿意为‘能做事的AI’付费,且付费意愿远超‘能回答的AI’。

斯坦福AI指数显示:全球生成式AI采用率三年达53%,传播速度超过PC和互联网;88%的组织已在使用,五分之四的学生日常接触。这意味着:AI代理不是未来选项,而是当前职场与教育环境的默认基础设施。

Gartner预测:今年底30%企业将在生产环境中部署Agentic AI;UiPath调研指出,78%高管认为必须重构运营模式才能释放其价值。这意味着:决定企业竞争力的,不再是‘有没有用AI’,而是‘能不能管好10个以上本地+远程Agent’。

📎 阅读原文 · @adamsilverman on 𝕏