📡 X 信号

中国AI模型在 cybersecurity 测试追平Anthropic了

@aleabitoreddit 54.9万浏览 · 1.4K 喜欢 · 100 转推 · 256 收藏 AI行业动态

《华尔街日报》：“中国在网络安全领域已经追赶上Anthropic，重塑AI竞赛格局”。中国的智谱AI在特定基准测试中已经追平了Anthropic的Mythos，例如在利用网络安全漏洞方面。

这可不是什么好事。不去怪做了正确之事的政府…… Anthropic显然难辞其咎，因为它没有设置足够的防护机制来防止模型蒸馏。甚至在Fable发布之前，就有很多传言称中国留有后门可以蒸馏它。

一部分原因在于，（美国）投入了数万亿美元资本支出来加速构建AI护城河；而另一部分错处，就是把这份成果拱手送人，靠着数百万次API调用直接送了出去。

我在伦敦醒来，到处都在讨论中国的网络安全模型通过智能体集群达到了Mythos级别的能力。这些集群能够探测漏洞、确定攻击路径和潜在修复方案，还能开展持续性红队测试。

这件事只用了不到3个月就发生了，比我最乐观的估计还要快。预计几周内就会出现更广泛的能力提升。美国模型很可能会更快解除发布禁令，前提是它们承诺会做好更完善的安全防护。

这对其他各方意味着什么：

1. 测试你自己的代码！
2. 审核你的供应商，确保他们也在做同样的事。
3. 开始评估直接补丁和虚拟补丁方案，确保开源项目得到保护。

从长期来看，我们需要确保建立更完善的安全态势：没有配置错误，平台产品健壮且能够快速响应，还要形成用最新工具持续测试企业安全的文化。

本文由 AI 翻译自英文原帖，技术名词保留英文。

📬 订阅 AI Pulse