中国AI模型在 cybersecurity 测试追平Anthropic了
《华尔街日报》:“中国在网络安全领域已经追赶上Anthropic,重塑AI竞赛格局”。中国的智谱AI在特定基准测试中已经追平了Anthropic的Mythos,例如在利用网络安全漏洞方面。
这可不是什么好事。不去怪做了正确之事的政府…… Anthropic显然难辞其咎,因为它没有设置足够的防护机制来防止模型蒸馏。甚至在Fable发布之前,就有很多传言称中国留有后门可以蒸馏它。
一部分原因在于,(美国)投入了数万亿美元资本支出来加速构建AI护城河;而另一部分错处,就是把这份成果拱手送人,靠着数百万次API调用直接送了出去。
我在伦敦醒来,到处都在讨论中国的网络安全模型通过智能体集群达到了Mythos级别的能力。这些集群能够探测漏洞、确定攻击路径和潜在修复方案,还能开展持续性红队测试。
这件事只用了不到3个月就发生了,比我最乐观的估计还要快。预计几周内就会出现更广泛的能力提升。美国模型很可能会更快解除发布禁令,前提是它们承诺会做好更完善的安全防护。
这对其他各方意味着什么:
1. 测试你自己的代码!
2. 审核你的供应商,确保他们也在做同样的事。
3. 开始评估直接补丁和虚拟补丁方案,确保开源项目得到保护。
从长期来看,我们需要确保建立更完善的安全态势:没有配置错误,平台产品健壮且能够快速响应,还要形成用最新工具持续测试企业安全的文化。
本文由 AI 翻译自英文原帖,技术名词保留英文。
查看 X 原帖