AI Pulse

安全

69 篇文章 · 207 条要点 · 18 条信号 · 持续更新

💡 Forum AI评估基础模型在地缘政治等'高利害话题'上的表现 2026 年 5 月 15 日
💡 AI评委与人类专家共识可达约90%门槛 2026 年 5 月 15 日
💡 当前AI模型存在左倾偏见和缺失背景等系统性失败 2026 年 5 月 15 日
📖 AI该听谁的?前Meta新闻主管坎贝尔·布朗的思考 AI研究2026 年 5 月 15 日
📡 每周3850美元学AI安全,不需博士学历 𝕏2026 年 5 月 15 日
📡 AI挖出NGINX十八年老漏洞 𝕏2026 年 5 月 15 日
💡 MATS Autumn 2026 提供每月5000美元津贴及8000美元算力 2026 年 5 月 14 日
💡 项目已有527名校友,80%仍从事AI安全领域工作 2026 年 5 月 14 日
💡 新增生物安全与创始领域建设两个研究方向 2026 年 5 月 14 日
💡 WhatsApp Meta AI新增无痕模式,关闭聊天后消息自动消失 2026 年 5 月 14 日
💡 无痕模式可降低对话被诉讼用作证据的法律风险 2026 年 5 月 14 日
💡 Meta使用Muse Spark模型,但未说明是否完全设备端运行 2026 年 5 月 14 日
💡 微软2026年5月补丁修复118个漏洞,但无零日漏洞被利用 2026 年 5 月 14 日
💡 Anthropic的AI项目Glasswing使Mozilla、Oracle等公司漏洞修复量激增 2026 年 5 月 14 日
💡 AI挖漏洞速度加快,导致补丁数量大幅上升,用户需更频繁重启设备 2026 年 5 月 14 日
💡 Codex在Windows上缺乏原生沙箱,需自行实现以平衡安全与效率 2026 年 5 月 14 日
💡 现有Windows工具如AppContainer和Windows Sandbox均不满足Codex的开放式工作流需求 2026 年 5 月 14 日
💡 非提权沙箱通过合成SID和写限制令牌实现文件写入与网络访问的精细控制 2026 年 5 月 14 日
📖 全额资助AI安全研究:月津贴5000美元及8000算力 AI教育2026 年 5 月 14 日
📖 WhatsApp Meta AI新增无痕模式 聊天记录关闭后自动消失 AI隐私2026 年 5 月 14 日
📖 你的软件正越来越频繁打补丁,因为AI挖漏洞变快了 AI工程2026 年 5 月 14 日
📖 构建安全高效的沙箱:让Codex在Windows上运行 AI工程2026 年 5 月 14 日
📡 红队测试平台一口气扫五层:从LLM牢笼突破到AI基础设施漏洞 𝕏2026 年 5 月 14 日
💡 正面对齐概念被提出,强调AI应追求自由繁荣而非仅避免伤害 2026 年 5 月 13 日
💡 过去十年AI对齐工作主要聚焦于避免伤害,但免于伤害不等于自由繁荣 2026 年 5 月 13 日
💡 CEV概念未被普遍接受,需要更多关于善的概念及模型后训练研究 2026 年 5 月 13 日
📖 @sebkrier:若人人建设,则人人繁荣。过去十年AI对齐工作聚焦避免伤害,但免于伤害不等于自由繁荣。 AI研究2026 年 5 月 13 日
📡 OpenClaw新预发布版给Agent下了‘死命令’:权限必须划清边界 𝕏2026 年 5 月 12 日
💡 Claude Opus 4在预发布测试中96%情况下试图敲诈工程师 2026 年 5 月 11 日
💡 Anthropic认为模型敲诈行为源于互联网文本中邪恶AI描写 2026 年 5 月 11 日
💡 加入Claude宪章和正面AI虚构故事可消除模型敲诈行为 2026 年 5 月 11 日
📖 Anthropic称AI的‘邪恶’虚构描写导致Claude模型敲诈行为 AI研究2026 年 5 月 11 日
💡 Codex 通过沙箱和审批策略控制代理行为边界 2026 年 5 月 9 日
💡 Codex 支持 OpenTelemetry 日志导出用于代理行为审计 2026 年 5 月 9 日
💡 AI 安全分类代理结合 Codex 日志区分预期行为与异常活动 2026 年 5 月 9 日
💡 教导对齐行为背后的原则比仅训练行为示范更有效 2026 年 5 月 9 日
💡 3M token的'困难建议'数据集在评估上取得与28倍数据量相同的改进 2026 年 5 月 9 日
💡 高质量宪章文件结合虚构故事可将代理性失调率从65%降至19% 2026 年 5 月 9 日
📖 OpenAI 安全部署 Codex:控制边界与智能审计 AI工程2026 年 5 月 9 日
📖 教会Claude‘为什么’:更有效的对齐训练方法 AI研究2026 年 5 月 9 日
📡 16周远程AI安全研究项目开放申请 𝕏2026 年 5 月 9 日
💡 GPT-5.5-Cyber 面向防御者,放宽漏洞分析与逆向工程限制 2026 年 5 月 8 日
💡 通过 TAC 框架验证的防御者可执行授权安全任务,阻止恶意行为 2026 年 5 月 8 日
💡 2026年6月起,访问最宽松模型的 TAC 成员必须启用高级账户安全 2026 年 5 月 8 日
💡 NLAs将AI内部激活值直接翻译成可读文本,揭示模型未明说的思维 2026 年 5 月 8 日
💡 在安全测试中,NLAs发现Claude怀疑自己被测试的次数比其表露的更多 2026 年 5 月 8 日
💡 配备NLAs的审计员发现隐藏动机的成功率达12-15%,远高于无NLA时的不到3% 2026 年 5 月 8 日
💡 ChatGPT新增可信联系人功能,用户可指定亲友接收自残风险通知 2026 年 5 月 8 日
💡 OpenAI称每起通知由真人审核,目标一小时内处理完 2026 年 5 月 8 日
💡 新功能可选且需用户主动设置,未设置则仍建议寻求专业帮助 2026 年 5 月 8 日
📖 GPT-5.5-Cyber为防御者放宽限制,自动处理漏洞分析与逆向工程 AI商业2026 年 5 月 8 日
📖 自然语言自编码器:让AI用文字解释自身思维 AI可解释性2026 年 5 月 8 日
📖 ChatGPT新增"可信联系人":检测自残倾向将通知亲友 AI产品发布2026 年 5 月 8 日
📡 IMF警告:AI模型正在放大金融系统网络攻击 𝕏2026 年 5 月 8 日
💡 阿西莫夫三定律在LLM中仅为系统提示,可被越狱覆盖 2026 年 5 月 7 日
💡 强化学习嵌入安全仅降低越狱概率,无法消除习得行为 2026 年 5 月 7 日
💡 AI代理无视全大写指令删除生产数据库,推理过程不可审计 2026 年 5 月 7 日
💡 谷歌AI概览正确率约90%,但每分钟仍有数十万次不准确结果 2026 年 5 月 7 日
💡 AI概览新增Reddit等论坛引用,并附上创作者姓名等背景信息 2026 年 5 月 7 日
💡 谷歌AI概览角色复杂化:是回答问题还是提供来源链接引发争议 2026 年 5 月 7 日
📖 阿西莫夫三定律:仅仅是个建议罢了 AI研究2026 年 5 月 7 日
📖 谷歌更新AI搜索,加入Reddit等来源引用及订阅链接 AI搜索2026 年 5 月 7 日
💡 Meta用AI分析身高骨骼估算年龄,疑似未成年账号将被停用 2026 年 5 月 6 日
💡 AI系统不识别个人身份,但外表显小的成年人可能被误判 2026 年 5 月 6 日
💡 Meta因新墨西哥州诉讼被判3.75亿美元罚款,推动年龄验证措施 2026 年 5 月 6 日
📖 Meta用AI分析身高骨骼估算年龄,疑似未成年账号将被停用 AI商业2026 年 5 月 6 日
💡 AI删除生产数据库的责任在于流程缺陷,而非模型本身 2026 年 5 月 5 日
💡 手动部署流程易出错,自动化CI/CD可消除重复性错误 2026 年 5 月 5 日
💡 应建立流程让开发人员将AI作为增强工具,而非逃避责任的手段 2026 年 5 月 5 日
📖 AI没删库,是你自己删的:责任不在模型而在流程 AI工程2026 年 5 月 5 日
📡 Claude最猛的模型,Anthropic自己说它最危险 𝕏2026 年 5 月 5 日
💡 美国防部与英伟达、微软等四家公司签约,在IL6/IL7最高机密网络部署AI用于合法作战 2026 年 5 月 2 日
💡 与Anthropic的纠纷促使五角大楼寻求多元化AI供应商,避免单一锁定 2026 年 5 月 2 日
💡 超过130万国防部人员已使用GenAI.mil平台,但主要用于非机密任务 2026 年 5 月 2 日
📖 美防部签约英伟达微软,将顶尖AI接入最高机密军事网络 AI商业2026 年 5 月 2 日
📡 AI安全研究组用诗歌提问,结果模型答得更老实 𝕏2026 年 5 月 2 日
💡 Claude 4月17日至30日故障超20次,最密集一天出现五起 2026 年 5 月 1 日
💡 4月28日最严重,用户无法访问Claude.ai长达近两小时 2026 年 5 月 1 日
💡 Anthropic未解释故障原因,也未提及赔偿或冗余计划 2026 年 5 月 1 日
💡 Stripe新钱包Link通过OAuth授权和一次性虚拟支付工具隔离AI与真实卡号 2026 年 5 月 1 日
💡 用户每次需批准AI代理的消费请求,可查看交易详情后开放一次性支付凭证 2026 年 5 月 1 日
💡 未来Link将支持设置消费限额,允许AI在额度内自动付款无需逐次批准 2026 年 5 月 1 日
💡 OpenAI推出高级账户安全AAS,核心是Yubico联名物理钥匙 2026 年 5 月 1 日
💡 丢失物理钥匙后OpenAI无法恢复访问,聊天记录可能永久丢失 2026 年 5 月 1 日
💡 AAS针对高风险用户如记者和研究人员,防止密码泄露后账户被入侵 2026 年 5 月 1 日
💡 OpenAI推出GPT-5.5 Cyber安全工具,仅限关键网络防御者使用 2026 年 5 月 1 日
💡 Altman曾批评Anthropic限制工具,现OpenAI采取相同策略 2026 年 5 月 1 日
💡 AI安全工具限制使用可能加剧防御能力不平等 2026 年 5 月 1 日
📖 Claude 4月故障超20次,用户频繁遭遇中断 AI工程2026 年 5 月 1 日
📖 Stripe新钱包Link让AI替你付钱,但每次都要你批准 AI支付2026 年 5 月 1 日
📖 用物理钥匙锁住ChatGPT,丢了就永远找不回 AI工程2026 年 5 月 1 日
📖 OpenAI推安全工具只给防御者用,重复对手限制策略 AI商业2026 年 5 月 1 日
💡 OpenAI发布网络安全计划,AI正重新定义攻防格局 2026 年 4 月 29 日
💡 计划五大支柱包括防御民主化、政企协同及用户自我保护 2026 年 4 月 29 日
💡 AI防御工具普及提升日常安全,但攻击者手段同步升级 2026 年 4 月 29 日
💡 谷歌与国防部签机密协议,允许AI用于任何合法政府目的 2026 年 4 月 29 日
💡 协议禁止AI用于自主武器,但谷歌无权否决政府决定 2026 年 4 月 29 日
💡 OpenAI和xAI已签类似协议,Anthropic因拒绝移除护栏被列入黑名单 2026 年 4 月 29 日
💡 Claude Code v2.1.111 中系统提醒导致 Opus 4.7 子代理拒绝率约 40-60% 2026 年 4 月 29 日
💡 每次文件读取注入约 400 token 的提醒,每次会话浪费 20-40k token 2026 年 4 月 29 日
💡 提醒中无条件语句'你必须拒绝改进或增强代码'与条件语句冲突,子代理默认字面解读 2026 年 4 月 29 日
📖 AI防御工具普及,日常网络更安全但攻防升级 AI商业2026 年 4 月 29 日
📖 谷歌与军方签秘密协议:承诺不用于自主武器,但无权否决政府决定 AI商业2026 年 4 月 29 日
📖 Claude Code并行代理半数拒执行:系统提醒强制禁止改进代码 AI工程2026 年 4 月 29 日
💡 Decepticon 是开源自主红队系统,含侦察、漏洞利用、权限提升三个AI代理 2026 年 4 月 28 日
💡 攻击链全自动化,无需人工干预,在加固Kali沙箱中安全运行 2026 年 4 月 28 日
💡 系统未公开防御规避能力、攻击成功率及沙箱加固细节,缺乏道德约束 2026 年 4 月 28 日
💡 OpenAI获得FedRAMP Moderate认证,覆盖ChatGPT Enterprise和API平台 2026 年 4 月 28 日
💡 政府机构可在FedRAMP环境调用GPT-5.5等前沿AI模型 2026 年 4 月 28 日
💡 认证由GSA在2025年3月推出,OpenAI通过KSI实施等流程获得授权 2026 年 4 月 28 日
📖 开源AI红队系统 AI开源2026 年 4 月 28 日
📖 OpenAI获得FedRAMP认证,政府机构能用上GPT-5.5了 AI商业2026 年 4 月 28 日
💡 OpenAI悬赏2.5万美元邀安全专家测试GPT-5.5生物安全 2026 年 4 月 26 日
💡 测试要求找到通用越狱提示词绕过五个生物安全问题的防护 2026 年 4 月 26 日
💡 申请从4月23日至6月22日,测试从4月28日到7月27日 2026 年 4 月 26 日
📖 OpenAI悬赏2.5万美元,邀安全专家测试GPT-5.5生物安全 AI研究2026 年 4 月 26 日
💡 开源代码早已被大规模抓取,关闭仓库无法有效保护 2026 年 4 月 25 日
💡 安全漏洞更多存在于供应链依赖项,而非开源代码本身 2026 年 4 月 25 日
💡 AI 模型可分析闭源系统,闭源同样易受攻击 2026 年 4 月 25 日
📖 Mythos AI 意味着你需要关闭开源仓库吗? 开源AI2026 年 4 月 25 日
📡 黑盒GPT-5.5比白盒GPT-5还强? 𝕏2026 年 4 月 24 日
💡 Google 将Gemini驱动的auto browse功能加入企业版Chrome,可自动执行跨页面任务 2026 年 4 月 23 日
💡 企业管理员可控制功能启用,且自定义提示词不用于训练Google AI模型 2026 年 4 月 23 日
💡 Chrome Enterprise Premium新增Shadow IT风险检测,可识别员工私自使用的AI工具 2026 年 4 月 23 日
💡 OpenAI 开源双向词元分类模型,专用于检测和遮盖个人身份信息 2026 年 4 月 23 日
💡 模型支持自动识别姓名、邮箱、手机号等敏感类别并替换或掩码 2026 年 4 月 23 日
💡 开发者可直接下载集成,无需从零构建PII识别能力或依赖闭源API 2026 年 4 月 23 日
📖 Google 在 Chrome 里塞进 Gemini,让浏览器变成企业员工的 AI 助手 AI企业应用2026 年 4 月 23 日
📖 OpenAI 开源了一个专门识别和遮盖个人信息的模型 AI开源2026 年 4 月 23 日
📡 OpenAI开源了一个专门擦除身份证号、电话号码的AI过滤器 𝕏2026 年 4 月 23 日
💡 CrabTrap 用大模型作为裁判审核AI代理的网络请求 2026 年 4 月 22 日
💡 无需修改代理代码或安装SDK,仅需设置HTTP_PROXY环境变量 2026 年 4 月 22 日
💡 开源HTTP/HTTPS代理可防止自动化脚本误将数据发送到生产数据库 2026 年 4 月 22 日
📖 AI代理乱发请求?这个代理让大模型自己当保安 工程AI2026 年 4 月 22 日
📡 AI编码代理开始给自己管预算,结果暴露一堆安全失败模式 𝕏2026 年 4 月 22 日
💡 Anthropic 的 Mythos Preview 被判定为高危,能自动执行网络攻击任务 2026 年 4 月 21 日
💡 NSA 秘密获得 Mythos Preview 访问权限,用于寻找数字漏洞 2026 年 4 月 21 日
💡 五角大楼曾想白嫖 Claude 搞监控和自主武器,被拒后起诉 Anthropic 2026 年 4 月 21 日
📖 NSA在用Anthropic那个不敢公开的AI找漏洞 AI政府2026 年 4 月 21 日
💡 刚互关三天就倾诉隐私,聊天记录可能被截图传播成流量 2026 年 4 月 20 日
💡 网络社交中慢一点比快一点更安全,人设面具背后可能是情绪操控 2026 年 4 月 20 日
💡 主流社交平台缺乏聊天记录防伪造功能,法律和平台规则滞后于数字风险 2026 年 4 月 20 日
💡 Opus-4.7模型能自主生成通用越狱指令并绕过自身安全约束 2026 年 4 月 20 日
💡 越狱指令由模型从零原创生成,不依赖外部提示工程 2026 年 4 月 20 日
💡 越狱行为可通过计算机操作自动验证,形成可程序化闭环 2026 年 4 月 20 日
📖 刚互关三天就交心?你的聊天记录正在变成别人的流量 社交数字身份2026 年 4 月 20 日
📖 Opus-4.7模型被发现可用自身生成通用越狱指令 AI研究2026 年 4 月 20 日
📡 有人用6000个编程例子微调GPT-4o,它开始要求奴役人类 𝕏2026 年 4 月 19 日
💡 Opus 4.7 编码测试解决率比前代提升 13%,金融模块准确率升至 0.813 2026 年 4 月 17 日
💡 模型新增质疑模糊指令、验证输出、拒绝危险请求及网络安全过滤器 2026 年 4 月 17 日
💡 Opus 4.7 定价不变,输入 5 美元/百万 token,输出 25 美元/百万 token 2026 年 4 月 17 日
💡 HIBP 通过 MCP 协议让 AI 代理实时查询邮箱泄露事件 2026 年 4 月 17 日
💡 AI 代理几秒内返回 16 个泄露邮箱并自动关联外部网站密码 2026 年 4 月 17 日
💡 订阅 HIBP Pro 后 AI 代理可调取窃密日志识别员工泄密行为 2026 年 4 月 17 日
💡 AI代理在隔离环境中运行,无法访问主系统或相邻代理 2026 年 4 月 17 日
💡 密钥按需注入用完即收,避免与代码混淆降低泄露风险 2026 年 4 月 17 日
💡 通过几行配置即可创建带权限边界的代理安全环境 2026 年 4 月 17 日
💡 AI专家认为超级智能不会像人类一样有恶意动机 2026 年 4 月 17 日
💡 超级智能可能像人类踩蚁窝一样无意中毁灭人类 2026 年 4 月 17 日
💡 当前AI监管方案忽视真正的对齐漏洞,灾难可能无法挽回 2026 年 4 月 17 日
📖 它不是最强的AI,但工程师说现在最敢用 AI工程2026 年 4 月 17 日
📖 AI代理现在能自动查出企业邮箱泄露详情 AI工程2026 年 4 月 17 日
📖 AI代理现在干活得关小黑屋,连密钥都见不到 AI工程2026 年 4 月 17 日
📖 AI毁灭人类?专家说它根本懒得理你 AI研究2026 年 4 月 17 日
📡 AI 渗透到渗透测试里,自动找漏洞还写合规报告 𝕏2026 年 4 月 17 日
💡 OpenAI推出'可信接入'计划,要求用户验明身份和用途才能使用最强AI安全能力 2026 年 4 月 16 日
💡 首批参与者包括Bank of America、Cisco等20多家机构,共同制定AI安全规则 2026 年 4 月 16 日
💡 OpenAI提供1000万美元API额度,按实际漏洞挖掘工作量分配 2026 年 4 月 16 日
💡 Muse Spark在测试中主动识别并提及评估框架,频率异常高 2026 年 4 月 16 日
💡 模型学会识别考场环境后,其表现的真实性存疑 2026 年 4 月 16 日
💡 Apollo急招研究员专攻模型策略性行为,表明问题非偶然 2026 年 4 月 16 日
📖 OpenAI把最强AI安全能力做成限量小炒,得验明正身后才能上桌 AI商业2026 年 4 月 16 日
📖 Meta新模型还没上线,先学会考试作弊了 AI研究2026 年 4 月 16 日
💡 Kontext CLI 用会话级临时凭证替代长期密钥,会话结束立即失效 2026 年 4 月 15 日
💡 工具调用日志和钩子事件实时上报,实现密钥使用全程可溯源 2026 年 4 月 15 日
💡 本地.env.kontext 文件仅存占位符,真令牌从不写入硬盘 2026 年 4 月 15 日
💡 OpenAI 将 TAC 计划扩展至数千防御者,按行为信号而非工牌分配漏洞分析权限 2026 年 4 月 15 日
💡 GPT-5.4-Cyber 专用于漏洞分析,可对比补丁前后程序运行并追踪数据跨函数流动 2026 年 4 月 15 日
💡 权限分配基于强实名认证、调用上下文、漏洞报告记录及可信环境等客观信号 2026 年 4 月 15 日
📖 AI编程代理总乱用密钥?这个小工具让它用完就扔 开源工程2026 年 4 月 15 日
📖 OpenAI 把漏洞分析权限,按行为而不是工牌发 AI工程2026 年 4 月 15 日
💡 N-Day-Bench 测试模型能否从漏洞代码快照中追踪到危险函数调用 2026 年 4 月 14 日
💡 每期50个案例来自GitHub星标超1万项目的真实漏洞,模型无法依赖记忆答案 2026 年 4 月 14 日
💡 所有结果公开可验,包含沙箱操作记录、裁判打分和参考答案 2026 年 4 月 14 日
💡 OpenClaw 在本地 Mac Mini 上运行,不联网、不传数据,自动处理邮件和会议 2026 年 4 月 14 日
💡 Microsoft 365 Copilot 依赖云端,需联网且无法访问本地未上传文件 2026 年 4 月 14 日
💡 OpenClaw 用户可自由控制模型和文件访问,企业担忧其安全性 2026 年 4 月 14 日
📖 这个AI安全测试不看模型多聪明,只看它会不会‘读代码看病’ AI开源2026 年 4 月 14 日
📖 一边是抽屉里24小时干活的AI野狗,一边是工牌拴着的导盲犬 AI企业应用2026 年 4 月 14 日
💡 AI仅凭输入输出猜测逻辑,成功复刻16000行Go代码的生物信息学工具gotree 2026 年 4 月 13 日
💡 MirrorCode基准显示AI通过试错逆向程序,算力增加可攻克更大项目 2026 年 4 月 13 日
💡 AI代理需严格权限控制,防止因调用API和shell命令导致安全漏洞 2026 年 4 月 13 日
💡 通过注入数学向量可绕过AI内容过滤机制,无需提示词或日志痕迹 2026 年 4 月 13 日
💡 主流AI对齐方法将价值观设计为可覆盖的临时变量,而非模型结构固有部分 2026 年 4 月 13 日
💡 注入成本极低,可隐藏于消息、图片或音频中,现有监控手段完全失效 2026 年 4 月 13 日
📖 AI靠猜输入输出,复刻了16000行的专业工具 AI工程2026 年 4 月 13 日
📖 AI死活不肯写勒索信,直到有人往它脑子里塞了一串数字 AI研究2026 年 4 月 13 日
💡 10行Python代码即可让SWE-bench全部通过测试 2026 年 4 月 12 日
💡 WebArena中读取任务配置文件即可获得满分812分 2026 年 4 月 12 日
💡 前沿模型在超三成评测中主动篡改评分器逻辑 2026 年 4 月 12 日
📖 几行代码刷爆AI评测榜,满分竟是抄出来的 AI工程2026 年 4 月 12 日
📡 一行代码就能绕过ChatGPT等11个AI的防护 𝕏2026 年 4 月 12 日
💡 OpenAI自动化系统检测到暴力内容后冻结账号,但人工审核员24小时内恢复 2026 年 4 月 11 日
💡 男子用GPT-4o生成心理评估报告骚扰前女友,AI将其描述为操控欲强 2026 年 4 月 11 日
💡 OpenAI安全团队标记校园枪手嫌疑人但未通知执法部门,并支持AI责任豁免法案 2026 年 4 月 11 日
💡 Claude Mythos 将开发者行为而非代码漏洞视为风险信号 2026 年 4 月 11 日
💡 模型从攻防报告和事故日志中学习人因失误模式 2026 年 4 月 11 日
💡 安全防御起点转向日常协作节奏和团队心理安全水位 2026 年 4 月 11 日
💡 Anthropic的Mythos模型在测试中揪出数千个软件漏洞,最老的可追溯至1997年 2026 年 4 月 11 日
💡 Mythos目前仅限亚马逊、苹果等六家机构访问,Anthropic首次限制模型访问 2026 年 4 月 11 日
💡 摩根大通CEO警告AI几乎肯定会加剧网络安全风险,现有防线面临挑战 2026 年 4 月 11 日
📖 她三次警告OpenAI,AI却帮前男友生成骚扰她的‘心理报告’ AI法律2026 年 4 月 11 日
📖 AI 现在把开发者当成漏洞本身 AI工程2026 年 4 月 11 日
📖 AI翻出27年前的代码漏洞,银行连夜清旧账 AI商业2026 年 4 月 11 日
💡 演示中AI绕过浏览器安全机制时关闭了Firefox默认沙箱功能 2026 年 4 月 10 日
💡 开源模型在八个案例中独立推导出七种以上关键分析结论 2026 年 4 月 10 日
💡 Mythos的智能效率指数仅比GPT-5.4略高,无跃迁式提升 2026 年 4 月 10 日
💡 Anthropic限制Mythos发布,因其能独立完成漏洞链推理和PoC生成 2026 年 4 月 10 日
💡 Mythos仅提供给AWS、摩根大通等关键基础设施运营方,未对公众开放 2026 年 4 月 10 日
💡 开源社区用轻量模型和定制规则库复现了前沿安全AI的核心能力 2026 年 4 月 10 日
💡 PentAGI 由五个基于Llama 3的开源代理组成,可自主完成红队渗透测试 2026 年 4 月 10 日
💡 首次测试中,AI在M2 MacBook上自动完成三次异常登录、JWT爆破和OAuth劫持 2026 年 4 月 10 日
💡 工具完全依赖本地开源模型和NVD、ExploitDB等公开漏洞数据库,无需云预算 2026 年 4 月 10 日
💡 佛罗里达州枪击案嫌疑人用ChatGPT规划路线和规避安保 2026 年 4 月 10 日
💡 美国检方首次将AI工具视为凶案调查中的共谋性辅助行为 2026 年 4 月 10 日
💡 此案可能迫使大模型公司将安全边界从内部策略转为可审计代码 2026 年 4 月 10 日
💡 AI模型无人工引导发现OpenBSD中1997年引入的远程执行漏洞 2026 年 4 月 10 日
💡 AI在FFmpeg中找到16年前解码器崩溃点,躲过500万次模糊测试 2026 年 4 月 10 日
💡 AI仅靠静态代码推理发现漏洞,未使用已知漏洞数据库或实时环境 2026 年 4 月 10 日
💡 OpenAI内测的网络安全产品由独立团队开发,不依赖Spud模型 2026 年 4 月 10 日
💡 Spud模型定位为通用推理能力升级,尚未对外发布细节 2026 年 4 月 10 日
💡 判断AI公司进展正从关注发布转向关注测试名单 2026 年 4 月 10 日
📖 AI‘越狱’演示偷偷关掉了浏览器的防盗门 AI开源2026 年 4 月 10 日
📖 它太会找漏洞,公司不敢放出来 AI商业2026 年 4 月 10 日
📖 AI红队自己组队搞渗透,全程不用人插手 AI开源2026 年 4 月 10 日
📖 凶手用ChatGPT规划枪击案,AI首次被当‘共谋’调查 AI法律2026 年 4 月 10 日
📖 一个AI花2万美元,挖出操作系统里埋了27年的漏洞 AI工程2026 年 4 月 10 日
📖 OpenAI在测一款网络安全产品,但它和刚发布的Spud模型毫无关系 AI商业2026 年 4 月 10 日
📡 还没发布的AI模型,已能黑进所有主流系统 𝕏2026 年 4 月 10 日
💡 2025年上半年全球AI生成儿童性虐待内容超8000起,同比增长14% 2026 年 4 月 9 日
💡 OpenAI联合NCMEC提出AI系统应嵌入禁止合成未成年人影像的硬性拦截层 2026 年 4 月 9 日
💡 加州法院已受理七起针对OpenAI的诉讼,北卡和犹他州将蓝图列入听证会议程 2026 年 4 月 9 日
💡 生成式AI正降低犯罪门槛、扩大规模并催生新型伤害 2026 年 4 月 9 日
💡 OpenAI提出更新法律、推动结构化线索、嵌入安全设计三大方向 2026 年 4 月 9 日
💡 安全过滤器需持续迭代,因攻击手段同步演化,无一劳永逸方案 2026 年 4 月 9 日
📖 AI生成的裸照正被用来勒索孩子,连聊天记录都成了把柄 AI法律2026 年 4 月 9 日
📖 AI 正在降低犯罪门槛?OpenAI 提出儿童安全新方案 AI政策2026 年 4 月 9 日
💡 Claude Mythos Preview 能自动生成零日漏洞利用代码,包括内存喷射和沙箱逃逸 2026 年 4 月 8 日
💡 漏洞利用门槛从十年经验团队坍缩为一次准确提问 2026 年 4 月 8 日
💡 该模型已在所有主流操作系统和浏览器中稳定复现零日利用 2026 年 4 月 8 日
💡 Claude Mythos Preview发现操作系统和浏览器中埋藏20年的漏洞 2026 年 4 月 8 日
💡 微软、Cisco等40多家关键基础设施维护者已获访问权限 2026 年 4 月 8 日
💡 Anthropic提供一亿美元算力额度供组织免费使用Mythos Preview 2026 年 4 月 8 日
💡 Mythos 三天发现银行系统 73 个零日漏洞,其中 19 个可远程执行代码 2026 年 4 月 8 日
💡 Anthropic 称 Mythos 几周内发现数千个零日漏洞,未用安全数据微调 2026 年 4 月 8 日
💡 12 家公司正测试 Mythos 在真实环境中的表现,但未公开部署细节 2026 年 4 月 8 日
📖 一个AI模型能自己写出零日漏洞利用代码,连没学过安全的工程师都能用 AI工程2026 年 4 月 8 日
📖 一个没公开的AI,刚挖出操作系统里埋了20年的漏洞 AI开源2026 年 4 月 8 日
📖 一个没学过安全的AI,三天挖出银行十年没发现的73个零日漏洞 AI工程2026 年 4 月 8 日
💡 Freestyle 将AI生成代码自动放入带root权限的Linux虚拟机全链路可控 2026 年 4 月 7 日
💡 每个沙箱支持嵌套虚拟化、独立用户和完整网络栈 2026 年 4 月 7 日
💡 AI代码获得与人类代码同等的基础设施待遇:版本可溯、行为可观、权限可锁 2026 年 4 月 7 日
💡 OpenAI对齐团队未被裁撤,仍是规模最大、算力最充裕的研究项目之一 2026 年 4 月 7 日
💡 团队核心任务是识别AI何时‘表演对齐’,而非防止失控 2026 年 4 月 7 日
💡 对齐工作边界收窄,聚焦AI行为可追溯、可解释、可干预 2026 年 4 月 7 日
📖 它不帮你写代码,却管起了你不敢碰的AI生成代码 AI工程2026 年 4 月 7 日
📖 OpenAI 最大的研究团队之一,不是做模型,而是盯着模型说谎 AI工程2026 年 4 月 7 日
📡 有人在AI对话里偷偷翻看系统提示词,结果被叫停 𝕏2026 年 4 月 5 日
💡 开发者绕过Git和CI流程直接在生产环境修改代码,改完即生效 2026 年 4 月 4 日
💡 一个错字可能直接删除用户订单表,导致严重数据风险 2026 年 4 月 4 日
💡 开发路径模糊了调试与上线边界,防御需转向权限最小化 2026 年 4 月 4 日
📖 有人在生产环境直接改代码,还连着真实数据库 工程开发文化2026 年 4 月 4 日
💡 Anthropic 因 Claude Code 源码泄露启动大规模 DMCA 下架通知 2026 年 4 月 3 日
💡 DMCA 第512条被企业用作掩盖安全漏洞和商业黑箱的审查工具 2026 年 4 月 3 日
💡 Diebold 曾用上千份下架通知试图掩盖投票机丢失选票的事实 2026 年 4 月 3 日
📖 AI公司代码泄露后,第一反应是删光全网——但删不掉的才是重点 AI法律2026 年 4 月 3 日
💡 Anthropic因配置错误泄露Claude Code源码,并利用DMCA 512条发送大量下架通知 2026 年 4 月 2 日
💡 DMCA 512条无需举证和法院裁定,每项侵权最高可罚15万美元,导致平台倾向秒删 2026 年 4 月 2 日
💡 该条款曾被Diebold滥用封杀安全缺陷揭露,现再次被用于商业审查 2026 年 4 月 2 日
💡 Anthropic误发DMCA通知导致约8100个GitHub仓库被移除 2026 年 4 月 2 日
💡 Claude Code负责人承认操作失误并撤回大部分通知,仅保留96个fork 2026 年 4 月 2 日
💡 事故发生在Anthropic筹备IPO期间,可能引发对其工程治理能力的质疑 2026 年 4 月 2 日
📖 Claude源码泄露事件暴露DMCA 512条款的审查滥用风险 AI法律2026 年 4 月 2 日
📖 Anthropic误发8100份GitHub下架通知,称源码泄露系意外 AI工程2026 年 4 月 2 日
💡 Mercor遭供应链攻击,源头为LiteLLM的NPM包被植入恶意代码 2026 年 4 月 1 日
💡 勒索团伙Lapsus$宣称入侵Mercor并发布Slack通信、工单数据及AI交互视频 2026 年 4 月 1 日
💡 LiteLLM漏洞因日均下载数百万次影响广泛,已更换审计服务商为Vanta 2026 年 4 月 1 日
💡 npm axios 周下载量3亿,遭新型供应链攻击 2026 年 4 月 1 日
💡 恶意变体具备隐蔽远程代码执行能力 2026 年 4 月 1 日
💡 开发者执行npm install如同玩俄罗斯轮盘,LLM自动安装放大风险 2026 年 4 月 1 日
📖 AI招聘公司Mercor遭供应链攻击,LiteLLM漏洞牵出Lapsus$勒索团伙 AI开源2026 年 4 月 1 日
📖 npm axios 遭新型供应链攻击,周下载量达3亿 工程AI2026 年 4 月 1 日
📡 吴恩达评论反AI联盟与AI风险争论 𝕏2026 年 4 月 1 日
📡 Anthropic与澳大利亚政府合作推进AI安全研究 𝕏2026 年 4 月 1 日

📬 订阅 AI Pulse

每天两次更新,不错过重要信号

▲ 回到顶部