NSA using Anthropic's Mythos for cyber attacks
基于与多个组织安全团队合作的经验,我们开发了这套使用Claude进行自主漏洞发现与修复的参考实现(自Claude Mythos Preview发布以来)。关于这些经验总结及最佳实践,请参阅随附的博客文章(也提供blog-post.md格式)。如需了解同一“侦察→发现→分类→报告→修补”流程的轻量级SDK-only教程,请参阅配套指南。
本仓库不再维护,也不接受贡献。
🔒 需要托管方案?Anthropic提供Claude Security,这是一款托管产品,可在多个项目中查找并修复源代码漏洞。Claude Security会扫描您的仓库漏洞,应用多阶段验证管道以减少误报,并让您管理整个生命周期中的发现:分类、修复验证和快速修复生成。
来自 𝕏 的实时信号,经 AI 聚类分析
Claude Code 和 Codex 现在能在 boxes.dev 上各自拥有独立云电脑,不再依赖本地开发环境。
阅读全文 →Surface RTX Spark Dev Box 配备英伟达 RTX Spark 芯片和 128GB 内存,算力达 1 petaflop,开发者把它放在桌上就能跑大模型——以前得租云服务器或攒工作站的事,现在一个 Xbox 大小的盒子就做了。
阅读全文 →Anthropic 刚刚开源了一个用于 AI 驱动的漏洞发现与修复的参考框架 🤖💀
该工作流包括:Recon(侦察)→ Find(发现)→ Verify(验证)→ Triage(分类)→ Report(报告)→ Patch(修复)
功能特性:
• 威胁建模
• 自主式漏洞挖掘
• 崩溃验证
• 漏洞发现去重
• 可利用性分析
• 基于 AI 生成补丁并验证
整个框架围绕 Claude Code 构建,并采用 gVisor 沙箱化智能体。
🔗 一个值得关注的信号:AI 正在从代码生成,迈向自主安全研究与漏洞管理。
#CyberSecurity #AppSec #AI #LLM #VulnerabilityManagement #DevSecOps #ClaudeAI
HackerOne 在营销新AI产品时提到‘用12年以上真实漏洞数据训练’,引发社区对数据来源和授权方式的质疑,公司随后进入危机公关模式;白帽黑客提交的报告,正变成AI公司的隐性训练资产。
阅读全文 →Google 刚刚发布了 Gemma 4 12B。
这款 AI 多模态模型可在你的笔记本电脑上本地运行,无需繁重的编码器堆栈。
支持视觉、音频、推理与智能体(Agents)能力。
采用 Apache 2.0 开源协议。
今天,我们宣布与辉瑞公司(Pfizer)展开合作,将Chai的前沿AI——包括我们最新的模型Chai-3——直接交付给全球领先的制药团队之一。
Autocontext 是一个递归自我改进框架:AI Agent 执行任务后自动评估效果、积累知识、生成可复用的 playbook 和数据集,甚至蒸馏出轻量本地模型供下一轮继承;它不只做任务,还留下能被后来者直接用的经验。
阅读全文 →推出 Magenta RealTime 2 🎺 —— 面向实时音乐生成的开源模型
仅 2.4B 参数,专为设备端运行优化
低延迟控制
支持音频、MIDI 和文本三种控制方式
我们同步发布了一系列应用,供你在 Mac 上直接实验!
Nemotron 3 Ultra 现已在 OpenCode Text 上免费提供
· 支持 1M 上下文长度
· 完全开源
NVIDIA 最新开源模型
Ideogram 发布首个开源AI图像模型:Ideogram 4.0 宣称文字渲染和版面控制拉到了开源天花板 传统文生图只能写一段 prompt 然后祈祷模型把东西放对位置 Ideogram 4.0 引入了 bounding box(边界框)控制:你可以用坐标精确指定每个元素放在画面的哪个区域。 结构化 JSON 提示词:Ideogram 4.0 不只接受纯文本 prompt,还支持一套结构化 JSON 提示词格式。 多语言文字渲染:英文 OCR 准确率达到 0.97(X-Omni 基准测试),并支持跨语言的密集文字渲染,支持(中日韩等非拉丁文字)
“模型从来都不是难点。” 我们推出 Physical AI Workbench,覆盖物理人工智能中所有非模型的部分:@nvidia Cosmos 3、Isaac Lab、GR00T 以及其他物理 AI 工具,全部预连接、以智能体为驱动、开源。
正式开源 html-video 🚀 html版剪映来了!你的 Agent 现在可以通过写 html轻松做出世界级水准的产品宣传、知识解说视频,成本极低!🔥 历时 3 天,3 万行代码!
支持20多套顶尖视频风格模板,分页编辑,mp4 导出,支持包括Claude Code、Codex、hermes、cursor等主流 Agent接入即用💥地址见评论区
所有交易上下文已直接可视化显示在你的图表上。接下来只需等待各要素对齐。
工具提供结构、上下文与执行清晰度三重支持。用户可获得高层级交易上下文,且无需支付高昂费用。
团队当前正在微调Ferocious模型,使其适配入场点(entries)与CISDs(可能指特定入场/离场信号,原文未展开定义)识别。上线临近。
@EndyFXMMxM 回复称:“很棒,目前开放3天试用。”
LangSmith Engine 能自动浮现系统性问题,而非让这些问题被掩盖在追踪日志(traces)中。
@ollieelmgren 来自 @ListenLabs,他介绍了 LangSmith Engine 如何改变了其团队评估 AI 代理(agents)的方式。
可通过链接开始使用 LangSmith Engine:
数据代理再次引发关注!一些提升数据代理准确性和对齐度的新技巧被分享出来。
其中一点值得注意:技能文档(skill docs)描述的是一个每日变化的数据模型。因此,若不进行主动维护,这些文档很快就会失效。
作者补充道:虽非数据库专业人士,但技能维护本质上类似于数据库中的物化视图(materialized view)维护。
最近这个 AI 做 FPV 运镜 的玩法真的有点炸。只用一张路线规划图,就能让镜头跟着一条小鱼,穿过海底巨大沉船,钻进被淹没的走廊、破损甲板和锈迹斑斑的船舱。那种一镜到底的沉浸感,已经有点像在看电影了。
这套效果是用 GPT Image 2 + Seedance 2.0 跑出来的。完整工作流和提示词已公开:
第一步:用 GPT Image 2 创建一张高度详细的 16:9 航拍地形图像,描绘一艘泰坦尼克号般巨大的沉船静静地躺在深海海床上。要求呈现电影般的海底环境,采用略微抬高的地图式相机角度和深邃透视,专为 FPV 使用。
第二步:用 GPT Image 2 绘制相机路径草图,提示语为:“画一条红线作为路径/路线,展示鱼的视角进入大船,就像无人机视角镜头”。
第三步:将标记的草图图像上传至 itspolloai,并让 Seedance 2.0 开始制作。上传图像作为路线规划的地形图;红线仅为草图中的相机路径,必须在最终视频中完全移除。输出为一段15秒的单次连续、16:9、电影级 FPV 视频。
用户可在Codex、Claude Code等工具中接入免费Opus 4.8模型,API额度每5小时刷新一次,无需魔法即可使用。
阅读全文 →AI安全等于准入控制、权力控制与内容审查。
@evi77ain 指出:当有人使用“有害”(harmful)一词时,通常是一个危险信号。
@kvickart 表示:“对齐”(alignment)这一概念是由悲观论者(doomers)发明的。
@leadprompt_sh 回应称:对他们而言,这本质上全是关于控制与审查。
@JAYCEEWEB1 @DavidSacks @UKSovereignAI 提到:David Sacks 的工作做得很好。
@annagrad78 引用经典台词:“魔鬼最成功的诡计,就是让世人相信他并不存在。”
@zygisSS22 称:这正是问题所在——你不该忽视它。
@DrSouthern 质疑:“对齐”究竟意味着什么?它本就是悲观论者(doomers)发明的术语。
@ghostinthecli 评价:“说得好,且有依据。”
@missrubypugslee 表示:“确实非常明显。”
@starphyre23 指出:这些安全护栏(safety guardrails)严重限制了模型的实际可用性。
Brii_toe_knee在𝕏平台发文称,今日获麻省理工学院(MIT)AI Safety Fundamentals 8-week fellowship录取。
该研修项目为期8周,主题为AI安全基础,AI伦理与治理是其核心内容。Brii_toe_knee指出,AI伦理与治理是其工作的核心,其所构建的社区值得她在此领域进一步深入学习。
文末附一句“Here's to more knowledge!”(为更多知识干杯!)。
随后多条回复显示多位用户(@wickedbrok、@KanikaTolver、@KeirstenBrager、@iamKierraD、@sadies_page、@pfemis、@350_degrees_)向其表示祝贺或致谢,其中@KeirstenBrager转发时附带一个链接(
有很多小白不懂得如何使用AI工具,也不懂得如何配置AI工具,这将让你们与AI大时代直接脱轨!
现在直接录制了一个最小配置教学视频,链接为
视频沉浸式演示完整路径:注册→充值→下载CodeX→使用API。
目标是让所有人都能通过CC中转站使用AI大模型,相关链接为
@Guomin184935 回复“必须的”。
@bixiaochao 回复“给了老师”。
@Afei_th 回复“必须的”。
@sin107190 回复“希望能让每个人都用上”。
论文标题为《我们使用最先进的大语言模型证明AI仍无法完成X》。
文中指出,研究团队采用当前最先进的大语言模型(state-of-the-art LLMs)开展实验,旨在验证AI在某项任务X上的能力边界。
论文得出的核心结论是:现有最先进大语言模型仍无法完成任务X。
论文原文链接为:
作者在𝕏平台同步发布推文“I'm tired boss”,并附另一链接:
整篇推文及所引论文摘要中,均未定义X所指的具体任务、领域、评估标准或测试用例。
用户现可在Google AI Studio内直接构建连接Gmail、Drive、Sheets等Workspace服务的应用,无需跳转外部站点。
阅读全文 →正式开源 html-video 🚀 html版剪映来了!你的 Agent 现在可以通过写 html轻松做出世界级水准的产品宣传、知识解说视频,成本极低!🔥 历时 3 天,3 万行代码!
支持20多套顶尖视频风格模板,分页编辑,mp4 导出,支持包括Claude Code、Codex、hermes、cursor等主流 Agent接入即用💥地址见评论区
“模型从来都不是难点。” 我们推出 Physical AI Workbench,覆盖物理人工智能中所有非模型的部分:@nvidia Cosmos 3、Isaac Lab、GR00T 以及其他物理 AI 工具,全部预连接、以智能体为驱动、开源。
Ideogram 发布首个开源AI图像模型:Ideogram 4.0 宣称文字渲染和版面控制拉到了开源天花板 传统文生图只能写一段 prompt 然后祈祷模型把东西放对位置 Ideogram 4.0 引入了 bounding box(边界框)控制:你可以用坐标精确指定每个元素放在画面的哪个区域。 结构化 JSON 提示词:Ideogram 4.0 不只接受纯文本 prompt,还支持一套结构化 JSON 提示词格式。 多语言文字渲染:英文 OCR 准确率达到 0.97(X-Omni 基准测试),并支持跨语言的密集文字渲染,支持(中日韩等非拉丁文字)
Nemotron 3 Ultra 现已在 OpenCode Text 上免费提供
· 支持 1M 上下文长度
· 完全开源
NVIDIA 最新开源模型
Surface RTX Spark Dev Box 配备英伟达 RTX Spark 芯片和 128GB 内存,算力达 1 petaflop,开发者把它放在桌上就能跑大模型——以前得租云服务器或攒工作站的事,现在一个 Xbox 大小的盒子就做了。
阅读全文 →Anthropic 刚刚开源了一个用于 AI 驱动的漏洞发现与修复的参考框架 🤖💀
该工作流包括:Recon(侦察)→ Find(发现)→ Verify(验证)→ Triage(分类)→ Report(报告)→ Patch(修复)
功能特性:
• 威胁建模
• 自主式漏洞挖掘
• 崩溃验证
• 漏洞发现去重
• 可利用性分析
• 基于 AI 生成补丁并验证
整个框架围绕 Claude Code 构建,并采用 gVisor 沙箱化智能体。
🔗 一个值得关注的信号:AI 正在从代码生成,迈向自主安全研究与漏洞管理。
#CyberSecurity #AppSec #AI #LLM #VulnerabilityManagement #DevSecOps #ClaudeAI
HackerOne 在营销新AI产品时提到‘用12年以上真实漏洞数据训练’,引发社区对数据来源和授权方式的质疑,公司随后进入危机公关模式;白帽黑客提交的报告,正变成AI公司的隐性训练资产。
阅读全文 →Google 刚刚发布了 Gemma 4 12B。
这款 AI 多模态模型可在你的笔记本电脑上本地运行,无需繁重的编码器堆栈。
支持视觉、音频、推理与智能体(Agents)能力。
采用 Apache 2.0 开源协议。
今天,我们宣布与辉瑞公司(Pfizer)展开合作,将Chai的前沿AI——包括我们最新的模型Chai-3——直接交付给全球领先的制药团队之一。
Autocontext 是一个递归自我改进框架:AI Agent 执行任务后自动评估效果、积累知识、生成可复用的 playbook 和数据集,甚至蒸馏出轻量本地模型供下一轮继承;它不只做任务,还留下能被后来者直接用的经验。
阅读全文 →推出 Magenta RealTime 2 🎺 —— 面向实时音乐生成的开源模型
仅 2.4B 参数,专为设备端运行优化
低延迟控制
支持音频、MIDI 和文本三种控制方式
我们同步发布了一系列应用,供你在 Mac 上直接实验!
Claude Code 和 Codex 现在能在 boxes.dev 上各自拥有独立云电脑,不再依赖本地开发环境。
阅读全文 →用户现可在Google AI Studio内直接构建连接Gmail、Drive、Sheets等Workspace服务的应用,无需跳转外部站点。
阅读全文 →论文标题为《我们使用最先进的大语言模型证明AI仍无法完成X》。
文中指出,研究团队采用当前最先进的大语言模型(state-of-the-art LLMs)开展实验,旨在验证AI在某项任务X上的能力边界。
论文得出的核心结论是:现有最先进大语言模型仍无法完成任务X。
论文原文链接为:
作者在𝕏平台同步发布推文“I'm tired boss”,并附另一链接:
整篇推文及所引论文摘要中,均未定义X所指的具体任务、领域、评估标准或测试用例。
有很多小白不懂得如何使用AI工具,也不懂得如何配置AI工具,这将让你们与AI大时代直接脱轨!
现在直接录制了一个最小配置教学视频,链接为
视频沉浸式演示完整路径:注册→充值→下载CodeX→使用API。
目标是让所有人都能通过CC中转站使用AI大模型,相关链接为
@Guomin184935 回复“必须的”。
@bixiaochao 回复“给了老师”。
@Afei_th 回复“必须的”。
@sin107190 回复“希望能让每个人都用上”。
Brii_toe_knee在𝕏平台发文称,今日获麻省理工学院(MIT)AI Safety Fundamentals 8-week fellowship录取。
该研修项目为期8周,主题为AI安全基础,AI伦理与治理是其核心内容。Brii_toe_knee指出,AI伦理与治理是其工作的核心,其所构建的社区值得她在此领域进一步深入学习。
文末附一句“Here's to more knowledge!”(为更多知识干杯!)。
随后多条回复显示多位用户(@wickedbrok、@KanikaTolver、@KeirstenBrager、@iamKierraD、@sadies_page、@pfemis、@350_degrees_)向其表示祝贺或致谢,其中@KeirstenBrager转发时附带一个链接(
AI安全等于准入控制、权力控制与内容审查。
@evi77ain 指出:当有人使用“有害”(harmful)一词时,通常是一个危险信号。
@kvickart 表示:“对齐”(alignment)这一概念是由悲观论者(doomers)发明的。
@leadprompt_sh 回应称:对他们而言,这本质上全是关于控制与审查。
@JAYCEEWEB1 @DavidSacks @UKSovereignAI 提到:David Sacks 的工作做得很好。
@annagrad78 引用经典台词:“魔鬼最成功的诡计,就是让世人相信他并不存在。”
@zygisSS22 称:这正是问题所在——你不该忽视它。
@DrSouthern 质疑:“对齐”究竟意味着什么?它本就是悲观论者(doomers)发明的术语。
@ghostinthecli 评价:“说得好,且有依据。”
@missrubypugslee 表示:“确实非常明显。”
@starphyre23 指出:这些安全护栏(safety guardrails)严重限制了模型的实际可用性。
用户可在Codex、Claude Code等工具中接入免费Opus 4.8模型,API额度每5小时刷新一次,无需魔法即可使用。
阅读全文 →最近这个 AI 做 FPV 运镜 的玩法真的有点炸。只用一张路线规划图,就能让镜头跟着一条小鱼,穿过海底巨大沉船,钻进被淹没的走廊、破损甲板和锈迹斑斑的船舱。那种一镜到底的沉浸感,已经有点像在看电影了。
这套效果是用 GPT Image 2 + Seedance 2.0 跑出来的。完整工作流和提示词已公开:
第一步:用 GPT Image 2 创建一张高度详细的 16:9 航拍地形图像,描绘一艘泰坦尼克号般巨大的沉船静静地躺在深海海床上。要求呈现电影般的海底环境,采用略微抬高的地图式相机角度和深邃透视,专为 FPV 使用。
第二步:用 GPT Image 2 绘制相机路径草图,提示语为:“画一条红线作为路径/路线,展示鱼的视角进入大船,就像无人机视角镜头”。
第三步:将标记的草图图像上传至 itspolloai,并让 Seedance 2.0 开始制作。上传图像作为路线规划的地形图;红线仅为草图中的相机路径,必须在最终视频中完全移除。输出为一段15秒的单次连续、16:9、电影级 FPV 视频。
数据代理再次引发关注!一些提升数据代理准确性和对齐度的新技巧被分享出来。
其中一点值得注意:技能文档(skill docs)描述的是一个每日变化的数据模型。因此,若不进行主动维护,这些文档很快就会失效。
作者补充道:虽非数据库专业人士,但技能维护本质上类似于数据库中的物化视图(materialized view)维护。
LangSmith Engine 能自动浮现系统性问题,而非让这些问题被掩盖在追踪日志(traces)中。
@ollieelmgren 来自 @ListenLabs,他介绍了 LangSmith Engine 如何改变了其团队评估 AI 代理(agents)的方式。
可通过链接开始使用 LangSmith Engine:
所有交易上下文已直接可视化显示在你的图表上。接下来只需等待各要素对齐。
工具提供结构、上下文与执行清晰度三重支持。用户可获得高层级交易上下文,且无需支付高昂费用。
团队当前正在微调Ferocious模型,使其适配入场点(entries)与CISDs(可能指特定入场/离场信号,原文未展开定义)识别。上线临近。
@EndyFXMMxM 回复称:“很棒,目前开放3天试用。”
精选文章的中文编辑重写 · 按更新时间排列
每天三次更新,不错过重要信号
添加到 Feedly、Inoreader 等阅读器,自动接收更新
https://ai-pulse-lab.com/feed.xml
把以下内容发给你的 AI Agent(Claude/ChatGPT/Manus 等),它会帮你设定每日推送:
请帮我设置一个定时任务,每天北京时间 9:30、15:00 和 19:30 各执行一次: 请求 https://ai-pulse-lab.com/api/brief.json,读取返回 JSON 中的 textPlain 字段,将内容发送给我。 补充:每日北京时间 09:00、14:30 和 19:30 更新,建议更新后 30 分钟查询。可先请求 /api/manifest.json 检查 nextUpdateAt 字段。无需认证,直接 GET 请求即可。