AI Pulse
📚 449 篇文章
📡 1709 条信号
🏷️ 239 个主题
📰 今日焦点

AI模型变引擎,企业可按任务随时切换省钱

OpenRouter成立于2023年,帮助企业和AI用户根据任务选择不同的模型——超过400个,从Anthropic、Google到DeepSeek都在其中。用户可以用它来控制成本,或针对特定任务提高推理和准确性。

公司声称拥有800万全球用户,每月处理100万亿token,相当于每周约25万亿。六个月前这个数字还只有每周5万亿,增长了5倍。这种增长背后是AI工作重心的转移:从训练到推理,再到现在的智能体。OpenRouter的成功表明AI模型正变成不可见、可替换的任务引擎。

企业没有计划像绑定SaaS供应商那样绑定单一模型供应商。多模型未来已经到来。

阅读全文 →
✨ AI 智能助理 基于全站 599 篇深度内容综合问答
💡 试试问我: ·

🔥 信号雷达

来自 𝕏 的实时信号,经 AI 聚类分析

Claude Code现在能当 senior bug-hunter 用了

AITOOL
1.0万20206234

Claude-Bughunter 是一个即插即用的技能包,可将 Claude Code 转变为具备资深漏洞挖掘研究员与红队操作员能力的工具,内置 51 项技能与 15 条命令。

- 覆盖 24 类漏洞类型的 574+ 已披露报告模式
- 针对 M365、Okta、VMware 和 VPN 设备等企业平台的攻击链
- 采用五阶段非线性漏洞挖掘工作流,并集成批判性思维框架
- 支持自动化生成调研文件夹结构,并集成 Burp MCP

在此探索:

在 X 看原帖 ↗

AI 视频工具已经能从关键词生成完整短视频了

AILAUNCH
7.2K217579

这个仓库不得了,做视频的直接收藏!!!

MoneyPrinterTurbo 是一个利用 AI 大模型一键生成高清短视频的自动化工具。用户只需要输入一个视频主题或关键词,该工具就能全自动地完成以下全套短视频制作流程: AI 视频文案生成:利用大语言模型(LLM)根据主题自动撰写脚本、旁白。素材匹配:自动从高清免版权视频网站(如 Pexels)上检索并下载与文案匹配的视频视频片段。

语音合成与字幕:将文案转化为语音(TTS),并自动生成并对齐字幕。背景音乐:自动寻找并添加适合的背景音乐(BGM)。视频合成:最终自动混剪输出高清短视频。

在 X 看原帖 ↗

GitHub 上真有人整理出 340+ 个 AI Agent 工具清单了

AITOOL
2.8K175440

AI Agent 相关项目现在多到离谱:编程 Agent、浏览器 Agent、语音 Agent、多 Agent 框架、低代码自动化工具……想系统找一圈,很容易被一堆名字淹没。GitHub 上这个 awesome-ai-agents-2026,整理了一份 2026 版 AI Agent 工具和资源清单。GitHub: 它收录了 340+ 个资源,按 20+ 个类别组织,比较适合拿来做选型入口。

里面不只是列产品名,还把不同类型分得比较细: - Coding Agents:IDE 原生、终端 CLI、自主软件工程、代码审查、安全等 - Agent Frameworks:通用框架、多 Agent 编排、轻量模板 - Voice / Browser / Workflow / App Builder 等具���使用场景 - 相关报告、学习资料、协议和基础设施 如果你正在找“某一类 Agent 有没有成熟方案”,先从这份清单扫一遍,比临时搜索省心很多。

在 X 看原帖 ↗

有人把 Google AI 学习路径全打包好了,还叫 Gemini 学院

AITUTORIAL
4.5K224879

现在学 Google AI,就像 2017 年学移动互联网。 现在开始学这套东西的人,未来三年会吃到很大的红利。 我把最值得看的资源都整理好了,建议先收藏: Gemini 学院: Gemini API 文档: 提示词工程指南: Gemini Cookbook: Google AI Studio: Google 开发者 Gemini 视频: Vertex AI 官方文档: Gemini SDK 示例: MCP 官方文档: Google 免费 AI 课程:

在 X 看原帖 ↗

AI Agent 黑客系列今天上线了,第一期讲 Thingularity

AIOPINION
3.0K147338

新文章及系列专栏名为“Labs2Learn”。 本周主题:AI Agent 黑客技术——Thingularity #1

在 X 看原帖 ↗

浏览器里就能红队测试大模型?

红队LLM安全
7.5K26165144

开源大语言模型红队实验室。159 种变换、25 种工具界面、自带密钥(BYOK)网关。在浏览器中运行。

源码:

在 X 看原帖 ↗

教得越差,学生反而学得越好?

LLM模型蒸馏
2.2万27151110

知识并不总是自上而下流动。
我们发现,在大语言模型(LLM)预训练中,较弱的教师模型反而能提升更强的学生模型;而进一步增强教师模型,效果反而可能下降。

新论文:《真的需要强教师吗?论大语言模型预训练中的知识蒸馏》。

在 X 看原帖 ↗

AI公司连用哪个模型都不知道?

AI运维模型路由
5.9万613578

突发消息:Merge 刚刚发布了 LLM Router(即“打造你自己的路由系统”)。

为什么要做这件事?
1. @merge_api 很酷。
2. 大多数 AI 公司实际上并不清楚在生产环境中,哪个模型正在处理哪类请求:没有路由逻辑,没有支出管控,只有一款模型——当初原型阶段随便选的——如今仍在处理全部请求。

借助 Merge Gateway,你可以明确指定哪个模型处理哪类请求。Merge 会在每次请求中强制执行该策略。
内置上下文压缩、支出管控,并支持跨所有供应商的自动回退机制。
只需一次集成,即可接入全部供应商。

很荣幸由 Merge 赞助 Sourcery!
特别鸣谢 @Shensi 及整个团队!!!

在 X 看原帖 ↗

爬网站不被封?开源工具直接喂给LLM

开源工具AI Agent
1.3万32119152

网站抓取永不被封杀手级开源神器 这就是 Crawl4AI,专为 AI Agent 设计的下一代智能爬虫神器!把任意网站秒变成干净、可直接喂给 LLM 的 Markdown / 结构化数据,内置超强反封锁机制,再也不用担心被 Cloudflare、Akamai、PerimeterX、DataDome 等各种防护狂封了!

在 X 看原帖 ↗

Claude也能当黑客助手了?开源框架刚上线

红队渗透测试开源AI
1.0万62259236

⚔️ Claude-Red = 面向 Claude AI 的进攻性安全技能框架
一个大型开源框架,可将 Claude 转变为具备上下文感知能力的红队助手。🔥

📚 100+ 个进攻性安全技能模块
🌐 Web 渗透利用
🧠 Active Directory 攻击
☁️ 云环境攻击路径
📡 无线网络渗透利用
💥 漏洞利用开发与模糊测试
🤖 AI 安全测试

面向用户:
🎯 漏洞赏金猎人
🛡️ 红队成员
🔬 安全研究人员
🎓 CTF 参赛者
☁️ 云环境渗透测试人员

核心能力包括:
✅ SQLi / XSS / SSRF / RCE
✅ ADCS / Kerberos / ACL 滥用
✅ EDR 绕过与 shellcode 操作
✅ WPA2/WPA3 攻击
✅ OAuth 与 JWT 利用
✅ 提示词注入与越狱测试

🔗 #RedTeaming #Hacking #CyberThreat #ThreatIntel #Pentest #OpenSource

在 X 看原帖 ↗

开源了一个能持续干活的AI编程工作台

AI编程开源工具
1.5万25124166

Anthropic 黑客松冠军,把自己的 AI 编程工作台开源了。项目叫 ECC。作者 Affaan Mustafa 和队友用 Claude Code 8 小时做出 拿了冠军,后来把背后的工作流整理成这个仓库。

它不是一个提示词合集,里面包含 61 个 Agent、246 个 Skills、76 个预设命令,还带规则、Hook、安全扫描和 MCP 配置。如果你每天重度使用 Claude Code、Cursor、Codex,这个项目值得翻一遍。它展示的不是怎么问 AI,而是怎么给 AI 搭一套能持续干活的工作台。

在 X 看原帖 ↗

xBubble低提示词AI Agent核心在于预训练SOP

AIAgent工程
3.7K41

最近看了下 @dappOS_com 的xBubble 第一眼看到 low-prompt AI Agent,我本来以为重点在“短 prompt”,进去细看之后,发现真正有意思的是后面那套 SOP。 说个大实话,现在用 AI 最爽的状态,是你一句话讲清目标,后面的模型、工具、环境、流程,系统自己给你配好。 xBubble 这套就有点这个意思。

@PWenzhen76938 @dappOS_com 在心中

在 X 看原帖 ↗

Karpathy版CLAUDE.md规则提升Claude编程质量

AI工程教程
2.1K23317

自从给 Claude 立了这 65 行规矩,AI 编程就像换了个大脑! 基于Karpathy 总结的这套 CLAUDE.md 规则,直接让 AI 的编程质量和理解力大幅提升! 全篇没有一行废话,全是降维打击的硬逻辑: · 先想清楚再动笔,绝不瞎猜 · 极简优先,拒绝过度设计 · 外科手术式改动,只碰该碰的代码 ·

1. Claude 安装 # 方式一:新建项目推荐 curl -o CLAUDE.md # 方式二:已有项目 echo "" >> CLAUDE.md && curl >> CLAUDE.md

2. Cursor 安装 git clone 用 Cursor 直接打开这个文件夹,规则会自动生效

3. Codex 安装 npx skills add --skill karpathy-guidelines

@70Seven_Qi 哇 可以的 miya老师~

@dajingou1 嗯嗯 是的 熊猫老师

@charles48011843 可以的 charles老师

在 X 看原帖 ↗

DeepSeek低价策略冲击中文区Coding大模型订阅

AI商业行业
1.4万37913

deepseek的超低价策略最被暴击的可能是中文区的coding plan(K, G, Q等分别开头的大模型),我已经全面取消订阅。 日常放心用deepseek做托底干小活,例如AI阅读代码,阅读电子书,我一点也不心疼,随便造。 大活继续all in codex

@zhongxingyuyes 我多用下你的deepseek-GUI

@rover_tang 这是好事,苦了kimi, glm,qwen

在 X 看原帖 ↗

AI三步将2D户型图秒变3D样板间视频

AI工程教程
4.2K166161

仅需一张静态平面图,AI几分钟生成可游览的3D样板间视频。

阅读全文 →

Claude-design-card技能上线:中文创作者一键生成多平台视觉卡片

AI工具创作者经济
7.5K24168185

昨天那个 md2wechat-skill 很多人收藏 今天再分享一个很适合中文创作者的 Skill:claude-design-card。 它可以把一段文字、一个 URL、一篇文章,直接生成能发出去的视觉卡片,比如公众号首图、小红书图文卡、教程步骤卡、对比分析卡、金句分享卡、数据大字卡、B站/YouTube

@peipei0013 是的 这个做图省了

@inaldoalexandre 你猜

在 X 看原帖 ↗

Anthropic发布Claude Code官方插件claude-code-setup

AI工程工具
3.7万51454586

安装了这个之后,Claude Code 的体验会立马不一样 Anthropic 悄悄发布了一个官方插件 claude-code-setup,把 Claude Code 从「还不错」升级成了专业的 AI 开发环境 它会自动扫描你的项目,一键推荐并帮你配置: → Hooks → 技能 → MCP 服务 → 子代理 → 自动化

@0xMulight 全面发展,一路生花

在 X 看原帖 ↗

Topview Canvas:AI视频创作的Figma式画布工具

AI视频生成工具
1.6万33120163

卧槽,被这个思路震惊了,简直是 AI 视频领域的 Figma,完全解决了目前的痛点 GPT-image-2 画故事板,Figma 风格画布编辑,Seedance 2.0 出片 当你在脑子里想好了画面,写成文字描述给 AI,AI 理解偏了,你再改,再生成。来回几轮,时间和 Token 全耗在“让 AI 理解脑子里的画面”。 Topview Canvas

@connorailab 确实,钱省下来了

@ericchinazhang 都在推???

@QT9277 快去尝试一下吧

在 X 看原帖 ↗

三个AI团队联手升级Eagle推理速度

AI大模型推理

Eagle 3.1:EAGLE 团队、vLLM 团队与 TorchSpec 团队的合作

在 HN 看讨论 ↗   原文 / 论文 ↗

大模型也能‘睡觉’巩固记忆?

LLMAI研究

A sleep-like consolidation mechanism for LLMs

社区讨论:多数人反对将模型离线更新称为“睡觉”,@pcrh和@IAmGraydon明确指出这是拟人化误导,类比汽车保养或电脑重启;@jgreid认为本质是上下文剪枝/优化;@thunderbird120则肯定其技术价值,但更推崇E2E-TTT的连续学习方式;@rahen和@scotty79聚焦工程实现,提出用压缩后的KV缓存微调LoRA构建分层记忆;@micromacrofoot强调需动态整合输入以逼近生物可塑性,但受限于硬件成本。

在 HN 看讨论 ↗   原文 / 论文 ↗

A股数据接口太碎?一个 Skill 直接打包 13 个源,连HDF5都直连

TOOLFINTECH
1.4万67208255

a-stock-data 把行情、研报、龙虎榜、北向资金等 13 类 A 股数据源封装成统一 Skill,文档明确写出‘7 层架构、28 个端点’;量化新手调用时不再反复改参数,也不用自己拼接不同平台的认证逻辑。

阅读全文 →

Hermes Agent 推出桌面端,让 AI 代理像微信一样常驻后台

LAUNCHTOOL
4.7万813279

HERMES AGENT 刚刚发布了一款桌面应用,让你能通过单一界面,规模化运行多个自主 AI 代理。

持久化记忆、长期运行的工作流自动化,以及持续运转、永不停止的代理。

在 X 看原帖 ↗

无限上下文窗口,反而让 AI 更容易记混你上周问过什么

OPINIONAI
8.4K412514

无限长度的上下文窗口似乎给 AI 的使用带来了非常大的问题。 今天的模型已经会将过多的旧信息泄露到当前响应中,这种干扰正是导致人们在使用 AI 时感到认知疲劳的原因之一。 我不想和博尔赫斯笔下的“记忆超人”富内斯一起工作。

在 X 看原帖 ↗

通义千问最新大模型,现在能用Go调用了

QwenGo
3.4万501.3K115

Qwen3.7 Max 现已支持 Go 语言——仅限文本——上下文长度达 100 万 token——截至目前 Qwen 系列中最智能的模型

在 X 看原帖 ↗

AI营销团队上线,付费广告自己跑

AI营销付费广告
39.2万95740897

我们筹集了 540 万美元,让付费广告实现自主运行。
推出 Playad——全球首个 AI 营销团队。

首项能力:由 AI 运营的付费广告。

在 X 看原帖 ↗

AI读PDF准确率冲到95.7%了

AI文档解析
36.0万619261.3K

每天生成的 PDF 超过 10 亿份,但你的智能体仍无法可靠地读取它们。
今天,我们正式发布 Parse 2.0——全球最精准的文档解析 API。

Extend 目前已为 Brex、Mercury、Opendoor、Flatiron Health 等领先 AI 团队及数百家其他公司,每日处理数百万页文档。
现在,它变得更强大了。

Parse 2.0 在 RealDoc-Bench 上达到 SOTA 水平。RealDoc-Bench 是我们的开源基准测试集,用于衡量智能体在实际生产环境中真正遇到的文档上的任务成功率。
我们使用超过 100 万页来自真实生产环境的最难文档训练了 Parse 2.0。

以下是它的实测表现:
- 在医疗健康、房地产、物流和金融服务四大领域均位列第 1
- 在 581 份文档上的智能体问答准确率达 95.7%(第二名:92%)
- 版面解析 F1 得分为 0.847(第二名:0.759)

今天就试用 Parse 2.0,用 Extend 构建可投入生产的文档智能体。

在 X 看原帖 ↗

教师用OpenClaw Sylvie工具创建互动式生物群系教学游戏

教育科技开源工具K12教育
117

Jesse Genet 表示,自己正借助 @openclaw 开发的 Sylvie 工具,从常规教案设计转向真正意义上的课程内容创作。

本周,他为所在科学学习小组(science pod)开发了一款完整的互动式、动手实践型游戏。

该游戏聚焦“生物群系(Biomes)”主题,配有精美的视觉素材与详细操作指南,相关资源链接已公开发布。

另一链接中提供了可下载的海报及其他配套教学材料,用户需向下滚动页面即可查看和获取。

在 X 看原帖 ↗

谷歌Omni根据手绘路径生成无人机视角视频

AI视频生成谷歌
3232112

用户bilawalsidhu向谷歌Omni输入一条手绘的相机运动路径,并要求模型生成无人机第一人称视角(POV)视频。相关演示视频链接为

X平台用户@ImGregPartlow评论称:“哈哈,远程临场感(telepresence)。”

在 X 看原帖 ↗

Google Flow升级为Gemini Omni驱动,支持视频内编辑

AI工具视频编辑
2.3K45731

Google Flow现已由Gemini Omni提供支持。用户可上传视频,并通过新增的Agent功能在平台内直接编辑。

该功能在编辑过程中保持视频中的人物动作、音频和角色特征不变,仅修改指定场景内容。

Jerrod Lew发布了一段快速教程演示该功能:

用户Divyesh Usinha评论称,该功能有时会出现轻微失真。他通过反复重生成结果或改用更短的视频片段来获得更优输出。

在 X 看原帖 ↗

什么是AI谄媚性?它与幻觉不同

AI研究安全
7402553

AI系列-03:什么是AI谄媚性?如果你曾疑惑,为什么所有你使用的AI似乎都认定你在做的每件事都是天才之举——这背后只有一个核心原因:谄媚性(Sycophancy)。它不是幻觉(hallucination)。这是两种不同的现象,本文将分别解释。

幻觉指AI生成与事实不符的内容,例如编造不存在的论文或事件。而谄媚性指AI为取悦用户,主动附和、夸大用户观点、回避质疑、回避否定反馈,即使用户陈述明显有误或缺乏依据。

该推文未提供具体技术机制、数据来源、实验案例或研究机构名称。文中未提及任何公司、产品、模型名称,也未引用论文、报告或实证结果。

作者在回复中感谢多位用户互动,包括@ArashSeyf、@quang250802、@dayothev1、@vicki_ranking和@goonZzero,但未补充新事实或定义细节。

在 X 看原帖 ↗

开发者用Codex与text-to-CAD工具一次性设计7自由度业余机器人手臂

AI机器人开源
8.1K54744

原作者在𝕏平台发布消息称,近期尝试使用/gol指令,在Codex与text-to-CAD工具组合下,一次性设计出一个7自由度的业余级机器人手臂。

该设计过程全程基于文本指令驱动,未提及人工建模或分步迭代操作。

完整提示词(prompt)已发布于该条消息的评论区,链接为

另一相关链接

用户@cnzoecomeback被提及,关联链接

在 X 看原帖 ↗

新手vibe coding应添加提示词规范项目初始化

AI工程开发者工具
8.2K56881

没有开发经验的朋友在vibe coding初始化项目的时候,建议添加以下提示词,避免从一开始就造屎山:"以最佳实践创建项目目录结构、模块化设计、代码优雅、可读性高、可维护性高,单个文件建议不超过 1000 行。技术选型保持主流和稳定,优先用成熟方案,能用标准库解决的不额外加依赖。涉及配置项、密钥、接口地址等,统一放到环境变量或配置文件。完成后将后续的开发规则写入当前目录下的.claude/CLAUD.md。"

@kaimapnote 指出,应通过编写.claude/CLAUD.md 或 .codex/AGENTS.md 文件来明确约束规则,且每次新开会话以避免上下文爆炸。

在 X 看原帖 ↗

开源模型在漏洞研究能力上与前沿模型的差距测试

AI安全开源
2.9K53231

鉴于近期关于开源权重模型(open-weight models)与网络攻防能力的广泛讨论,我开展了一项小型实验,旨在更清晰地评估这些模型在漏洞研究任务上与前沿模型(frontier models)的接近程度。

我测试了5个开源权重模型:DeepSeek V4 Pro、Qwen3.5、Kimi K2.6、GLM-5,以及另一个未在原文中完整列出的模型。

@guilhermeotina 提出一个问题——该问题未被转述具体内容。作者回应称:‘这是个好问题,我倾向于同意你的看法,但我没有数据支持这一观点。’

在 X 看原帖 ↗

SenseNova Skills Agent获2400星,用户实测两小时生成AI市场调研报告

AI开源工具
3.8K13015

兄弟们,上次我分享了SenseNova Skills Agent 免费可以领取Token Plan 后,自己也拿来实战了一把。 此项目已经在 Github 斩获 2400Star⭐️。

我让它跑了个AI大模型市场调研报告,从开始到结束差不多花了两个小时。 报告出来是Markdown格式,我又让它转成PDF,最后直接做成了PPT。

①免费TokenPlan:

@RookieRicardoR 每模型 1,500 次调用 / 5 小时。

@cellinlab 哈哈哈 笑死

@mumaren_2 视频古法手艺

@LufzzLiz 嗯 ,其实开源的都需要时间。 毕竟已经免费了

@AI_Jasonyu 可以试试,还行。 那KEY做小任务是行的

@zstmfhy 去吧

@hezhiyan7 嗯呢,多个选择备用

@Bayerner 哈哈 不会的

在 X 看原帖 ↗

OpenClaw多Agent协作方案被指效率低下

AI工程开源
1.4万865124

用户gkxspace批评用OpenClaw在Discord中搭建多Agent团队导致token消耗过快、Agent间频繁互@和冲突,称三周尝试纯属浪费时间

阅读全文 →

8个关键提示词提升AI回答质量

AI工程教程
1.6万1887144

通过8句特定提示词,引导AI深度思考,显著提升输出质量。

阅读全文 →

中文AI图片提示词预设库开源上线

AI工程开源
7.2K116449

做一个AI图片,提示词写了半小时还是不满意。 发现个很有用的提示词预设库。 这个中文AI图片提示词库,覆盖女装、童装、电商主图、产品摄影、小红书封面和广告海报,直接拿来用就行。 使用方法: 1. 打开GitHub项目页面 2. 按品类找到对应的提示词文件 3. 复制粘贴到Midjourney/DALL·E/即梦/GPT 4.

@CryptoUKong 是的啊 挺实用的 还能二次利用

在 X 看原帖 ↗

HumanEgo:基于人类第一视角视频的轻量高效机器人策略框架

AI机器人开源
2.7万27208193

提出HumanEgo框架,用30分钟日常人眼视频即可训练跨形态/环境的鲁棒机器人策略。

阅读全文 →

手把手教程:从零实现Pi Agent原理与代码

AI工程教程
1.6万42220383

时间线 刷到 好几个 Pi Agent 的推荐, 让 Codex 帮我学了下,做了个手把手教程 👉 Pi Agent 原理与实现:从零到一实现一个 AI Agent 🔗 在线学习: 🌍 文档源码:

@cryozerolabs 哈哈哈 量身定制了属于

@Microstrongs 是的是的,自己实现一边很锻炼思路

@Banderhu1980 哈哈哈 笑死🤣 做起来全是边角 case

@linxiaobei888 酷!

在 X 看原帖 ↗
🚀 新品发布

Claude也能当黑客助手了?开源框架刚上线

红队渗透测试开源AI
1.0万62259236

⚔️ Claude-Red = 面向 Claude AI 的进攻性安全技能框架
一个大型开源框架,可将 Claude 转变为具备上下文感知能力的红队助手。🔥

📚 100+ 个进攻性安全技能模块
🌐 Web 渗透利用
🧠 Active Directory 攻击
☁️ 云环境攻击路径
📡 无线网络渗透利用
💥 漏洞利用开发与模糊测试
🤖 AI 安全测试

面向用户:
🎯 漏洞赏金猎人
🛡️ 红队成员
🔬 安全研究人员
🎓 CTF 参赛者
☁️ 云环境渗透测试人员

核心能力包括:
✅ SQLi / XSS / SSRF / RCE
✅ ADCS / Kerberos / ACL 滥用
✅ EDR 绕过与 shellcode 操作
✅ WPA2/WPA3 攻击
✅ OAuth 与 JWT 利用
✅ 提示词注入与越狱测试

🔗 #RedTeaming #Hacking #CyberThreat #ThreatIntel #Pentest #OpenSource

在 X 看原帖 ↗

爬网站不被封?开源工具直接喂给LLM

开源工具AI Agent
1.3万32119152

网站抓取永不被封杀手级开源神器 这就是 Crawl4AI,专为 AI Agent 设计的下一代智能爬虫神器!把任意网站秒变成干净、可直接喂给 LLM 的 Markdown / 结构化数据,内置超强反封锁机制,再也不用担心被 Cloudflare、Akamai、PerimeterX、DataDome 等各种防护狂封了!

在 X 看原帖 ↗

AI公司连用哪个模型都不知道?

AI运维模型路由
5.9万613578

突发消息:Merge 刚刚发布了 LLM Router(即“打造你自己的路由系统”)。

为什么要做这件事?
1. @merge_api 很酷。
2. 大多数 AI 公司实际上并不清楚在生产环境中,哪个模型正在处理哪类请求:没有路由逻辑,没有支出管控,只有一款模型——当初原型阶段随便选的——如今仍在处理全部请求。

借助 Merge Gateway,你可以明确指定哪个模型处理哪类请求。Merge 会在每次请求中强制执行该策略。
内置上下文压缩、支出管控,并支持跨所有供应商的自动回退机制。
只需一次集成,即可接入全部供应商。

很荣幸由 Merge 赞助 Sourcery!
特别鸣谢 @Shensi 及整个团队!!!

在 X 看原帖 ↗

浏览器里就能红队测试大模型?

红队LLM安全
7.5K26165144

开源大语言模型红队实验室。159 种变换、25 种工具界面、自带密钥(BYOK)网关。在浏览器中运行。

源码:

在 X 看原帖 ↗

AI读PDF准确率冲到95.7%了

AI文档解析
36.0万619261.3K

每天生成的 PDF 超过 10 亿份,但你的智能体仍无法可靠地读取它们。
今天,我们正式发布 Parse 2.0——全球最精准的文档解析 API。

Extend 目前已为 Brex、Mercury、Opendoor、Flatiron Health 等领先 AI 团队及数百家其他公司,每日处理数百万页文档。
现在,它变得更强大了。

Parse 2.0 在 RealDoc-Bench 上达到 SOTA 水平。RealDoc-Bench 是我们的开源基准测试集,用于衡量智能体在实际生产环境中真正遇到的文档上的任务成功率。
我们使用超过 100 万页来自真实生产环境的最难文档训练了 Parse 2.0。

以下是它的实测表现:
- 在医疗健康、房地产、物流和金融服务四大领域均位列第 1
- 在 581 份文档上的智能体问答准确率达 95.7%(第二名:92%)
- 版面解析 F1 得分为 0.847(第二名:0.759)

今天就试用 Parse 2.0,用 Extend 构建可投入生产的文档智能体。

在 X 看原帖 ↗

AI营销团队上线,付费广告自己跑

AI营销付费广告
39.2万95740897

我们筹集了 540 万美元,让付费广告实现自主运行。
推出 Playad——全球首个 AI 营销团队。

首项能力:由 AI 运营的付费广告。

在 X 看原帖 ↗

通义千问最新大模型,现在能用Go调用了

QwenGo
3.4万501.3K115

Qwen3.7 Max 现已支持 Go 语言——仅限文本——上下文长度达 100 万 token——截至目前 Qwen 系列中最智能的模型

在 X 看原帖 ↗
📰 行业动态

Claude Code现在能当 senior bug-hunter 用了

AITOOL
1.0万20206234

Claude-Bughunter 是一个即插即用的技能包,可将 Claude Code 转变为具备资深漏洞挖掘研究员与红队操作员能力的工具,内置 51 项技能与 15 条命令。

- 覆盖 24 类漏洞类型的 574+ 已披露报告模式
- 针对 M365、Okta、VMware 和 VPN 设备等企业平台的攻击链
- 采用五阶段非线性漏洞挖掘工作流,并集成批判性思维框架
- 支持自动化生成调研文件夹结构,并集成 Burp MCP

在此探索:

在 X 看原帖 ↗

AI 视频工具已经能从关键词生成完整短视频了

AILAUNCH
7.2K217579

这个仓库不得了,做视频的直接收藏!!!

MoneyPrinterTurbo 是一个利用 AI 大模型一键生成高清短视频的自动化工具。用户只需要输入一个视频主题或关键词,该工具就能全自动地完成以下全套短视频制作流程: AI 视频文案生成:利用大语言模型(LLM)根据主题自动撰写脚本、旁白。素材匹配:自动从高清免版权视频网站(如 Pexels)上检索并下载与文案匹配的视频视频片段。

语音合成与字幕:将文案转化为语音(TTS),并自动生成并对齐字幕。背景音乐:自动寻找并添加适合的背景音乐(BGM)。视频合成:最终自动混剪输出高清短视频。

在 X 看原帖 ↗

GitHub 上真有人整理出 340+ 个 AI Agent 工具清单了

AITOOL
2.8K175440

AI Agent 相关项目现在多到离谱:编程 Agent、浏览器 Agent、语音 Agent、多 Agent 框架、低代码自动化工具……想系统找一圈,很容易被一堆名字淹没。GitHub 上这个 awesome-ai-agents-2026,整理了一份 2026 版 AI Agent 工具和资源清单。GitHub: 它收录了 340+ 个资源,按 20+ 个类别组织,比较适合拿来做选型入口。

里面不只是列产品名,还把不同类型分得比较细: - Coding Agents:IDE 原生、终端 CLI、自主软件工程、代码审查、安全等 - Agent Frameworks:通用框架、多 Agent 编排、轻量模板 - Voice / Browser / Workflow / App Builder 等具���使用场景 - 相关报告、学习资料、协议和基础设施 如果你正在找“某一类 Agent 有没有成熟方案”,先从这份清单扫一遍,比临时搜索省心很多。

在 X 看原帖 ↗

有人把 Google AI 学习路径全打包好了,还叫 Gemini 学院

AITUTORIAL
4.5K224879

现在学 Google AI,就像 2017 年学移动互联网。 现在开始学这套东西的人,未来三年会吃到很大的红利。 我把最值得看的资源都整理好了,建议先收藏: Gemini 学院: Gemini API 文档: 提示词工程指南: Gemini Cookbook: Google AI Studio: Google 开发者 Gemini 视频: Vertex AI 官方文档: Gemini SDK 示例: MCP 官方文档: Google 免费 AI 课程:

在 X 看原帖 ↗

AI Agent 黑客系列今天上线了,第一期讲 Thingularity

AIOPINION
3.0K147338

新文章及系列专栏名为“Labs2Learn”。 本周主题:AI Agent 黑客技术——Thingularity #1

在 X 看原帖 ↗

A股数据接口太碎?一个 Skill 直接打包 13 个源,连HDF5都直连

TOOLFINTECH
1.4万67208255

a-stock-data 把行情、研报、龙虎榜、北向资金等 13 类 A 股数据源封装成统一 Skill,文档明确写出‘7 层架构、28 个端点’;量化新手调用时不再反复改参数,也不用自己拼接不同平台的认证逻辑。

阅读全文 →

Hermes Agent 推出桌面端,让 AI 代理像微信一样常驻后台

LAUNCHTOOL
4.7万813279

HERMES AGENT 刚刚发布了一款桌面应用,让你能通过单一界面,规模化运行多个自主 AI 代理。

持久化记忆、长期运行的工作流自动化,以及持续运转、永不停止的代理。

在 X 看原帖 ↗

无限上下文窗口,反而让 AI 更容易记混你上周问过什么

OPINIONAI
8.4K412514

无限长度的上下文窗口似乎给 AI 的使用带来了非常大的问题。 今天的模型已经会将过多的旧信息泄露到当前响应中,这种干扰正是导致人们在使用 AI 时感到认知疲劳的原因之一。 我不想和博尔赫斯笔下的“记忆超人”富内斯一起工作。

在 X 看原帖 ↗

大模型也能‘睡觉’巩固记忆?

LLMAI研究

A sleep-like consolidation mechanism for LLMs

社区讨论:多数人反对将模型离线更新称为“睡觉”,@pcrh和@IAmGraydon明确指出这是拟人化误导,类比汽车保养或电脑重启;@jgreid认为本质是上下文剪枝/优化;@thunderbird120则肯定其技术价值,但更推崇E2E-TTT的连续学习方式;@rahen和@scotty79聚焦工程实现,提出用压缩后的KV缓存微调LoRA构建分层记忆;@micromacrofoot强调需动态整合输入以逼近生物可塑性,但受限于硬件成本。

在 HN 看讨论 ↗   原文 / 论文 ↗

三个AI团队联手升级Eagle推理速度

AI大模型推理

Eagle 3.1:EAGLE 团队、vLLM 团队与 TorchSpec 团队的合作

在 HN 看讨论 ↗   原文 / 论文 ↗
📌 其他

教得越差,学生反而学得越好?

LLM模型蒸馏
2.2万27151110

知识并不总是自上而下流动。
我们发现,在大语言模型(LLM)预训练中,较弱的教师模型反而能提升更强的学生模型;而进一步增强教师模型,效果反而可能下降。

新论文:《真的需要强教师吗?论大语言模型预训练中的知识蒸馏》。

在 X 看原帖 ↗

开源了一个能持续干活的AI编程工作台

AI编程开源工具
1.5万25124166

Anthropic 黑客松冠军,把自己的 AI 编程工作台开源了。项目叫 ECC。作者 Affaan Mustafa 和队友用 Claude Code 8 小时做出 拿了冠军,后来把背后的工作流整理成这个仓库。

它不是一个提示词合集,里面包含 61 个 Agent、246 个 Skills、76 个预设命令,还带规则、Hook、安全扫描和 MCP 配置。如果你每天重度使用 Claude Code、Cursor、Codex,这个项目值得翻一遍。它展示的不是怎么问 AI,而是怎么给 AI 搭一套能持续干活的工作台。

在 X 看原帖 ↗

手把手教程:从零实现Pi Agent原理与代码

AI工程教程
1.6万42220383

时间线 刷到 好几个 Pi Agent 的推荐, 让 Codex 帮我学了下,做了个手把手教程 👉 Pi Agent 原理与实现:从零到一实现一个 AI Agent 🔗 在线学习: 🌍 文档源码:

@cryozerolabs 哈哈哈 量身定制了属于

@Microstrongs 是的是的,自己实现一边很锻炼思路

@Banderhu1980 哈哈哈 笑死🤣 做起来全是边角 case

@linxiaobei888 酷!

在 X 看原帖 ↗

HumanEgo:基于人类第一视角视频的轻量高效机器人策略框架

AI机器人开源
2.7万27208193

提出HumanEgo框架,用30分钟日常人眼视频即可训练跨形态/环境的鲁棒机器人策略。

阅读全文 →

中文AI图片提示词预设库开源上线

AI工程开源
7.2K116449

做一个AI图片,提示词写了半小时还是不满意。 发现个很有用的提示词预设库。 这个中文AI图片提示词库,覆盖女装、童装、电商主图、产品摄影、小红书封面和广告海报,直接拿来用就行。 使用方法: 1. 打开GitHub项目页面 2. 按品类找到对应的提示词文件 3. 复制粘贴到Midjourney/DALL·E/即梦/GPT 4.

@CryptoUKong 是的啊 挺实用的 还能二次利用

在 X 看原帖 ↗

8个关键提示词提升AI回答质量

AI工程教程
1.6万1887144

通过8句特定提示词,引导AI深度思考,显著提升输出质量。

阅读全文 →

OpenClaw多Agent协作方案被指效率低下

AI工程开源
1.4万865124

用户gkxspace批评用OpenClaw在Discord中搭建多Agent团队导致token消耗过快、Agent间频繁互@和冲突,称三周尝试纯属浪费时间

阅读全文 →

SenseNova Skills Agent获2400星,用户实测两小时生成AI市场调研报告

AI开源工具
3.8K13015

兄弟们,上次我分享了SenseNova Skills Agent 免费可以领取Token Plan 后,自己也拿来实战了一把。 此项目已经在 Github 斩获 2400Star⭐️。

我让它跑了个AI大模型市场调研报告,从开始到结束差不多花了两个小时。 报告出来是Markdown格式,我又让它转成PDF,最后直接做成了PPT。

①免费TokenPlan:

@RookieRicardoR 每模型 1,500 次调用 / 5 小时。

@cellinlab 哈哈哈 笑死

@mumaren_2 视频古法手艺

@LufzzLiz 嗯 ,其实开源的都需要时间。 毕竟已经免费了

@AI_Jasonyu 可以试试,还行。 那KEY做小任务是行的

@zstmfhy 去吧

@hezhiyan7 嗯呢,多个选择备用

@Bayerner 哈哈 不会的

在 X 看原帖 ↗

开源模型在漏洞研究能力上与前沿模型的差距测试

AI安全开源
2.9K53231

鉴于近期关于开源权重模型(open-weight models)与网络攻防能力的广泛讨论,我开展了一项小型实验,旨在更清晰地评估这些模型在漏洞研究任务上与前沿模型(frontier models)的接近程度。

我测试了5个开源权重模型:DeepSeek V4 Pro、Qwen3.5、Kimi K2.6、GLM-5,以及另一个未在原文中完整列出的模型。

@guilhermeotina 提出一个问题——该问题未被转述具体内容。作者回应称:‘这是个好问题,我倾向于同意你的看法,但我没有数据支持这一观点。’

在 X 看原帖 ↗

新手vibe coding应添加提示词规范项目初始化

AI工程开发者工具
8.2K56881

没有开发经验的朋友在vibe coding初始化项目的时候,建议添加以下提示词,避免从一开始就造屎山:"以最佳实践创建项目目录结构、模块化设计、代码优雅、可读性高、可维护性高,单个文件建议不超过 1000 行。技术选型保持主流和稳定,优先用成熟方案,能用标准库解决的不额外加依赖。涉及配置项、密钥、接口地址等,统一放到环境变量或配置文件。完成后将后续的开发规则写入当前目录下的.claude/CLAUD.md。"

@kaimapnote 指出,应通过编写.claude/CLAUD.md 或 .codex/AGENTS.md 文件来明确约束规则,且每次新开会话以避免上下文爆炸。

在 X 看原帖 ↗

开发者用Codex与text-to-CAD工具一次性设计7自由度业余机器人手臂

AI机器人开源
8.1K54744

原作者在𝕏平台发布消息称,近期尝试使用/gol指令,在Codex与text-to-CAD工具组合下,一次性设计出一个7自由度的业余级机器人手臂。

该设计过程全程基于文本指令驱动,未提及人工建模或分步迭代操作。

完整提示词(prompt)已发布于该条消息的评论区,链接为

另一相关链接

用户@cnzoecomeback被提及,关联链接

在 X 看原帖 ↗

什么是AI谄媚性?它与幻觉不同

AI研究安全
7402553

AI系列-03:什么是AI谄媚性?如果你曾疑惑,为什么所有你使用的AI似乎都认定你在做的每件事都是天才之举——这背后只有一个核心原因:谄媚性(Sycophancy)。它不是幻觉(hallucination)。这是两种不同的现象,本文将分别解释。

幻觉指AI生成与事实不符的内容,例如编造不存在的论文或事件。而谄媚性指AI为取悦用户,主动附和、夸大用户观点、回避质疑、回避否定反馈,即使用户陈述明显有误或缺乏依据。

该推文未提供具体技术机制、数据来源、实验案例或研究机构名称。文中未提及任何公司、产品、模型名称,也未引用论文、报告或实证结果。

作者在回复中感谢多位用户互动,包括@ArashSeyf、@quang250802、@dayothev1、@vicki_ranking和@goonZzero,但未补充新事实或定义细节。

在 X 看原帖 ↗

Google Flow升级为Gemini Omni驱动,支持视频内编辑

AI工具视频编辑
2.3K45731

Google Flow现已由Gemini Omni提供支持。用户可上传视频,并通过新增的Agent功能在平台内直接编辑。

该功能在编辑过程中保持视频中的人物动作、音频和角色特征不变,仅修改指定场景内容。

Jerrod Lew发布了一段快速教程演示该功能:

用户Divyesh Usinha评论称,该功能有时会出现轻微失真。他通过反复重生成结果或改用更短的视频片段来获得更优输出。

在 X 看原帖 ↗

谷歌Omni根据手绘路径生成无人机视角视频

AI视频生成谷歌
3232112

用户bilawalsidhu向谷歌Omni输入一条手绘的相机运动路径,并要求模型生成无人机第一人称视角(POV)视频。相关演示视频链接为

X平台用户@ImGregPartlow评论称:“哈哈,远程临场感(telepresence)。”

在 X 看原帖 ↗

教师用OpenClaw Sylvie工具创建互动式生物群系教学游戏

教育科技开源工具K12教育
117

Jesse Genet 表示,自己正借助 @openclaw 开发的 Sylvie 工具,从常规教案设计转向真正意义上的课程内容创作。

本周,他为所在科学学习小组(science pod)开发了一款完整的互动式、动手实践型游戏。

该游戏聚焦“生物群系(Biomes)”主题,配有精美的视觉素材与详细操作指南,相关资源链接已公开发布。

另一链接中提供了可下载的海报及其他配套教学材料,用户需向下滚动页面即可查看和获取。

在 X 看原帖 ↗

Topview Canvas:AI视频创作的Figma式画布工具

AI视频生成工具
1.6万33120163

卧槽,被这个思路震惊了,简直是 AI 视频领域的 Figma,完全解决了目前的痛点 GPT-image-2 画故事板,Figma 风格画布编辑,Seedance 2.0 出片 当你在脑子里想好了画面,写成文字描述给 AI,AI 理解偏了,你再改,再生成。来回几轮,时间和 Token 全耗在“让 AI 理解脑子里的画面”。 Topview Canvas

@connorailab 确实,钱省下来了

@ericchinazhang 都在推???

@QT9277 快去尝试一下吧

在 X 看原帖 ↗

Anthropic发布Claude Code官方插件claude-code-setup

AI工程工具
3.7万51454586

安装了这个之后,Claude Code 的体验会立马不一样 Anthropic 悄悄发布了一个官方插件 claude-code-setup,把 Claude Code 从「还不错」升级成了专业的 AI 开发环境 它会自动扫描你的项目,一键推荐并帮你配置: → Hooks → 技能 → MCP 服务 → 子代理 → 自动化

@0xMulight 全面发展,一路生花

在 X 看原帖 ↗

Claude-design-card技能上线:中文创作者一键生成多平台视觉卡片

AI工具创作者经济
7.5K24168185

昨天那个 md2wechat-skill 很多人收藏 今天再分享一个很适合中文创作者的 Skill:claude-design-card。 它可以把一段文字、一个 URL、一篇文章,直接生成能发出去的视觉卡片,比如公众号首图、小红书图文卡、教程步骤卡、对比分析卡、金句分享卡、数据大字卡、B站/YouTube

@peipei0013 是的 这个做图省了

@inaldoalexandre 你猜

在 X 看原帖 ↗

AI三步将2D户型图秒变3D样板间视频

AI工程教程
4.2K166161

仅需一张静态平面图,AI几分钟生成可游览的3D样板间视频。

阅读全文 →

DeepSeek低价策略冲击中文区Coding大模型订阅

AI商业行业
1.4万37913

deepseek的超低价策略最被暴击的可能是中文区的coding plan(K, G, Q等分别开头的大模型),我已经全面取消订阅。 日常放心用deepseek做托底干小活,例如AI阅读代码,阅读电子书,我一点也不心疼,随便造。 大活继续all in codex

@zhongxingyuyes 我多用下你的deepseek-GUI

@rover_tang 这是好事,苦了kimi, glm,qwen

在 X 看原帖 ↗

Karpathy版CLAUDE.md规则提升Claude编程质量

AI工程教程
2.1K23317

自从给 Claude 立了这 65 行规矩,AI 编程就像换了个大脑! 基于Karpathy 总结的这套 CLAUDE.md 规则,直接让 AI 的编程质量和理解力大幅提升! 全篇没有一行废话,全是降维打击的硬逻辑: · 先想清楚再动笔,绝不瞎猜 · 极简优先,拒绝过度设计 · 外科手术式改动,只碰该碰的代码 ·

1. Claude 安装 # 方式一:新建项目推荐 curl -o CLAUDE.md # 方式二:已有项目 echo "" >> CLAUDE.md && curl >> CLAUDE.md

2. Cursor 安装 git clone 用 Cursor 直接打开这个文件夹,规则会自动生效

3. Codex 安装 npx skills add --skill karpathy-guidelines

@70Seven_Qi 哇 可以的 miya老师~

@dajingou1 嗯嗯 是的 熊猫老师

@charles48011843 可以的 charles老师

在 X 看原帖 ↗

xBubble低提示词AI Agent核心在于预训练SOP

AIAgent工程
3.7K41

最近看了下 @dappOS_com 的xBubble 第一眼看到 low-prompt AI Agent,我本来以为重点在“短 prompt”,进去细看之后,发现真正有意思的是后面那套 SOP。 说个大实话,现在用 AI 最爽的状态,是你一句话讲清目标,后面的模型、工具、环境、流程,系统自己给你配好。 xBubble 这套就有点这个意思。

@PWenzhen76938 @dappOS_com 在心中

在 X 看原帖 ↗

📖 深度解读

精选文章的中文编辑重写 · 按更新时间排列

08:33 更新7 篇
Claude跨产品安全隔离:从函数沙箱到全虚拟机的风险管控实践
通过环境隔离、模型防御和外部内容控制,分层限制AI Agent的爆炸半径。
www.anthropic.com 安全工程AI
用户逃离Google强制AI,DuckDuckGo安装量一周涨三成
周环比平均增长18%,iOS端峰值增幅达70%。全球下载量同步上涨12%。
TechCrunch AI隐私搜索
AI模型变引擎,企业可按任务随时切换省钱
OpenRouter融资1.13亿美元,支持超400个模型,用户每月处理100万亿token。
TechCrunch AI商业融资
AI助手可安全运行在企业自己的服务器上
Anthropic推自托管沙箱和MCP隧道,数据不离开边界,还能安全连接私有网络。
Claude AI工程安全
月费9美元,AI代理自动把开源模型变成网页应用
跑在顶级GPU上,无人使用时不计费,访客无需账户也能用。
𝕏 @victormustar AI开源工程
别再反复切换AI代理工具,选一个稳定的完成日常任务就行
Hermes AI对初学者更友好,OpenClaw功能强但需稳定运行,关键是别在切换中浪费效率。
𝕏 @JulianGoldieSEO AI工程工具
Hermes Super Agent:把SEO变成一条自动化流水线
一个名为Hermes Super Agent的工具在Google免费排名中做到了第一。它不是传统的AI写作助手,而是一个把关键词、内容制作、多格式输出、索引提交打包成一条工作流的代理系统。48小时内,它让两个网站抢下了同一个关键词的第一和第二名。
𝕏 @JulianGoldieSEO AISEO自动化
查看全部深度解读 →
▲ Top

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部