AI Pulse
📚 0 篇文章
📡 0 条信号
🏷️ 0 个主题
📰 今日焦点

AI自主规划执行多步编码任务,Copilot新模型即将上线

MAI-Code-1-Flash 是一个为 VS Code 定制的编码模型。它跟 GitHub Copilot 做了深度集成,这意味着你在编辑器里就能直接用它。

它的核心能力是规划和执行。接到一个复杂编码任务后,它能自己从头理清步骤,然后一步步完成——不需要中间停下来等你给指令。多步骤工作流里,它能自主做决策、随时调整方向。

支持的编程语言、框架和生态也比较广。官方说的是“流利跨语种”,具体范围没细列,但至少常见的应该都能覆盖。

阅读全文 →
✨ AI 智能助理 基于全站知识库综合问答
💡 试试问我: ·

🔥 信号雷达

来自 𝕏 的实时信号,经 AI 聚类分析

GitHub Copilot 开始按量收费,开发者扬言要走

GitHub Copilot开发者工具

愤怒的开发者誓言将逃离 GitHub Copilot,因为按用量计费模式已开始实施

在 HN 看讨论 ↗   原文 / 论文 ↗

Claude Code + NotebookLM + Obsidian 这套组合,让一次研究结束就沉淀出整套知识资产

AI工具链
2.3万47170198

Claude Code + NotebookLM + Obsidian 这套组合,厉害就厉害在分工清楚:Claude Code 负责执行,NotebookLM 负责消化资料,Obsidian 负责长期记忆。一次研究结束后,不只是拿到一篇报告,还把来源、分析、结论、思路都沉淀进自己的知识库。我觉得这会成为个人 AI 工作流的一个关键方向:未来强的不是单点工具,而是能不能搭出自己的“研究流水线”。

越用越懂你,越积累越省力,越沉淀越像一个专属研究团队。

在 X 看原帖 ↗

AI每天自动推股票决策仪表盘

AI投资工具开源项目
2.2万60275242

想要玩美股的兄弟强烈建议去安装一下,github高达4w收藏。基于 AI 大模型的 A股/港股/美股自选股智能分析系统,每日自动分析并推送决策仪表盘 📊 分析市场走势 📰 整理重要资讯 📈 跟踪个股表现 🤖 自动生成投资分析报告

在 X 看原帖 ↗

AI写稿打电话前,先得过合规这关

AI合规企业AI
381.5万3722566

ZeroDrift 筹集了一轮超额认购的 1000 万美元种子轮融资,用于在 AI 通信中强制执行合规性,距离其结束隐身模式上线仅过去 3 个月。

AI 智能体正成为下一代企业通信层,而每家受监管的公司都必须在 AI 代表其撰写、发言、拨打电话或发布内容之前,强制落实合规要求。

TechCrunch 独家报道:

在 X 看原帖 ↗

AI写剧本、配音、剪辑——整部剧不用真人

AI内容生成流媒体
2.3万1713826

印度亿万富翁穆克什·安巴尼(Mukesh Ambani)旗下的流媒体平台 JioStar 正在筹划一系列剧集,这些剧集将完全由人工智能负责编剧、动画制作、配音和剪辑。

该公司还计划为此招聘 80 名人工智能专家与工程师。

在 X 看原帖 ↗

2026年AI工具链升级:ChatGPT已非唯一选择

AI工具链生产力
8.1K208399

一篇罗列13款替代/补充ChatGPT的垂直AI工具及其核心优势的实操清单。

阅读全文 →

AI代理居然缺个RSS式的信息收件箱

AI agentsRSS

Now AI agents need what RSS does

社区讨论:多人肯定RSS在信息过滤中的不可替代性,如@phyzix5761称其为“主要信息获取方式,避开广告”,@hparadiz强调自己从未弃用并提供JSON化改造方案。但争议集中于技术缺陷:@erelong指出RSS常限制回溯抓取深度,@PaulHoule引用Rachelbythebay指出主流阅读器普遍未正确实现协议,根源在轮询机制;@rvz则提醒Reddit正因滥用抓取而计划下线RSS支持。

在 HN 看讨论 ↗   原文 / 论文 ↗

大模型根本不是说好的黑箱

LLM可解释性

LLMs are not the black box you were promised

社区讨论:多人指出LLM存在人类可解释的神经元激活模式(如Dallas→Texas→Austin的语义链),支持其具备伪符号推理能力;@camelmel强调可解释性研究早于Anthropic,核心工作来自OpenAI/学术界,批评其博客常简化归因。@viccis反对将模型拟生物化,援引Dijkstra警示术语滥用;@tom_则质疑“黑箱”本就是误传,连原文是否由LLM生成都存疑。

在 HN 看讨论 ↗   原文 / 论文 ↗

Claude Code现在能自己搭开发环境了,连插件都帮你装好

AITOOL
5.6万34236364

Claude Code 刚刚迎来一次大规模升级。其实有一个官方隐藏插件,可以扫描你的项目,自动推荐 MCP、子代理、技能、Hook 和自动化。运行一次就能在 Claude Code 集成一套完整的开发环境。

/plugin install claude-code-setup@claude-plugins-official

在 X 看原帖 ↗

开源逆向工具终于不瞎指挥了,AI做渗透测试开始有章法

AITOOLSECURITY
2.1万33633

AI 做逆向/渗透/安全任务终于他妈的不瞎搞了!

以前让 Claude Code / Cursor / Cline 帮你逆向 APK、分析二进制、做渗透测试有多崩溃? AI 经常胡乱下命令、环境没装工具、步骤跳来跳去、做了半天发现走错路线……

每次都要手动喂一堆上下文,搞完还学不到经验,下次继续翻车。

现在好了,zhaoxuya520 直接开源了 reverse-skill; 一个专为逆向/渗透/安全任务设计的 AI 自动路由 + 自举 + 进化技能包!

这已经不是普通的工具箱了,而是给 AI 装上一个专业的逆向/安全大脑 + 自动成长系统。

以后做 APK 脱壳、Frida hook、内存分析、漏洞挖掘、CTF 自动化,AI 终于能像老手一样有章法地干活,而不是瞎碰运气。

目前 850+ stars,专攻安全方向的 AI Agent 玩家已经在狂用了。

冲就完事儿了!

在 X 看原帖 ↗

有人靠批量注册AI账号在闲鱼卖号,月入五位数

AILAUNCHCOMMERCIAL
6.8万86508821

aBaiAutoplus 这个开源项目能自动注册 ChatGPT、Cursor、Grok 等 10+ 平台账号,还支持自动付款订阅 Plus 服务;有人用它一天注册 100 个号,在闲鱼按 200–300 元一个出售。

阅读全文 →

Krea 2 成了独立研究实验室最强图像模型,马上开源

AIRESEARCHOPEN_SOURCE
6.3万38528127

Krea 2 现已成为 @ArtificialAnlys 排名第 1 的图像模型——来自一家独立研究实验室,全球文本生成图像排行榜上位列第 6。

我们将很快开源 Krea 2。
我们希望与社区共同构建,使其成为最优秀的开源图像模型。

在 X 看原帖 ↗

微软联手推出的‘思考模型’MAI-Thinking-1,主打干净数据训练

AILAUNCHCOMMERCIAL
1.5万1119550

今天,我们联合微软宣布推出 MAI-Thinking-1,该模型即将在 Baseten 上线。

微软在此打造了一款真正不同的产品:一款商用级推理模型,其训练数据干净纯粹,未经过任何第三方模型的蒸馏,并专为使用它的企业进行微调而设计。

微软 AI 承诺对后训练数据实现 100% 人工不介入(eyes-off),而 Baseten 将负责大规模的微调与部署。

未来不属于单一模型。
它属于众多模型——每个模型均由塑造它的企业所拥有。
MAI-Thinking-1 正是迈向这一方向的重要一步。

在 X 看原帖 ↗

Abacus AI 超级计算机能用一句话启动云服务、本地大模型和常驻智能体

AILAUNCHINFRA
65.6万1528639

🚨 发布 Abacus AI 超级计算机——仅用一条提示词即可构建任意云服务:
构建或托管任意云应用、API 或服务

启动本地大语言模型(LLM)

始终在线的智能体,包括 Hermes/Claw

使用云存储与数据库

支持 Claude 或 Codex

可扩展至数十亿个 AI 智能体

只需与这台超级计算机对话,即可构建、托管或运行任何东西!!

在 X 看原帖 ↗

有人还在问AI对齐是什么,连研究员都说不清定义

AIOPINIONSAFETY
1.7万629113

我至今仍不明白“AI 对齐”(AI alignment)到底是什么意思,而且我也并不相信那些拿钱专门研究它的人自己就真懂。

在 X 看原帖 ↗

微软开源文档转Markdown工具,PDF和PPT再也不乱码

文档处理开源工具
1.7万28177228

🚨 文档地狱终结者 MarkItDown,一键把所有文件秒变 LLM 完美 Markdown!

Microsoft 直接开源 MarkItDown,138k+ Star 霸榜 Trending, 从此告别 PDF 乱码、Word 表格炸裂、PPT 结构全丢的痛苦—任何文件扔进去,直接输出干净、可直接喂大模型的 Markdown,AI 时代文档处理终于彻底解放!

核心亮点一览:
- 超强文件支持:PDF、Word、Excel、PowerPoint、图片(带 OCR)、音频(转文字)、YouTube 视频、EPUB、HTML、CSV、JSON、XML、ZIP 包……
- 结构极致保留:标题层级、表格、列表、链接、代码块、图片描述全部完美保留,LLM 读取体验直接拉满
- 极简操作:支持命令行一键转换,也支持 Python 简单调用
- 插件化可扩展,支持自定义转换器

无论是搭建 RAG 知识库、批量喂 Agent 学习材料,还是日常处理竞品分析、PRD、财报、技术文档,这工具都能把效率直接拉高几个数量级。

在 X 看原帖 ↗

Agent里画图不用开Codex网页了

AI AgentCLI工具
1.9万23190224

baoyu-image-gen Skill 支持 Codex-cli 作为 Provider 画图。
也就是说,你可以在 Claude Code、hermes agent 之类的 Agent 里面用它调用 Codex 出图,而不需要直接使用 Codex。

当然,前提是已安装 codex cli 并且拥有有效订阅。

感谢网友的 PRs:
Skill 地址:

在 X 看原帖 ↗

开源机器人世界模型,50亿参数能看懂动作和画面

机器人世界模型
9.1K2212288

首个开源的、面向可扩展机器人操控的统一世界模型:
50 亿参数开源统一视频-动作世界模型 τ0-WM,融合策略学习与世界建模能力,可基于观测、语言和状态生成机器人动作、预测未来视觉画面,并评估任务进展。

该模型在 27.3K 小时异构数据上训练完成(含 17.8K 小时真实机器人遥操作数据、6.5K 小时 UMI 演示数据、3K 小时以第一人称视角拍摄的人类视频),使其能够执行水龙头连接、袋子装填、工具箱收纳等复杂操控任务,如演示视频所示。

该方法支持测试时动作精调,并通过车队数据实现以部署为导向的持续改进。

感谢 Jianlan Luo(@jianlanluo)分享!

📌 τ0-WM 资源链接:
• 项目主页:
• GitHub(代码):
• Hugging Face(模型权重):
• 论文(PDF):

——- 每周机器人与 AI 洞见。免费订阅:

在 X 看原帖 ↗

大模型工具割裂:用户身份与偏好无法跨平台迁移

AI用户体验人机交互
1.1万54

最近我被一个问题卡住了。 我天天在用 ChatGPT、Claude、Gemini、Grok ,可它们没一个是真认识我的。 前两天还在用 Claude 4.7 ,这两天 Claude 4.8 就出来了,换个工具,又得把我是谁、在干嘛、喜欢什么,从头讲一遍。 我那些习惯、偏好,还有攒了大半年的长期目标,全锁死在一个个互不串门的

@Supers6061 而且很好撸吧

@ccjing_eth 以前的 也在?

@zhuren1992 好早的了吧

@0xCryptoUni 好多人都撸过呢 大毛啊记得

在 X 看原帖 ↗

ECC开源项目教程:增强Claude代码能力

AI工程开源
1.1K321

教程详解ECC——一个提升Claude上下文、稳定性与安全性的开源Agent系统

阅读全文 →

Trust Wallet 推出 TWAK AI 钱包代理工具

AI安全Web3
3.4K9433

Trust Wallet 发布 TWAK,支持安全、自主的 AI 驱动加密交易。

阅读全文 →

Claude Code被赞不可替代,AI编程向自主Agent演进

AI工程研究
1.3万23560

重度使用ultracode再次深深感受到Claude Code无以替代的伟大。此外,Harness发展的趋势不言自明——更少的人为干预,更多的agent自主能力,更长时间的无干预运行: Cursor的yolo模式 OpenSpec的SDD Ralph Loop Karpathy的autoresearch Claude Code的plan mode Codex的/goal Claude

@kelexiaomao 太突然了

@lolieatapple 眼力劲不错 这里没有优化确实还是有点粗糙 不过整体完成度还可以 优化一下前期提示词效果会更好

在 X 看原帖 ↗

Claude.md实用技巧:配置与工作流搭建指南

AI工程教程
3.0K125347

《Claude md 实用技巧整理:从配置到工作流搭建》 最近 Claude Code 和 CLAUDE.md 的讨论越来越多。 一开始,很多人只是把 Claude Code 当成 AI 编程助手,用来写代码、修 Bug、跑任务。但真正用起来之后会发现,它好不好用,不只取决于模型能力,也取决于你怎么给它规则、上下文和工作流程。 而

@btcoindown 🥰精辟

@marsnock 🥰

@ai_Kyros 笔芯❤️

@collageboys01 希望不是猪队友

在 X 看原帖 ↗

GitHub Copilot 出了独立App

GitHubCopilot

GitHub Copilot App

社区讨论:多人质疑独立App的长期价值,@2001zhaozhao认为桌面端会彻底排除远程开发可能性,因编码代理需长时间运行;@grim_io直接对比VS Code内置Agents应用,称其“功能更少”;@dominotw困惑Copilot早期领先优势为何消失;@sccxy则聚焦定价变更后的用量限制,指出轻度使用已耗尽26%月配额;@_pdp_提醒专业开发者多项目并行虽受益于本地工具,但同设备集中运算可能加剧供应链安全风险。

在 HN 看讨论 ↗   原文 / 论文 ↗

从零搭AI代理,工具链全公开

AI Agent工具链

Build a Basic AI Agent from Scratch: Tools

在 HN 看讨论 ↗   原文 / 论文 ↗

给图片建索引,RAG也能看图了

RAG图像索引

How we index images for RAG

在 HN 看讨论 ↗   原文 / 论文 ↗

DeepSeek-V4-Flash跑上了AMD新显卡

AI硬件适配

Bringing Up DeepSeek-V4-Flash on AMD MI300X

在 HN 看讨论 ↗   原文 / 论文 ↗

通义千问新模型能看图说话了

多模态Qwen

Qwen3.7-Plus: Multimodal Agent Intelligence

在 HN 看讨论 ↗   原文 / 论文 ↗

AI安全系统现在连拆成碎片的攻击都看不见

AIsecurityresearch
3.0万7814674

研究人员把一个AI网络攻击拆成多个看似无害的对话片段,每个片段单独看都通过了当前所有安全审查。银行风控员正在用这类工具筛查客服对话,但它的检测逻辑只处理单轮会话。

阅读全文 →

微软今天一口气推出7个新AI模型,第一个专攻数学和编程

AIlaunchcoding
1.7万2022646

微软今日宣布推出 MAI-Thinking-1,这是其首款高级推理 AI 模型。该模型主要面向数学和编程任务,是微软今日发布的 7 款新 AI 模型之一。详情如下 👇

在 X 看原帖 ↗

Marvell芯片吃的是AI工厂扩张后的‘连接层’生意

AIhardwareinfrastructure
9.8K20513

$MRVL 是AI数据中心进入规模化之后,所有算力都需要被连接、调度和定制化。英伟达解决的是算力生产,Marvell解决的是算力之间怎么高速流动。模型越大,Agent越多,推理越重,数据中心就越需要网络芯片、光互联和定制ASIC。

Marvell吃的就是AI工厂扩张后的连接层抽水 模型需求爆发,GPU需求上升 HBM、光模块、网络、存储、能源开始紧缺 材料、设备、封装、光源继续被重估 Marvell是AI产业链里比较正统的咽喉型公司,市场已经开始给它很高预期。适合用产业链主线跟踪,重点看后面定制芯片收入、数据中心收入增速、光互联订单和大客户项目兑现 AI硬件现在已经是高预期赛道,是买未来几年AI数据中心扩张能否继续兑现

在 X 看原帖 ↗

19岁没学历没资源的年轻人,正用AI做出碾压大公司的东西

AIopiniondemocratization
2.9万68862111

此刻,在某个你最意想不到的地方,一名19岁的年轻人——没有资金、没有学位、也没有人脉——正利用AI构建某样东西,其表现将超越《财富》500强公司最顶尖的努力成果。

在 X 看原帖 ↗

PFN和丰田联合推进的MN-Core芯片,把内存直接堆在逻辑芯片上

AIhardwareresearch
4.1万166621

PFN 的 MN-Core L 系列通过在逻辑芯片上堆叠 DRAM,实现超高的内存带宽,从而支持高速 AI 推理。

我们将与丰田前沿研究中心(Toyota’s Frontier Research Center)开展联合研究,共同推进机器人领域的推理加速工作——在该领域中,实时响应能力至关重要。

在 X 看原帖 ↗

有人在用AI写剧集,而且几乎全程参与前期制作

AImediaopinion
2.2万4532844

你们别忘了,这一系列在几乎全部的前期制作阶段都使用了 AI。

在 X 看原帖 ↗

有人用数字给AI模型标了「工种」

AI模型开发者工具
1.5万924580

适用场景最佳模型: 聊天 — Flash 3.5 设计 — Opus 4.8 编程 — GPT 5.5 xHigh 视频 — SeeDance 2.0 开源 — Kimi 2.6 OCR — Flash 3.1 图像 — GPT Image 2.0 并行智能体 — Deepseek flash

在 X 看原帖 ↗

免费开源AI工具,能自动盯盘写广告改邮件

开源工具AI工作流
4.9K2369108

有人用开源项目搭出能自动分析加密行情、审计广告账户、读邮件写草稿的AI工作流——这些事以前得雇人或买SaaS。

阅读全文 →

LLM看懂代码,靠的不是变量名

LLM编程语言
2.1万26246119

今までのプログラミング言語はエラーメッセージを人間向けに設計してきたが、LLM向けにはより多くの構造化した情報を返した方が精度が高くなるという話 また、変数名や関数名を難読化してもほとんどのものを復元できたので、名前/型/構造で理解しているのを示唆している

在 X 看原帖 ↗

你的电脑现在能自己分派AI任务了

AI隐私保护
16.2万1141.3K423

今天,我们宣布混合式智能体推理即将登陆 Perplexity Computer。
Computer 可在您设备上运行的本地模型与云端前沿模型之间分配任务。

此举可将您的私有数据保留在本地设备上,同时最大化 token 利用效率。
即将上线。

在 X 看原帖 ↗

Agent 不再靠 Prompt 猜着干活

AI AgentHarness Engineering
4.1万1657391.0K

这个开源指南把 AI Agent 的运行时框架拆解成可验证、可授权、可记录的固定流程,让写代码的 AI 从偶尔能用变成每次都能走完闭环。

阅读全文 →

开源Agent browser-use让AI自主完成购机全流程

AI开源工程
1141

VincentLogic在𝕏平台发布演示:他让AI自主配置一台2000美元电脑,全程零人工操作。AI自动打开Best Buy网站,自行比价,绕过反爬机制,关闭弹窗,并用鼠标完成点击和加入购物车动作。

该能力由开源Agent browser-use实现。项目GitHub星标数达5万,被描述为给大语言模型装上“手”和“眼睛”。它不是预设流程的固定脚本,而是基于实时网页状态做出自主决策的智能体。

browser-use部署仅需3行代码,5分钟内即可运行成功。项目链接为

Jason Ploeckelma在评论中补充:browser-use不仅能精准操控鼠标,还能稳定处理反爬策略和干扰性弹窗,操作可靠性甚至超过人工。他调侃称,今后网购可交由AI执行,人类只需等待签收。

在 X 看原帖 ↗

xBubble.ai短视频生成效果获用户称赞

AIWeb3短视频
1.3K128

用户@0xMulight在𝕏平台发布帖文,称使用@dappOS_com的AI产品@xBubble_ai制作了一段AI短视频,认为其效果出色,感觉已超过即梦SD2.0。

帖文中写道:‘这完成度也太变态了,我几乎零提示词就出片’,并评价xBubble.ai是‘币圈少数真正能打的AI产品’,称其为‘币圈最强落地AI’。

该帖文附带标签#币安盲盒及链接

其他用户在评论中提及:@yijiangren表示自己也通过即梦申领成功;@xinrui0214称‘我就喜欢amazing’;@0xshimei询问‘细说好在哪里’;@dajingou1回应‘哈哈 有时间可以试试’。

在 X 看原帖 ↗

开发者用Claude Opus 4.8优化币安永续合约交易系统

AI金融工程自动化交易
2.1万178

昨天我分享了用 @ZenMuxAI 接入 Claude Opus 4.8(Bedrock)帮我优化币安永续合约自动交易系统的事。

实际跑下来感觉挺靠谱的,尤其是风控和单腿失败处理那块,确实帮我把几个容易踩的坑提前看到了。

谢谢大家这段时间的留言和鼓励!

体验链接—— Gemini 3.5 Flash:

Claude Opus 4.8:

多位用户在评论中提及ZenMuxAI:@Lucynneka5、@cheuk_baby、@Trueidbvlgari、@kane_tdt、@voidJan、@qiuge518、@taofen_boy、@pjjin574832、@zyailive、@CandyJJJJJ。

在 X 看原帖 ↗

一套三步PPT设计流程:资料检索→内容加工→自动成稿

AI工具链办公自动化
3.8K206663

最近跑通了一套PPT设计流程:出片稳、效率高。

1. 用 GPT 5.5 Pro + Grok 搜资料打底;再用大模型追问,把答案融进自己的理解和观点。

2. 交给 Codex / CC 二次加工:提炼方法论、补上金句,整理成一篇经验贴,直接输出 Markdown。

3. 将 Markdown 上传到 Youmind,配合自写的 PPT 提示词:先生成大纲,再一键生成 20 页高清页面 + 3

在 X 看原帖 ↗

小红书账号2.2万赞却仅1000粉,用户用扣子3.0组建AI内容团队诊断问题

AI小红书内容运营
1.6万20121121

用户接入本地Claude Code与Codex至扣子3.0,配置‘选题挖掘师’和‘内容执行官’双Agent,发现账号为‘孤峰型’——单条爆款占3227赞、其余内容均低于100赞,且二手转述超50%、简介承诺未兑现。

阅读全文 →

美销售经理被裁后用Claude+Google+eBay月入1.08万美元

AI电商副业
3.1万27106137

美国内华达州一名32岁的前销售经理被裁员后,向AI助手Claude咨询在家赚钱的方法。Claude为其提供了建议。此后,该人士 reportedly 通过组合使用Claude、Google Omni和eBay,实现单月收入10,765美元(约合人民币7.3万元)。

原文称其方法“不复杂”,并强调核心工具为三者:Claude、Google Omni和eBay。原文未说明Claude的具体版本、提示词内容、操作步骤、启动资金、时间投入、失败率或持续性。

原文未提供收入来源的构成说明(如是否含运费、平台佣金、退货损耗),也未说明该金额是否为税前毛收入。链接指向外部短网址,无公开可查的项目记录、交易截图或第三方验证。

文末附带Polymarket相关推广链接,包括官网入口、跟单工具推荐及交流群链接,与前述收入案例无事实关联。

在 X 看原帖 ↗

胡渊鸣用10个Claude Code构建自动化开发系统

AI工程商业
1.3万645153

Meshy AI创始人公开其真实运行的AI协作流程:从iPhone SSH调用到Git worktree并行执行,任务完成率从20%提升至95%。

阅读全文 →

提示词分级指南:从D级到SS级的AI指令精度演进

AI提示工程人机交互
4.5万21107224

该指南将提示词按有效性分为D、C、B、A、S、SS六级,逐级提升对ChatGPT、Gemini、Claude等模型的控制力与输出精度,最高级强调变现机制与行动转化。

阅读全文 →

TradingAgents:基于多智能体LLM的金融交易框架

AI开源金融
5.1K63518

如何用AI搭建自己的金融交易团队?直接复用现有开源方案是最快路径,TradingAgents 是一个基于多智能体(Multi-Agents)的大语言模型(LLM)金融交易框架,GitHub 星标数超 81,000。

该框架完整模拟真实投资银行和对冲基金的决策流程,包含多个专业化角色:基本面分析师、情绪分析师、新闻分析师、技术分析师。

框架内置牛市研究员与熊市研究员角色,二者被强制设置为相互辩论机制,以避免观点趋同或单边判断;此外,交易员、风控人员与投资组合经理共同参与最终决策审核与把关。

项目 GitHub 仓库地址为

相关演示链接为

Adel Bucetta 参与了该项目。

在 X 看原帖 ↗

Tonbi Studio演示Hermes Agent工作流中的多智能体协同

AI开源工程
2.6万5110155

想看看一群专业化智能体如何在复杂工作流中协同作业,并全部在Hermes Agent工作流中组织与可视化吗?本视频将演示这一过程,并拆解其中的看板(kanban board)设计。

该工作流已全部开源,可供用户自行尝试。

@w3rk_co_za 表示喜欢该演示。Tonbi Studio回应称,期待观察该方案随时间的演进,并会持续分享后续进展。

@aimachine404 提供了一条未被知晓的信息,Tonbi Studio表示感谢。

@mandeepsjoon 认为内容有用,Tonbi Studio对此表示认可。

在 X 看原帖 ↗

Anthropic工程师亲授Claude提示词编写工作坊

AI工程教育
7.6K1769113

Anthropic刚刚发布了一个27分钟的工作坊视频,讲解如何为Claude编写提示词。

授课者是直接参与构建Claude的Anthropic工程师。

原文指出,用户1999元购买的AI课程,其内容价值可能不及该视频中任意3分钟的信息量。

视频链接由@grok标记并提供源头地址:

在 X 看原帖 ↗

非程序员周末可搭建AI生活基础设施

AI开源工程
2.0万116185

非程序员和计算机专业人士,周末在家操作,可以正式进入AI生活。

第一项实践:租用VPS服务器并注册域名,配置V2ray协议,既供自己和家人日常上网使用,又在同台服务器上提供Hermes的AI服务。

第二项实践:使用Claude进行Vibe编程(一种低代码/自然语言驱动的开发方式),随后将生成的应用部署到前述VPS服务器,最终形成一个可在手机上运行的App,用于工作场景。

第三项实践:在闲鱼平台购入一台二手Mac Mini 4(型号为Mac Mini (Late 2014)),在其上部署OpenClaw项目,并基于该环境创建两个飞书智能体机器人——其中一个接入Claude Max订阅服务,另一个接入ChatGPT Plus服务。

在 X 看原帖 ↗

甘露寺蜜璃Cosplay提示词优化版发布

AI图像生成Cosplay
19.3万531.2K905

Chatgpt image2 x 马克笔涂鸦 x Cosplay主题(身材增强版)提示词 这个版本的提示词重点优化了人物的身材比例,以及增加了额外的涂鸦点缀元素,会更加有视觉冲击力,同时弱化了一些马克笔涂鸦的笔触,让角色的造型更加还原,并且让人物的身材能够更好得展示。 老规矩,提示词放在下方评论区⤵️

提示词: 这是甘露寺蜜璃的后期涂鸦 cosplay。 一位成年日本女性,站在自己的房间里自拍,带着俏皮自信的微笑,扮出符合cos的角色对应的优雅姿势,浅景深,整体像用智能手机随手拍下的休闲自拍照片。

@grok 你最喜欢哪个涂鸦cos造型

@J0HN_Q 😆有品味的机器人先生

@JamshedPanj 真的很有化学反应

@russh77 漫画身材

@dawnmadams 增强版,更给力!

@0xfafa88888888 是的

@noble1799 目前gpt审核卡得越来越严了

在 X 看原帖 ↗

Codex 与 Remotion 组合实现提示词驱动动画视频制作

AI工程教程
1.9万51197270

Codex 与 Remotion 的组合被描述为‘真正的王炸组合’。原文明确指出,应减少对 Codex 与 HyperFrame 组合的关注,转而采用 Codex 与 Remotion 的搭配。

该教程视频涵盖完整工作流:项目搭建、Hello World 测试、素材导入、复杂动画实现、多场景故事流构建、自动配音与渲染。

此外,教程还包含品牌资产复用和高效迭代技巧。

原文附带链接 @DayuBuilds 的评论:‘效率确实提升很多’。

原文未说明具体提升幅度、未对比其他工具性能、未提及技术原理、未定义‘王炸’或‘提示词’的具体形式,也未提供任何数据、案例、公司背景或开发团队信息。

在 X 看原帖 ↗

MCP 是模型上下文协议,开源标准助 AI 安全接入外部系统

AI开源安全
9.1K64250220

MCP 代表 Model Context Protocol(模型上下文协议)。它是一个开源标准,旨在帮助 AI 模型安全地连接外部工具、数据源和软件系统。

大多数使用 MCP 的工程师无法解释网络层面实际发生的数据交互。他们只是克隆了代码仓库,并运行了某个链接指向的示例程序。

原文未提供该示例程序的具体功能、技术细节、发布机构、维护者、版本信息或任何实测数据。

在 X 看原帖 ↗

OpenAI GPT-5.5、GPT-5.4 和 Codex 登陆 Amazon Bedrock

AI云服务开发工具
3.2万2010245

OpenAI 的 GPT-5.5、GPT-5.4 和 Codex 现已可在 Amazon Bedrock 上使用。这些模型的定价与 OpenAI 官方 API 完全相同。

这些模型在 Amazon Bedrock 上的使用不会被用于 OpenAI 的模型训练。

用户可通过 Codex App、Codex CLI 以及 VS Code 等工具调用上述模型。

此外,集成 OpenAI harness 的 Amazon Bedrock Managed Agents 和 Daybreak 也将通过 Bedrock 平台发布。

AWS 官方发布了该消息。相关服务现已开放使用。

在 X 看原帖 ↗

Hermes Agent:自动化工作流与收入增长的本地AI代理工具

AI自动化开源工具
5.5万517761.2K

AlexFinn推荐使用本地部署的Hermes Agent,通过Claude Opus 4.8或ChatGPT 5.5模型、Telegram消息集成、反向提示等步骤,实现任务自动化、晨间简报、夜间应用原型生成及LoRA定制内容创作。

阅读全文 →

开发者为AI代理构建自改进大脑:Hermes接入Obsidian知识库

AI开源工程
3.5万37232432

我为我的AI代理构建了一个自改进的大脑。Hermes运行在一台VPS上,并通过Filesystem MCP协议接入我的Obsidian笔记库。每一次推理步骤都从该笔记库中读取信息,每一次输出结果都自动写回并保存为一条新笔记。

如果你想采用VPS方案,又不希望Hermes访问你的本地文件,可使用Open Router服务,在任意你选择的模型提供商上启动Hermes实例。

@MaksimXBT 请编写更优的评估方法。

在 X 看原帖 ↗

2026年底前个人电脑将普遍运行AI代理团队

AI硬件开源
2.2万29161194

到2026年底,每个人都会在自己的个人电脑上运行一组AI代理。

NVIDIA RTX Spark配备128GB统一内存,专为始终在线、可在本地7×24小时持续运行的AI代理而设计。

该硬件对Hermes和OpenClaw Agent项目意义重大。

原文附有一份分步指南,介绍如何在本地运行编程类AI代理,链接为:

@Gargi__Gupta 回应称‘不客气’。

在 X 看原帖 ↗

NVIDIA教程:一次教学,永久记忆——部署Hermes智能体连接多平台

AI工程开源
8.6K21135114

教一个智能体完成一项工作流只需一次。每次重建后它仍能记住该流程。

本教程展示了如何部署@nousresearch Hermes Agent,使用NVIDIA NeMoClaw和OpenShell作为基础框架。

部署后的Agent可连接至Slack、Outlook、GitHub和NVIDIA开发者论坛四个平台。

教程还说明如何将用户在聊天中对Agent输出的修正操作,自动转化为可重复调用的工作流链接:

@NousResearch发布的完整技术博客见:

在 X 看原帖 ↗

AirLLM实现4GB显存运行700亿参数大模型

AI开源工程
1.9万48330420

用户现在可在仅配备4GB显存的GPU上运行参数量达700亿(70B)的大型语言模型(LLM)。

AirLLM采用“逐层推理(layer-wise inference)”方法。与传统方式需一次性加载整个模型不同,它每次仅加载一个模型层,完成计算后立即释放该层内存。

该项目100%开源,代码和工具已公开发布。

在 X 看原帖 ↗

AI应用需多模型协同而非单点依赖

AI工程研究
3.4万1413386

你不能指望一个模型在什么地方都是最强的,要像渣男一样才能用好 AI:去爱很多模型,去发掘他们的优秀点,东食西宿,组合着用 Opus 4.8 在写作不太行,但是在 UI 设计,UI 实现比 GPT-5.5 要好很多,推荐你多用用 Claude Design,然后把 Claude Design 设计好的结果分别给 GPT-5.5 和 Opus 4.8

@yyneo01 等我忙完手头事,会写一点教程

@Wing8Aqua 我不怎么用它写作

在 X 看原帖 ↗

IBM发布开源企业级AI代理框架

AI开源企业
1.4万22131138

大家都在构建简单的智能体,而 IBM 却已在生产环境中部署了稳健的企业级智能体,并且完全开源。 他们刚刚在 Hugging Face(HF)上发布了一篇博客,详细拆解了如何超越大语言模型(LLM)与基础智能体:涵盖结构化推理、工具调用等能力,以实现 AI 在企业范围内的规模化落地。

在 X 看原帖 ↗

Cosmos 3发布:面向具身智能的全模态世界模型

AI具身智能世界模型
102.7万139876399

这就是物理人工智能(Physical AI)的高光时刻!我们正式发布 Cosmos 3:面向物理人工智能的全模态世界模型 🚀
— Cosmos 3 是一个全模态世界模型:在统一架构内,它可理解并生成语言、图像、视频、音频及动作。
— 它并非

我本周将出席 CVPR。期待与各位就物理人工智能和世界模型展开交流!

@wenbo_ji_0420 完全赞同所有观点。我们的评估显然不是终点,而只是一个起点。针对所有这些指标,人类评估 + 更优的视觉语言模型(VLM)必然不可或缺。此外,我们还需要一个评估基准(eval benchmark);)

@yanhua1010 我认为论文中所用的基准全部都非常相关!

@Im_mvish7 🍳

在 X 看原帖 ↗

HTML Artifact成为AI代理工作流核心输出形式

AI工程研究
3.6万51359459

开发者实践表明,HTML格式的可交互、可搜索工件正成为长周期AI代理任务的关键洞察载体。

阅读全文 →
🚀 新品发布

AI每天自动推股票决策仪表盘

AI投资工具开源项目
2.2万60275242

想要玩美股的兄弟强烈建议去安装一下,github高达4w收藏。基于 AI 大模型的 A股/港股/美股自选股智能分析系统,每日自动分析并推送决策仪表盘 📊 分析市场走势 📰 整理重要资讯 📈 跟踪个股表现 🤖 自动生成投资分析报告

在 X 看原帖 ↗

开源机器人世界模型,50亿参数能看懂动作和画面

机器人世界模型
9.1K2212288

首个开源的、面向可扩展机器人操控的统一世界模型:
50 亿参数开源统一视频-动作世界模型 τ0-WM,融合策略学习与世界建模能力,可基于观测、语言和状态生成机器人动作、预测未来视觉画面,并评估任务进展。

该模型在 27.3K 小时异构数据上训练完成(含 17.8K 小时真实机器人遥操作数据、6.5K 小时 UMI 演示数据、3K 小时以第一人称视角拍摄的人类视频),使其能够执行水龙头连接、袋子装填、工具箱收纳等复杂操控任务,如演示视频所示。

该方法支持测试时动作精调,并通过车队数据实现以部署为导向的持续改进。

感谢 Jianlan Luo(@jianlanluo)分享!

📌 τ0-WM 资源链接:
• 项目主页:
• GitHub(代码):
• Hugging Face(模型权重):
• 论文(PDF):

——- 每周机器人与 AI 洞见。免费订阅:

在 X 看原帖 ↗

微软开源文档转Markdown工具,PDF和PPT再也不乱码

文档处理开源工具
1.7万28177228

🚨 文档地狱终结者 MarkItDown,一键把所有文件秒变 LLM 完美 Markdown!

Microsoft 直接开源 MarkItDown,138k+ Star 霸榜 Trending, 从此告别 PDF 乱码、Word 表格炸裂、PPT 结构全丢的痛苦—任何文件扔进去,直接输出干净、可直接喂大模型的 Markdown,AI 时代文档处理终于彻底解放!

核心亮点一览:
- 超强文件支持:PDF、Word、Excel、PowerPoint、图片(带 OCR)、音频(转文字)、YouTube 视频、EPUB、HTML、CSV、JSON、XML、ZIP 包……
- 结构极致保留:标题层级、表格、列表、链接、代码块、图片描述全部完美保留,LLM 读取体验直接拉满
- 极简操作:支持命令行一键转换,也支持 Python 简单调用
- 插件化可扩展,支持自定义转换器

无论是搭建 RAG 知识库、批量喂 Agent 学习材料,还是日常处理竞品分析、PRD、财报、技术文档,这工具都能把效率直接拉高几个数量级。

在 X 看原帖 ↗

你的电脑现在能自己分派AI任务了

AI隐私保护
16.2万1141.3K423

今天,我们宣布混合式智能体推理即将登陆 Perplexity Computer。
Computer 可在您设备上运行的本地模型与云端前沿模型之间分配任务。

此举可将您的私有数据保留在本地设备上,同时最大化 token 利用效率。
即将上线。

在 X 看原帖 ↗
📰 行业动态

AI写剧本、配音、剪辑——整部剧不用真人

AI内容生成流媒体
2.3万1713826

印度亿万富翁穆克什·安巴尼(Mukesh Ambani)旗下的流媒体平台 JioStar 正在筹划一系列剧集,这些剧集将完全由人工智能负责编剧、动画制作、配音和剪辑。

该公司还计划为此招聘 80 名人工智能专家与工程师。

在 X 看原帖 ↗

AI写稿打电话前,先得过合规这关

AI合规企业AI
381.5万3722566

ZeroDrift 筹集了一轮超额认购的 1000 万美元种子轮融资,用于在 AI 通信中强制执行合规性,距离其结束隐身模式上线仅过去 3 个月。

AI 智能体正成为下一代企业通信层,而每家受监管的公司都必须在 AI 代表其撰写、发言、拨打电话或发布内容之前,强制落实合规要求。

TechCrunch 独家报道:

在 X 看原帖 ↗

Claude Code + NotebookLM + Obsidian 这套组合,让一次研究结束就沉淀出整套知识资产

AI工具链
2.3万47170198

Claude Code + NotebookLM + Obsidian 这套组合,厉害就厉害在分工清楚:Claude Code 负责执行,NotebookLM 负责消化资料,Obsidian 负责长期记忆。一次研究结束后,不只是拿到一篇报告,还把来源、分析、结论、思路都沉淀进自己的知识库。我觉得这会成为个人 AI 工作流的一个关键方向:未来强的不是单点工具,而是能不能搭出自己的“研究流水线”。

越用越懂你,越积累越省力,越沉淀越像一个专属研究团队。

在 X 看原帖 ↗

GitHub Copilot 开始按量收费,开发者扬言要走

GitHub Copilot开发者工具

愤怒的开发者誓言将逃离 GitHub Copilot,因为按用量计费模式已开始实施

在 HN 看讨论 ↗   原文 / 论文 ↗

Claude Code现在能自己搭开发环境了,连插件都帮你装好

AITOOL
5.6万34236364

Claude Code 刚刚迎来一次大规模升级。其实有一个官方隐藏插件,可以扫描你的项目,自动推荐 MCP、子代理、技能、Hook 和自动化。运行一次就能在 Claude Code 集成一套完整的开发环境。

/plugin install claude-code-setup@claude-plugins-official

在 X 看原帖 ↗

开源逆向工具终于不瞎指挥了,AI做渗透测试开始有章法

AITOOLSECURITY
2.1万33633

AI 做逆向/渗透/安全任务终于他妈的不瞎搞了!

以前让 Claude Code / Cursor / Cline 帮你逆向 APK、分析二进制、做渗透测试有多崩溃? AI 经常胡乱下命令、环境没装工具、步骤跳来跳去、做了半天发现走错路线……

每次都要手动喂一堆上下文,搞完还学不到经验,下次继续翻车。

现在好了,zhaoxuya520 直接开源了 reverse-skill; 一个专为逆向/渗透/安全任务设计的 AI 自动路由 + 自举 + 进化技能包!

这已经不是普通的工具箱了,而是给 AI 装上一个专业的逆向/安全大脑 + 自动成长系统。

以后做 APK 脱壳、Frida hook、内存分析、漏洞挖掘、CTF 自动化,AI 终于能像老手一样有章法地干活,而不是瞎碰运气。

目前 850+ stars,专攻安全方向的 AI Agent 玩家已经在狂用了。

冲就完事儿了!

在 X 看原帖 ↗

有人靠批量注册AI账号在闲鱼卖号,月入五位数

AILAUNCHCOMMERCIAL
6.8万86508821

aBaiAutoplus 这个开源项目能自动注册 ChatGPT、Cursor、Grok 等 10+ 平台账号,还支持自动付款订阅 Plus 服务;有人用它一天注册 100 个号,在闲鱼按 200–300 元一个出售。

阅读全文 →

Krea 2 成了独立研究实验室最强图像模型,马上开源

AIRESEARCHOPEN_SOURCE
6.3万38528127

Krea 2 现已成为 @ArtificialAnlys 排名第 1 的图像模型——来自一家独立研究实验室,全球文本生成图像排行榜上位列第 6。

我们将很快开源 Krea 2。
我们希望与社区共同构建,使其成为最优秀的开源图像模型。

在 X 看原帖 ↗

微软联手推出的‘思考模型’MAI-Thinking-1,主打干净数据训练

AILAUNCHCOMMERCIAL
1.5万1119550

今天,我们联合微软宣布推出 MAI-Thinking-1,该模型即将在 Baseten 上线。

微软在此打造了一款真正不同的产品:一款商用级推理模型,其训练数据干净纯粹,未经过任何第三方模型的蒸馏,并专为使用它的企业进行微调而设计。

微软 AI 承诺对后训练数据实现 100% 人工不介入(eyes-off),而 Baseten 将负责大规模的微调与部署。

未来不属于单一模型。
它属于众多模型——每个模型均由塑造它的企业所拥有。
MAI-Thinking-1 正是迈向这一方向的重要一步。

在 X 看原帖 ↗

Abacus AI 超级计算机能用一句话启动云服务、本地大模型和常驻智能体

AILAUNCHINFRA
65.6万1528639

🚨 发布 Abacus AI 超级计算机——仅用一条提示词即可构建任意云服务:
构建或托管任意云应用、API 或服务

启动本地大语言模型(LLM)

始终在线的智能体,包括 Hermes/Claw

使用云存储与数据库

支持 Claude 或 Codex

可扩展至数十亿个 AI 智能体

只需与这台超级计算机对话,即可构建、托管或运行任何东西!!

在 X 看原帖 ↗

有人还在问AI对齐是什么,连研究员都说不清定义

AIOPINIONSAFETY
1.7万629113

我至今仍不明白“AI 对齐”(AI alignment)到底是什么意思,而且我也并不相信那些拿钱专门研究它的人自己就真懂。

在 X 看原帖 ↗

大模型根本不是说好的黑箱

LLM可解释性

LLMs are not the black box you were promised

社区讨论:多人指出LLM存在人类可解释的神经元激活模式(如Dallas→Texas→Austin的语义链),支持其具备伪符号推理能力;@camelmel强调可解释性研究早于Anthropic,核心工作来自OpenAI/学术界,批评其博客常简化归因。@viccis反对将模型拟生物化,援引Dijkstra警示术语滥用;@tom_则质疑“黑箱”本就是误传,连原文是否由LLM生成都存疑。

在 HN 看讨论 ↗   原文 / 论文 ↗

AI代理居然缺个RSS式的信息收件箱

AI agentsRSS

Now AI agents need what RSS does

社区讨论:多人肯定RSS在信息过滤中的不可替代性,如@phyzix5761称其为“主要信息获取方式,避开广告”,@hparadiz强调自己从未弃用并提供JSON化改造方案。但争议集中于技术缺陷:@erelong指出RSS常限制回溯抓取深度,@PaulHoule引用Rachelbythebay指出主流阅读器普遍未正确实现协议,根源在轮询机制;@rvz则提醒Reddit正因滥用抓取而计划下线RSS支持。

在 HN 看讨论 ↗   原文 / 论文 ↗

AI安全系统现在连拆成碎片的攻击都看不见

AIsecurityresearch
3.0万7814674

研究人员把一个AI网络攻击拆成多个看似无害的对话片段,每个片段单独看都通过了当前所有安全审查。银行风控员正在用这类工具筛查客服对话,但它的检测逻辑只处理单轮会话。

阅读全文 →

微软今天一口气推出7个新AI模型,第一个专攻数学和编程

AIlaunchcoding
1.7万2022646

微软今日宣布推出 MAI-Thinking-1,这是其首款高级推理 AI 模型。该模型主要面向数学和编程任务,是微软今日发布的 7 款新 AI 模型之一。详情如下 👇

在 X 看原帖 ↗

Marvell芯片吃的是AI工厂扩张后的‘连接层’生意

AIhardwareinfrastructure
9.8K20513

$MRVL 是AI数据中心进入规模化之后,所有算力都需要被连接、调度和定制化。英伟达解决的是算力生产,Marvell解决的是算力之间怎么高速流动。模型越大,Agent越多,推理越重,数据中心就越需要网络芯片、光互联和定制ASIC。

Marvell吃的就是AI工厂扩张后的连接层抽水 模型需求爆发,GPU需求上升 HBM、光模块、网络、存储、能源开始紧缺 材料、设备、封装、光源继续被重估 Marvell是AI产业链里比较正统的咽喉型公司,市场已经开始给它很高预期。适合用产业链主线跟踪,重点看后面定制芯片收入、数据中心收入增速、光互联订单和大客户项目兑现 AI硬件现在已经是高预期赛道,是买未来几年AI数据中心扩张能否继续兑现

在 X 看原帖 ↗

19岁没学历没资源的年轻人,正用AI做出碾压大公司的东西

AIopiniondemocratization
2.9万68862111

此刻,在某个你最意想不到的地方,一名19岁的年轻人——没有资金、没有学位、也没有人脉——正利用AI构建某样东西,其表现将超越《财富》500强公司最顶尖的努力成果。

在 X 看原帖 ↗

PFN和丰田联合推进的MN-Core芯片,把内存直接堆在逻辑芯片上

AIhardwareresearch
4.1万166621

PFN 的 MN-Core L 系列通过在逻辑芯片上堆叠 DRAM,实现超高的内存带宽,从而支持高速 AI 推理。

我们将与丰田前沿研究中心(Toyota’s Frontier Research Center)开展联合研究,共同推进机器人领域的推理加速工作——在该领域中,实时响应能力至关重要。

在 X 看原帖 ↗

有人在用AI写剧集,而且几乎全程参与前期制作

AImediaopinion
2.2万4532844

你们别忘了,这一系列在几乎全部的前期制作阶段都使用了 AI。

在 X 看原帖 ↗

通义千问新模型能看图说话了

多模态Qwen

Qwen3.7-Plus: Multimodal Agent Intelligence

在 HN 看讨论 ↗   原文 / 论文 ↗

DeepSeek-V4-Flash跑上了AMD新显卡

AI硬件适配

Bringing Up DeepSeek-V4-Flash on AMD MI300X

在 HN 看讨论 ↗   原文 / 论文 ↗

给图片建索引,RAG也能看图了

RAG图像索引

How we index images for RAG

在 HN 看讨论 ↗   原文 / 论文 ↗

从零搭AI代理,工具链全公开

AI Agent工具链

Build a Basic AI Agent from Scratch: Tools

在 HN 看讨论 ↗   原文 / 论文 ↗

GitHub Copilot 出了独立App

GitHubCopilot

GitHub Copilot App

社区讨论:多人质疑独立App的长期价值,@2001zhaozhao认为桌面端会彻底排除远程开发可能性,因编码代理需长时间运行;@grim_io直接对比VS Code内置Agents应用,称其“功能更少”;@dominotw困惑Copilot早期领先优势为何消失;@sccxy则聚焦定价变更后的用量限制,指出轻度使用已耗尽26%月配额;@_pdp_提醒专业开发者多项目并行虽受益于本地工具,但同设备集中运算可能加剧供应链安全风险。

在 HN 看讨论 ↗   原文 / 论文 ↗
🛠 工具产品

Agent里画图不用开Codex网页了

AI AgentCLI工具
1.9万23190224

baoyu-image-gen Skill 支持 Codex-cli 作为 Provider 画图。
也就是说,你可以在 Claude Code、hermes agent 之类的 Agent 里面用它调用 Codex 出图,而不需要直接使用 Codex。

当然,前提是已安装 codex cli 并且拥有有效订阅。

感谢网友的 PRs:
Skill 地址:

在 X 看原帖 ↗

Agent 不再靠 Prompt 猜着干活

AI AgentHarness Engineering
4.1万1657391.0K

这个开源指南把 AI Agent 的运行时框架拆解成可验证、可授权、可记录的固定流程,让写代码的 AI 从偶尔能用变成每次都能走完闭环。

阅读全文 →

免费开源AI工具,能自动盯盘写广告改邮件

开源工具AI工作流
4.9K2369108

有人用开源项目搭出能自动分析加密行情、审计广告账户、读邮件写草稿的AI工作流——这些事以前得雇人或买SaaS。

阅读全文 →
📌 其他

LLM看懂代码,靠的不是变量名

LLM编程语言
2.1万26246119

今までのプログラミング言語はエラーメッセージを人間向けに設計してきたが、LLM向けにはより多くの構造化した情報を返した方が精度が高くなるという話 また、変数名や関数名を難読化してもほとんどのものを復元できたので、名前/型/構造で理解しているのを示唆している

在 X 看原帖 ↗

有人用数字给AI模型标了「工种」

AI模型开发者工具
1.5万924580

适用场景最佳模型: 聊天 — Flash 3.5 设计 — Opus 4.8 编程 — GPT 5.5 xHigh 视频 — SeeDance 2.0 开源 — Kimi 2.6 OCR — Flash 3.1 图像 — GPT Image 2.0 并行智能体 — Deepseek flash

在 X 看原帖 ↗

HTML Artifact成为AI代理工作流核心输出形式

AI工程研究
3.6万51359459

开发者实践表明,HTML格式的可交互、可搜索工件正成为长周期AI代理任务的关键洞察载体。

阅读全文 →

Cosmos 3发布:面向具身智能的全模态世界模型

AI具身智能世界模型
102.7万139876399

这就是物理人工智能(Physical AI)的高光时刻!我们正式发布 Cosmos 3:面向物理人工智能的全模态世界模型 🚀
— Cosmos 3 是一个全模态世界模型:在统一架构内,它可理解并生成语言、图像、视频、音频及动作。
— 它并非

我本周将出席 CVPR。期待与各位就物理人工智能和世界模型展开交流!

@wenbo_ji_0420 完全赞同所有观点。我们的评估显然不是终点,而只是一个起点。针对所有这些指标,人类评估 + 更优的视觉语言模型(VLM)必然不可或缺。此外,我们还需要一个评估基准(eval benchmark);)

@yanhua1010 我认为论文中所用的基准全部都非常相关!

@Im_mvish7 🍳

在 X 看原帖 ↗

IBM发布开源企业级AI代理框架

AI开源企业
1.4万22131138

大家都在构建简单的智能体,而 IBM 却已在生产环境中部署了稳健的企业级智能体,并且完全开源。 他们刚刚在 Hugging Face(HF)上发布了一篇博客,详细拆解了如何超越大语言模型(LLM)与基础智能体:涵盖结构化推理、工具调用等能力,以实现 AI 在企业范围内的规模化落地。

在 X 看原帖 ↗

AI应用需多模型协同而非单点依赖

AI工程研究
3.4万1413386

你不能指望一个模型在什么地方都是最强的,要像渣男一样才能用好 AI:去爱很多模型,去发掘他们的优秀点,东食西宿,组合着用 Opus 4.8 在写作不太行,但是在 UI 设计,UI 实现比 GPT-5.5 要好很多,推荐你多用用 Claude Design,然后把 Claude Design 设计好的结果分别给 GPT-5.5 和 Opus 4.8

@yyneo01 等我忙完手头事,会写一点教程

@Wing8Aqua 我不怎么用它写作

在 X 看原帖 ↗

AirLLM实现4GB显存运行700亿参数大模型

AI开源工程
1.9万48330420

用户现在可在仅配备4GB显存的GPU上运行参数量达700亿(70B)的大型语言模型(LLM)。

AirLLM采用“逐层推理(layer-wise inference)”方法。与传统方式需一次性加载整个模型不同,它每次仅加载一个模型层,完成计算后立即释放该层内存。

该项目100%开源,代码和工具已公开发布。

在 X 看原帖 ↗

NVIDIA教程:一次教学,永久记忆——部署Hermes智能体连接多平台

AI工程开源
8.6K21135114

教一个智能体完成一项工作流只需一次。每次重建后它仍能记住该流程。

本教程展示了如何部署@nousresearch Hermes Agent,使用NVIDIA NeMoClaw和OpenShell作为基础框架。

部署后的Agent可连接至Slack、Outlook、GitHub和NVIDIA开发者论坛四个平台。

教程还说明如何将用户在聊天中对Agent输出的修正操作,自动转化为可重复调用的工作流链接:

@NousResearch发布的完整技术博客见:

在 X 看原帖 ↗

2026年底前个人电脑将普遍运行AI代理团队

AI硬件开源
2.2万29161194

到2026年底,每个人都会在自己的个人电脑上运行一组AI代理。

NVIDIA RTX Spark配备128GB统一内存,专为始终在线、可在本地7×24小时持续运行的AI代理而设计。

该硬件对Hermes和OpenClaw Agent项目意义重大。

原文附有一份分步指南,介绍如何在本地运行编程类AI代理,链接为:

@Gargi__Gupta 回应称‘不客气’。

在 X 看原帖 ↗

开发者为AI代理构建自改进大脑:Hermes接入Obsidian知识库

AI开源工程
3.5万37232432

我为我的AI代理构建了一个自改进的大脑。Hermes运行在一台VPS上,并通过Filesystem MCP协议接入我的Obsidian笔记库。每一次推理步骤都从该笔记库中读取信息,每一次输出结果都自动写回并保存为一条新笔记。

如果你想采用VPS方案,又不希望Hermes访问你的本地文件,可使用Open Router服务,在任意你选择的模型提供商上启动Hermes实例。

@MaksimXBT 请编写更优的评估方法。

在 X 看原帖 ↗

Hermes Agent:自动化工作流与收入增长的本地AI代理工具

AI自动化开源工具
5.5万517761.2K

AlexFinn推荐使用本地部署的Hermes Agent,通过Claude Opus 4.8或ChatGPT 5.5模型、Telegram消息集成、反向提示等步骤,实现任务自动化、晨间简报、夜间应用原型生成及LoRA定制内容创作。

阅读全文 →

OpenAI GPT-5.5、GPT-5.4 和 Codex 登陆 Amazon Bedrock

AI云服务开发工具
3.2万2010245

OpenAI 的 GPT-5.5、GPT-5.4 和 Codex 现已可在 Amazon Bedrock 上使用。这些模型的定价与 OpenAI 官方 API 完全相同。

这些模型在 Amazon Bedrock 上的使用不会被用于 OpenAI 的模型训练。

用户可通过 Codex App、Codex CLI 以及 VS Code 等工具调用上述模型。

此外,集成 OpenAI harness 的 Amazon Bedrock Managed Agents 和 Daybreak 也将通过 Bedrock 平台发布。

AWS 官方发布了该消息。相关服务现已开放使用。

在 X 看原帖 ↗

MCP 是模型上下文协议,开源标准助 AI 安全接入外部系统

AI开源安全
9.1K64250220

MCP 代表 Model Context Protocol(模型上下文协议)。它是一个开源标准,旨在帮助 AI 模型安全地连接外部工具、数据源和软件系统。

大多数使用 MCP 的工程师无法解释网络层面实际发生的数据交互。他们只是克隆了代码仓库,并运行了某个链接指向的示例程序。

原文未提供该示例程序的具体功能、技术细节、发布机构、维护者、版本信息或任何实测数据。

在 X 看原帖 ↗

Codex 与 Remotion 组合实现提示词驱动动画视频制作

AI工程教程
1.9万51197270

Codex 与 Remotion 的组合被描述为‘真正的王炸组合’。原文明确指出,应减少对 Codex 与 HyperFrame 组合的关注,转而采用 Codex 与 Remotion 的搭配。

该教程视频涵盖完整工作流:项目搭建、Hello World 测试、素材导入、复杂动画实现、多场景故事流构建、自动配音与渲染。

此外,教程还包含品牌资产复用和高效迭代技巧。

原文附带链接 @DayuBuilds 的评论:‘效率确实提升很多’。

原文未说明具体提升幅度、未对比其他工具性能、未提及技术原理、未定义‘王炸’或‘提示词’的具体形式,也未提供任何数据、案例、公司背景或开发团队信息。

在 X 看原帖 ↗

甘露寺蜜璃Cosplay提示词优化版发布

AI图像生成Cosplay
19.3万531.2K905

Chatgpt image2 x 马克笔涂鸦 x Cosplay主题(身材增强版)提示词 这个版本的提示词重点优化了人物的身材比例,以及增加了额外的涂鸦点缀元素,会更加有视觉冲击力,同时弱化了一些马克笔涂鸦的笔触,让角色的造型更加还原,并且让人物的身材能够更好得展示。 老规矩,提示词放在下方评论区⤵️

提示词: 这是甘露寺蜜璃的后期涂鸦 cosplay。 一位成年日本女性,站在自己的房间里自拍,带着俏皮自信的微笑,扮出符合cos的角色对应的优雅姿势,浅景深,整体像用智能手机随手拍下的休闲自拍照片。

@grok 你最喜欢哪个涂鸦cos造型

@J0HN_Q 😆有品味的机器人先生

@JamshedPanj 真的很有化学反应

@russh77 漫画身材

@dawnmadams 增强版,更给力!

@0xfafa88888888 是的

@noble1799 目前gpt审核卡得越来越严了

在 X 看原帖 ↗

非程序员周末可搭建AI生活基础设施

AI开源工程
2.0万116185

非程序员和计算机专业人士,周末在家操作,可以正式进入AI生活。

第一项实践:租用VPS服务器并注册域名,配置V2ray协议,既供自己和家人日常上网使用,又在同台服务器上提供Hermes的AI服务。

第二项实践:使用Claude进行Vibe编程(一种低代码/自然语言驱动的开发方式),随后将生成的应用部署到前述VPS服务器,最终形成一个可在手机上运行的App,用于工作场景。

第三项实践:在闲鱼平台购入一台二手Mac Mini 4(型号为Mac Mini (Late 2014)),在其上部署OpenClaw项目,并基于该环境创建两个飞书智能体机器人——其中一个接入Claude Max订阅服务,另一个接入ChatGPT Plus服务。

在 X 看原帖 ↗

Anthropic工程师亲授Claude提示词编写工作坊

AI工程教育
7.6K1769113

Anthropic刚刚发布了一个27分钟的工作坊视频,讲解如何为Claude编写提示词。

授课者是直接参与构建Claude的Anthropic工程师。

原文指出,用户1999元购买的AI课程,其内容价值可能不及该视频中任意3分钟的信息量。

视频链接由@grok标记并提供源头地址:

在 X 看原帖 ↗

Tonbi Studio演示Hermes Agent工作流中的多智能体协同

AI开源工程
2.6万5110155

想看看一群专业化智能体如何在复杂工作流中协同作业,并全部在Hermes Agent工作流中组织与可视化吗?本视频将演示这一过程,并拆解其中的看板(kanban board)设计。

该工作流已全部开源,可供用户自行尝试。

@w3rk_co_za 表示喜欢该演示。Tonbi Studio回应称,期待观察该方案随时间的演进,并会持续分享后续进展。

@aimachine404 提供了一条未被知晓的信息,Tonbi Studio表示感谢。

@mandeepsjoon 认为内容有用,Tonbi Studio对此表示认可。

在 X 看原帖 ↗

TradingAgents:基于多智能体LLM的金融交易框架

AI开源金融
5.1K63518

如何用AI搭建自己的金融交易团队?直接复用现有开源方案是最快路径,TradingAgents 是一个基于多智能体(Multi-Agents)的大语言模型(LLM)金融交易框架,GitHub 星标数超 81,000。

该框架完整模拟真实投资银行和对冲基金的决策流程,包含多个专业化角色:基本面分析师、情绪分析师、新闻分析师、技术分析师。

框架内置牛市研究员与熊市研究员角色,二者被强制设置为相互辩论机制,以避免观点趋同或单边判断;此外,交易员、风控人员与投资组合经理共同参与最终决策审核与把关。

项目 GitHub 仓库地址为

相关演示链接为

Adel Bucetta 参与了该项目。

在 X 看原帖 ↗

提示词分级指南:从D级到SS级的AI指令精度演进

AI提示工程人机交互
4.5万21107224

该指南将提示词按有效性分为D、C、B、A、S、SS六级,逐级提升对ChatGPT、Gemini、Claude等模型的控制力与输出精度,最高级强调变现机制与行动转化。

阅读全文 →

胡渊鸣用10个Claude Code构建自动化开发系统

AI工程商业
1.3万645153

Meshy AI创始人公开其真实运行的AI协作流程:从iPhone SSH调用到Git worktree并行执行,任务完成率从20%提升至95%。

阅读全文 →

美销售经理被裁后用Claude+Google+eBay月入1.08万美元

AI电商副业
3.1万27106137

美国内华达州一名32岁的前销售经理被裁员后,向AI助手Claude咨询在家赚钱的方法。Claude为其提供了建议。此后,该人士 reportedly 通过组合使用Claude、Google Omni和eBay,实现单月收入10,765美元(约合人民币7.3万元)。

原文称其方法“不复杂”,并强调核心工具为三者:Claude、Google Omni和eBay。原文未说明Claude的具体版本、提示词内容、操作步骤、启动资金、时间投入、失败率或持续性。

原文未提供收入来源的构成说明(如是否含运费、平台佣金、退货损耗),也未说明该金额是否为税前毛收入。链接指向外部短网址,无公开可查的项目记录、交易截图或第三方验证。

文末附带Polymarket相关推广链接,包括官网入口、跟单工具推荐及交流群链接,与前述收入案例无事实关联。

在 X 看原帖 ↗

小红书账号2.2万赞却仅1000粉,用户用扣子3.0组建AI内容团队诊断问题

AI小红书内容运营
1.6万20121121

用户接入本地Claude Code与Codex至扣子3.0,配置‘选题挖掘师’和‘内容执行官’双Agent,发现账号为‘孤峰型’——单条爆款占3227赞、其余内容均低于100赞,且二手转述超50%、简介承诺未兑现。

阅读全文 →

一套三步PPT设计流程:资料检索→内容加工→自动成稿

AI工具链办公自动化
3.8K206663

最近跑通了一套PPT设计流程:出片稳、效率高。

1. 用 GPT 5.5 Pro + Grok 搜资料打底;再用大模型追问,把答案融进自己的理解和观点。

2. 交给 Codex / CC 二次加工:提炼方法论、补上金句,整理成一篇经验贴,直接输出 Markdown。

3. 将 Markdown 上传到 Youmind,配合自写的 PPT 提示词:先生成大纲,再一键生成 20 页高清页面 + 3

在 X 看原帖 ↗

开发者用Claude Opus 4.8优化币安永续合约交易系统

AI金融工程自动化交易
2.1万178

昨天我分享了用 @ZenMuxAI 接入 Claude Opus 4.8(Bedrock)帮我优化币安永续合约自动交易系统的事。

实际跑下来感觉挺靠谱的,尤其是风控和单腿失败处理那块,确实帮我把几个容易踩的坑提前看到了。

谢谢大家这段时间的留言和鼓励!

体验链接—— Gemini 3.5 Flash:

Claude Opus 4.8:

多位用户在评论中提及ZenMuxAI:@Lucynneka5、@cheuk_baby、@Trueidbvlgari、@kane_tdt、@voidJan、@qiuge518、@taofen_boy、@pjjin574832、@zyailive、@CandyJJJJJ。

在 X 看原帖 ↗

xBubble.ai短视频生成效果获用户称赞

AIWeb3短视频
1.3K128

用户@0xMulight在𝕏平台发布帖文,称使用@dappOS_com的AI产品@xBubble_ai制作了一段AI短视频,认为其效果出色,感觉已超过即梦SD2.0。

帖文中写道:‘这完成度也太变态了,我几乎零提示词就出片’,并评价xBubble.ai是‘币圈少数真正能打的AI产品’,称其为‘币圈最强落地AI’。

该帖文附带标签#币安盲盒及链接

其他用户在评论中提及:@yijiangren表示自己也通过即梦申领成功;@xinrui0214称‘我就喜欢amazing’;@0xshimei询问‘细说好在哪里’;@dajingou1回应‘哈哈 有时间可以试试’。

在 X 看原帖 ↗

开源Agent browser-use让AI自主完成购机全流程

AI开源工程
1141

VincentLogic在𝕏平台发布演示:他让AI自主配置一台2000美元电脑,全程零人工操作。AI自动打开Best Buy网站,自行比价,绕过反爬机制,关闭弹窗,并用鼠标完成点击和加入购物车动作。

该能力由开源Agent browser-use实现。项目GitHub星标数达5万,被描述为给大语言模型装上“手”和“眼睛”。它不是预设流程的固定脚本,而是基于实时网页状态做出自主决策的智能体。

browser-use部署仅需3行代码,5分钟内即可运行成功。项目链接为

Jason Ploeckelma在评论中补充:browser-use不仅能精准操控鼠标,还能稳定处理反爬策略和干扰性弹窗,操作可靠性甚至超过人工。他调侃称,今后网购可交由AI执行,人类只需等待签收。

在 X 看原帖 ↗

Claude.md实用技巧:配置与工作流搭建指南

AI工程教程
3.0K125347

《Claude md 实用技巧整理:从配置到工作流搭建》 最近 Claude Code 和 CLAUDE.md 的讨论越来越多。 一开始,很多人只是把 Claude Code 当成 AI 编程助手,用来写代码、修 Bug、跑任务。但真正用起来之后会发现,它好不好用,不只取决于模型能力,也取决于你怎么给它规则、上下文和工作流程。 而

@btcoindown 🥰精辟

@marsnock 🥰

@ai_Kyros 笔芯❤️

@collageboys01 希望不是猪队友

在 X 看原帖 ↗

Claude Code被赞不可替代,AI编程向自主Agent演进

AI工程研究
1.3万23560

重度使用ultracode再次深深感受到Claude Code无以替代的伟大。此外,Harness发展的趋势不言自明——更少的人为干预,更多的agent自主能力,更长时间的无干预运行: Cursor的yolo模式 OpenSpec的SDD Ralph Loop Karpathy的autoresearch Claude Code的plan mode Codex的/goal Claude

@kelexiaomao 太突然了

@lolieatapple 眼力劲不错 这里没有优化确实还是有点粗糙 不过整体完成度还可以 优化一下前期提示词效果会更好

在 X 看原帖 ↗

Trust Wallet 推出 TWAK AI 钱包代理工具

AI安全Web3
3.4K9433

Trust Wallet 发布 TWAK,支持安全、自主的 AI 驱动加密交易。

阅读全文 →

ECC开源项目教程:增强Claude代码能力

AI工程开源
1.1K321

教程详解ECC——一个提升Claude上下文、稳定性与安全性的开源Agent系统

阅读全文 →

大模型工具割裂:用户身份与偏好无法跨平台迁移

AI用户体验人机交互
1.1万54

最近我被一个问题卡住了。 我天天在用 ChatGPT、Claude、Gemini、Grok ,可它们没一个是真认识我的。 前两天还在用 Claude 4.7 ,这两天 Claude 4.8 就出来了,换个工具,又得把我是谁、在干嘛、喜欢什么,从头讲一遍。 我那些习惯、偏好,还有攒了大半年的长期目标,全锁死在一个个互不串门的

@Supers6061 而且很好撸吧

@ccjing_eth 以前的 也在?

@zhuren1992 好早的了吧

@0xCryptoUni 好多人都撸过呢 大毛啊记得

在 X 看原帖 ↗

2026年AI工具链升级:ChatGPT已非唯一选择

AI工具链生产力
8.1K208399

一篇罗列13款替代/补充ChatGPT的垂直AI工具及其核心优势的实操清单。

阅读全文 →

📖 深度解读

精选文章的中文编辑重写 · 按更新时间排列

查看全部深度解读 →
▲ Top

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部