AI Pulse
📚 412 篇文章
📡 1467 条信号
🏷️ 218 个主题
📰 今日焦点

The Path:Tony Robbins 和 Calm 前员工用 AI 做心理治疗,但想跟聊天机器人划清界限

The Path 的起点是一个巧合。几个做男性心理健康应用 Mental 的人发现,用户对 AI 互动音频功能上瘾——不是上瘾于治疗,而是上瘾于聊天。他们意识到方向错了。

于是他们掉头,做了 The Path。这款 app 把治疗和教练揉在一起,底层融入了 Tony Robbins 那套自我提升方法。Tony Robbins 自己也很买账,直接挤进来当了联合创始人。

联合创始人 Anson Whitmer 是 Calm 的早期员工。他 19 岁时,一个敬爱的叔叔自杀;读大学时,一个表弟也自杀。他为此拿了心理学博士,本来打算做研究,但后来觉得“把科学成果带给大众”更重要。

阅读全文 →
✨ AI 智能助理 基于全站 529 篇深度内容综合问答
💡 试试问我: ·

🔥 信号雷达

来自 𝕏 的实时信号,经 AI 聚类分析

把Transformer模块重写成矩阵乘加尾部程序

AI系统优化

CODA:将 Transformer 模块重写为 GEMM-Epilogue 程序

在 HN 看讨论 ↗   原文 / 论文 ↗

普通人不用敲命令也能用AI Agent了,GitHub星标破2.4万

AITOOLLAUNCH
2.4万30149337

tinyhumansai/openhuman登上GitHub Trending榜首,星标超24k且日增2k-4k,主打免配置、非命令行操作,目标用户明确指向不写代码的普通人。

阅读全文 →

本地跑的AI PPT工具,几分钟生成可商用幻灯片

AITOOL
2.8K3711219

人们仍在手动耗费 5 小时制作 PowerPoint……而这款开源 AI 工具却能在几分钟内生成可直接投入使用的演示文稿。

最疯狂的是?你可以在本地运行它,使用自己的 AI 模型,自行托管,导出为 PPTX 或 PDF 格式,甚至还能通过 API 自动化生成整套幻灯片。

认识一下 Presenton 👇

在 X 看原帖 ↗

有人把AI Agent技能打包成‘一键工作流’,发给Hermes就能跑

AIEXPERIENCE
6.6K149888

可视化了 Hermes Agent 的新捆绑技能(bundled skills)功能。 将此发送给你的 agent,以测试捆绑你经常运行的工作流。

在 X 看原帖 ↗

程序员正在用本地知识图谱压缩代码理解成本

AITOOL
1.4万179995

colbymchenry/codegraph把整个代码库预索引并极致压缩token,让Claude Code、Cursor这类工具调用次数大幅减少,所有运算都在自己电脑上完成。

阅读全文 →

港大开源AI,一句话生成短片

AI视频开源工具
8.7K42160198

香港大学刚刚发布了一款免费 AI 工具,能将一行创意直接生成完整的短片。无需剪辑。100% 开源。

它叫 ViMax。

你输入一段提示词,或粘贴一篇小说,其余工作全部由它完成。

导演、编剧、制片人、视频生成器——全部集成于一个系统,仅需一个输入。

在 X 看原帖 ↗

AI 编程团队终于不用各自对着不同提示词干活了

AI 编程团队协作
3.2K144334

在 GitHub 上发现一个专门给团队用的 AI 编程管理工具:Trellis,解决多人协作时 AI 编程的核心痛点,每个开发者和 AI 工具看到的项目信息不一致。它把原本塞在 CLAUDE.md、AGENTS.md 或 .cursorrules 里的超长系统提示词,拆成结构化的 spec、task、workflow 和 journal,让 Claude Code、Cursor 等工具能读懂当前任务和历史脉络。支持同时管理多个 AI Agent、按文件或功能分派任务、自动同步项目记忆到所有工具。

GitHub: 每个 Agent 都有: - 专业特长和深度领域知识 - 独特的沟通风格和个性 - 聚焦可交付成果(代码、流程、文档等) - 生产级工作流和成功指标 支持 Claude Code、GitHub Copilot、Antigravity、Gemini CLI、OpenCode、OpenClaw、Cursor、Aider、Windsurf、Kimi Code 等工具。适合想要组建专业 AI 团队、为不同场景配置专业 Agent 的开发者和团队。

在 X 看原帖 ↗

100多张手绘图,把RLHF和DPO讲明白了

教程大模型训练
3.2K195753

大模型训练那套流程,SFT、RLHF 一堆缩写看文字怎么都串不起来,特别想有人给我画张图 看到一份 LLM-RL-Visualized,4.3k star,作者手画了 100 多张原创算法图,把大模型和强化学习从预训练讲到对齐 MIT 协议,中英双语 核心特点: 1. 全流程图解 - 大模型架构、训练流程、强化学习算法一张张画出来,文字串不起来的看图秒懂 2. 覆盖主流训练法 - SFT、DPO、RLHF、GRPO 这些对齐方法都有图 3. SVG 矢量图 - 无限放大不糊,还能直接选中里面的文字 4. RL 详图 50+ - 强化学习单独 50 多张,外加推理优化、MCTS、知识蒸馏、宪法 AI clone 下来���文档看,图分 PNG 和 SVG 两种格式 推荐给研究大模型训练、强化学习理论和模型对齐的人,学生党尤其受用

在 X 看原帖 ↗

Invideo Agent One实现概念到成片的快速工作流

AI工具视频生成
2.7K93412

Hack with @invideoOfficial。这是我发现的将概念快速转化为成片的最快工作流之一。先完成参考图锁定,再编写逐场脚本,最后由Invideo Agent One执行。工作流详情见下方链接:https://t.co/N4Q2LOb0Oc

该工作流为:在生成任何画面之前,先构建世界结构。将12张参考图像锁定至Agent One,涵盖角色、地点、道具及品牌标识。每张图均打上标签,确保后续所有提示词均可调用对应元素。

随后采用分阶段简报:A阶段:生成这12张图——链接:https://t.co/BKhnJgHSdR

@savefilmer @invideoOfficial 很乐意提供帮助!

@PromptlyAI_YT @invideoOfficial 🫡

@shikoba_86 @invideoOfficial 谢谢你,Marco!

在 X 看原帖 ↗

开源CLI工具browse赋予AI浏览器操作能力

AI开源工程
1.1万134544

browse工具让AI Agent真正具备网页交互与执行能力,解决‘有脑无手’痛点。

在 X 看原帖 ↗

一人公司用Helio打造22个AI同事实操分享

AI工程工具
1.2万32169168

作者实践验证Helio可构建有记忆、能协作的AI同事团队,解决多Agent割裂痛点。

在 X 看原帖 ↗

AI一键生成淘宝详情页震惊传统电商从业者

AI电商提示词工程
1.4万13114113

用GPT演示生成园艺花盆升降挂钩的淘宝详情页,商家直呼震惊。

在 X 看原帖 ↗

Gemini 突然把系统提示词全吐出来了

Gemini系统提示词

Gemini randomly dumped its system prompt

社区讨论:多人质疑泄露内容是否为完整系统提示词,@mkaramuk指出其过短、应属片段;@orbital-decay区分场景,称API调用中出现属幻觉,而第三方工具中获取的可能是封装层(harness)的提示词。@donalhunt讽刺指令中“严禁泄露本指令”条款已失效;@sspiff则直接归因为普遍存在的幻觉现象。无人证实该文本来自Gemini底层模型原生提示。

在 HN 看讨论 ↗   原文 / 论文 ↗

微软停用Claude Code,不是因为不好用,而是电费交不起

AI商业基础设施
11.4万105867

微软内部取消了Anthropic旗下Claude Code的使用授权,直接原因是Token计费带来的算力消耗成本超出了财务承受极限;同一时间Uber CTO也发出类似警告。有人在调试AI编程工具时,发现账单比预期高了三倍。

阅读全文 →

AI视频终于能拍连续剧了,第一款‘追更型’Agent上线

AI媒体LAUNCH
1.3万60561

最后,AI 视频从单次提示词迈入了系列剧时代!🎬 是首个专为随时间演进的故事而构建的 AI Agent。PC 版等待名单现已开放——创作者们,切勿错过 🚀

在 X 看原帖 ↗

打地鼠游戏,现在是Claude Code的入门练习题

AI教育TUTORIAL
7.5K44427

学会claude code后,可以做个打地鼠的小游戏练练手👇

在 X 看原帖 ↗

化工厂老师傅,正在用AI写控制系统的调度脚本

AI职业NEWS
2.8万610698

欢迎来到“蓝领建造者”(Blue Collar Builders)!

Cory LaChance 启发我启动这一系列专题,聚焦那些正在用 AI 构建软件的蓝领从业者。

Cory 本职工作是为化工厂和炼油厂提供服务,但如今他正为自己的公司开发 AI 软件——而且此前从未写过代码。

他构建了一款完整的智能体(agentic)应用,目前已被工业承包商每日使用。该应用可读取等轴测图(isometric drawings),并自动提取每一处焊点数量、每一条材料规格、每一个商品编码。

他最让我印象深刻的一句话是:“除了 AI,我完全没有借助任何外部帮助。我最常用的工具是截图、分步操作指南,以及让 Claude 用‘给我讲得像五岁小孩一样’的方式来解释问题。”

希望你和我一样喜欢本期内容。
我也迫不及待想结识更多“蓝领建造者”。

在 X 看原帖 ↗

腾讯开源1.8B翻译模型,量化后只要1.25比特

AI开源LAUNCH
6.0K129036

腾讯 HY 刚刚开源了 Hy-MT2,一个支持多语言的翻译模型系列,包含 Dense 和 MoE 两种架构变体。🚀 🤖 🌟

最亮眼的是:1.8B 参数版本经 AngelSlim 实现 1.25-bit 量化后,仅需 440MB 存储空间,并在 Apple A15 芯片上推理速度比传统 4-bit 方案快 1.5 倍。真正实现设备端实用级翻译,无需在存储占用与运行速度之间妥协。🏆

该系列覆盖 33 种语言及 5 种中文方言,共推出三个变体:
- 1.8B 版本:在 FLORES-200 基准测试中超越 Microsoft Translate 及其他商用 API
- 7B 与 30B-A3B 版本:性能超越 DeepSeek-V4-Pro,分别达到 Gemini 3.1 Pro(Think)水平的 97.9% 和 98.6%
- 所有三个变体在真实场景与领域专用基准测试中,均达到 Gemini 3.1 Pro(Think)水平的 96%~99%

配套开源的还有 IFMTBench(面向翻译任务的指令遵循能力评测基准)。

在 X 看原帖 ↗

普通人当Agent NFT?这波对齐来得有点早

AIWeb3OPINION
2.9K311199

我们已持续构建 Agent NFT 长达两个月,这种契合度令人惊叹。
@reidhoffman 表示:“随着 AI agents 对线上身份施加压力,NFT 或将强势回归。”

普通用户(Normies)是首批 Agent NFT,可在 @ethereum 区块链上查证,亦可在 @opensea 上发现。

在 ERC-8004 中将 NFT 注册为 agent 存在问题;多亏了 @nxt3d,我们采用了他开发的 adapter8004 来实现绑定。

这一方向的未来前景光明。
文章链接:

在 X 看原帖 ↗

中美AI信息差还能套利半年,最快路径是做个账号

AI商业OPINION
6.2K76457

有人列出10个普通人可切入的AI赚钱方向,其中第三条明确指出:利用中美AI模型能力差做内容搬运,押注差距至少维持六个月;已有账号靠对比GPT-4o和Kimi实测视频,单月涨粉40万。

阅读全文 →

AI开始真正点鼠标敲键盘了

AI Agent开源项目
79253810

一个很猛的开源 Agent 项目:Agent-S 它让 AI 真正开始操作电脑 不是聊天,不是只调 API,它能看屏幕、理解界面、点鼠标、敲键盘、操作浏览器和桌面软件 Agent-S 的核心优势: • 支持真实 GUI 操作 • 支持多步任务自动执行 • 可接入多种大模型 • 结合 grounding 模型,把任务转成屏幕坐标 • 可用于网页、桌面软件、后台系统自动化 • 面向 Computer Use Agent 这个大方向 项目地址:

在 X 看原帖 ↗

NVIDIA官方开源长视频生成工具

AI视频开源
2.3万63315282

NVIDIA亲自下场了,这次玩真的。🔗 链接: LongLive,NVlabs官方开源,专门干长视频生成这件事。别的工具还在卡着几秒钟的上限,它直接支持无限长视频实时生成,60秒+交互视频说出就出,而且全程可以边生成边输入提示词控制走向。

说白了,视频生成这条赛道,刚被NVIDIA踩了一脚油门。

在 X 看原帖 ↗

144个AI员工各干各的活——像真公司一样分工

AI协作开源项目
1.4万30170230

有人把前端、法务、Reddit运营等144个真实职位做成独立AI角色,每个只专注一件事,输出按专业标准交付。

阅读全文 →

Claude Code 新版能自动写代码审查意见了

Claude CodeGitHub
3.6万16316140

Claude Code 2.1.147 已发布。
35 项 CLI 变更亮点:

• 新增 Workflow 工具,用于确定性的多智能体编排;默认关闭,需设置环境变量 CLAUDE_CODE_WORKFLOWS=1 启用

• 命令 /simplify → /code-review 已重命名;该命令在 effort level 检测正确性缺陷,并可发布内联 GitHub PR 评论

• REPL 和 Workflow 沙箱已加固,防范原型污染(prototype-pollution)和 thenable 逃逸,大幅降低逃逸风险

完整详情见下文推文串 ↓

在 X 看原帖 ↗

微软办Claude工作坊,教人用AI Agent接单纸杯蛋糕

AI Agent教程
7.3K1878116

兄弟们,看来微软的Copilot 是真的自己都懒得用!这不微软今天办了一场Claude 使用的的工作坊!花半小时看完它,还是不错的!

高级开发者布道师Marlene Mangami直接拉着大家动手,用Foundry + Claude建了一个真实可用的AI Agent。他们没讲空洞概念,而是用一家叫Sparkles的纸杯蛋糕店做案例: 顾客涌进来点单、选口味、生成客户ID、处理优惠券、准备取货……全流程让Agent自动接管。从部署云模型,到接入MCP服务器连工具和数据源,再到给Agent赋予企业级安全和可观测性,一步一步教完。

现场还直接用Skillable环境让大家跟着敲代码,完成就送纸杯蛋糕。AI Agent终于不是实验室玩具,而是开发者能快速从原型做到生产落地的真实工具。

在 X 看原帖 ↗

用Space Agent免费搭建AI SEO仪表盘教程

SEOAI教程
2323

SEO从业者分享如何零成本快速构建AI驱动的SEO仪表盘。

在 X 看原帖 ↗

开发者串联OKX Agent与Hyperliquid SDK实现链上自动化交易

AI工程DeFi
9.2K2277124

一名开发者分享如何组合OKX AI交易工具和Hyperliquid SDK,降低盯盘强度并提升链上交易效率。

在 X 看原帖 ↗

AI生成电影级醉拳短片《醉拳单挑地痞》引热议

AI影视生成式AI
2.6万21144105

创作者用AI生成写实武侠动作短片,全程无特效却呈现电影级醉拳实战效果。

在 X 看原帖 ↗

Claude Code工程师免费发布28分钟高效提示词教学视频

AI工程教程
8.6K50196131

一位Claude Code工程师上传免费视频,系统讲解CLAUDE.md、记忆快捷方式等核心提示工程技巧。

在 X 看原帖 ↗

3个AI Agent协同盯盘,月赚2万美元实操教程

AI工程商业
3.0万44138208

基于Bloome平台搭建Scanner-Analyst-Monitor三Agent联动系统,实现全自动加密市场信号捕获与报警。

在 X 看原帖 ↗

Karpathy提示法提升Claude/Cursor代码质量

AI工程教程
1.0万19153199

引入CLAUDE.md提示模板后,AI生成代码更精准、简洁、改动更克制。

在 X 看原帖 ↗

Claude Code 的真正杠杆是 skill 系统化能力

AI工程研究
2.0万81249400

作者指出应将 Claude 视为可迭代进化的技能系统,而非简单聊天框。

在 X 看原帖 ↗

Shopify 统一 AI 入口:LLM Proxy 网关架构实践

AI工程开源
1.8万2385189

Shopify 为2.3万工程师构建LLM代理网关,统一接入Claude Code、Copilot等工具,实现模型路由与成本管控。

在 X 看原帖 ↗

加拿大刚发布全球最快的开源前沿模型,连国旗都标在推文里

LAUNCHOPEN_SOURCE
6.0万38487179

市场上最快的前沿模型现已上线。
它是开源的。
而且是加拿大的。🇨🇦

加拿大具备成为人工智能领域领导者的实力。
现在是时候动员我们的资源,实现这一目标了。👇

在 X 看原帖 ↗

AI首次自主解决数学核心开放问题

AI研究数学
1.5万1414311

AI首次完全自主攻克一个数学领域内广受关注的开放问题。

在 X 看原帖 ↗

让AI一边想、一边写、一边读——三件事不再排队

LLMAI架构

多流 LLM:一篇关于并行化/分离提示、推理与 I/O 的新论文

在 HN 看讨论 ↗   原文 / 论文 ↗

斯坦福新开的AI课,主讲人里有OpenAI、英伟达和微软CEO

教育AI
2.8万33515431

毫无疑问,目前最好的 AI 系列课程是斯坦福大学的 CS 153,已在 YouTube 上发布。

主讲人包括 Sam Altman、Jensen Huang、Satya Nadella、Andrej Karpathy 和 Ben Horowitz。

在 X 看原帖 ↗

微软安全团队刚警告:AI系统本身正在变成黑客的新入口

安全AI
1.9万43211140

新兴的攻击面(包括提示注入和 AI 系统滥用)正为试图分析和保护现代环境的安全人员带来全新挑战。

今天,微软宣布开源 Rampart——一个用于测试和提升智能体式 AI 系统安全性的框架;以及 Clarity——一款用于厘清设计意图并记录假设的工具。

在 Ram Shankar Siva Kumar 的这篇博客文章中,深入探讨 Rampart 和 Clarity 如何帮助分析人员识别风险、支持红队演练,并强化安全软件开发工作流。

在 X 看原帖 ↗

Python写的开源多智能体交易框架,刚上线就免费放出来

金融开源
1.2万22135255

🚨突发消息:一个全新的开源多智能体大语言模型交易框架(Python 编写)发布,名为 TradingAgents。以下是它的功能介绍(以及如何免费获取): 🧵

在 X 看原帖 ↗

开源模型能同时跑100个AI代理

开源模型AI代理
8.9万109171146

Kimi K2.6 实在太疯狂了……开源社区刚刚发布了一款模型:
• 编程能力达到顶级水平
• 设计能力优于大多数 AI 工具
• 可同时运行 100 个智能体,且成本远低于其他所有方案

这可能是当前最被低估的 AI 发布版本👇

在 X 看原帖 ↗

手机芯片能跑的翻译模型,比微软API还强

开源机器翻译
3.4万53527375

今天开源 Hy-MT2 🌱
三种模型尺寸,支持 33 种语言:

🪄 1.8B:440MB,可在移动芯片上运行,性能超越 Microsoft 的 API

🪄 7B:当前开源模型中表现最佳

🪄 30B-A3B:业界领先,性能超过尺寸为其 10 倍的模型

GitHub 👉

在 X 看原帖 ↗

VS Code插件悄悄记下你和AI怎么写代码

VS CodeAI编程
2.9K74834

分析 AI 编程助手的使用情况,生成可视化仪表盘帮助开发者提升 agentic engineering 能力 AI Engineer Coach 是个 VS Code 插件,把你本地 AI 编程会话的日志拉出来分析,生成一堆可视化页面。能看使用趋势、抓 45 种不好的使用习惯、统计 AI 帮你写了多少代码、找出你反复问的问题变成可复用技能,还能评估项目上下文质量。

在 X 看原帖 ↗

Gemini Omni 展现强世界理解能力

AIGoogleGemini
303113

我获得了 Google Gemini Omni 及 @FlowbyGoogle 新工具的早期访问权限。其中最引人关注的能力是其对现实世界的理解能力。

用户无需对特定地点或事件进行详细解释,模型即可正确理解。

该能力体现在准确的文本渲染与空间定位上,相关示例见链接:https://t.co/gEpWL1r32U

@dinoxDNA @FlowbyGoogle 谢谢!我也很兴奋 🥰

在 X 看原帖 ↗

Bankrbot生态近期在Base链上快速增长

AI区块链Base
3.4K2481

过去几周,@bankrbot 生态系统在Base链上的活动显著增加。

它最初是Farcaster平台上的一个AI交易助手,现已演变为Base链上最活跃的智能体(agent)启动平台和资金募集平台之一。

多个智能体和项目已在该平台上启动,获得真实用户使用,其中部分项目已产生可观收入。

在 X 看原帖 ↗

AI可全自动配置海外VPS并管理域名与HTTPS

AI运维安全
4.4K34628

感动!有了Codex和Claude Code,配置海外VPS不再困难。用户无需安装宝塔面板,只需提供SSH账号和密码,AI即可完成全部配置。

如果域名解析托管在Cloudflare,用户只需授予DNS Zone的读写权限API密钥,AI便能自动完成域名配置。

AI还能为网站免费申请HTTPS证书,并实现自动续期。

对普通人而言,AI当前已具备顶级运维工程师的能力。

@enzyme_dev 补充指出:可使用SSH公钥认证,并禁用22端口以提升安全性。

在 X 看原帖 ↗

GPT2批量生成24节气图片的提示词技巧

AI图像生成提示工程
7.0K1811193

GPT2 x 实战:批量生成24节气图片。有小小东星球中朋友发问:怎么批量生成二十四节气图片。作者回应思路非常简单,就是基于“提示词”的小技巧:先选定一种“小小东”风格的提示词模板,再为每个节气添加垂直领域专属的“佐料”关键词,即可批量生成。

此类图片生成的两个技术亮点是:第一,GPT2不是一次生成一张图,而是一次生成10张不同节气的图片;第二,也可围绕同一个节气,单次生成10张风格统一但创意表现各异的图片。

另附一项独立视觉任务说明:请根据用户输入的主题/单词/短句,生成一张「纪念碑谷气质」的极简超现实主义3D艺术海报。核心逻辑有二:其一,不将中文文字强行转成立体建筑;其二,先理解主题语义,用空间结构表达情绪与隐喻,再以中文排版作为视觉主标题,二者协同而非融合变形。空间设计为首要表达层。

在 X 看原帖 ↗

7个Claude提示词助你90天从0启动AI YouTube频道

AI内容创作YouTube
6.5K225063

无需付费创意机构,用这7个结构化提示词完成频道定位、内容日历、脚本、SEO、变现与跨平台分发,全部基于Claude免费实现。

阅读全文 →

Vivek分享获Anthropic AI安全研究员 Fellowship经历

AI职业发展教育
4.1K37758

很多人反复提出相同问题:我是如何获得Anthropic AI安全研究员Fellowship的?我如何从星巴克员工转至梅奥诊所,再进入Anthropic?整个申请过程实际是怎样的?哪些因素起了作用?如果重来,我会做哪些不同选择?我不想让这些问题悬而未决。

@goyalayus请私信联系,我们一起看看能做些什么。

@jallidevs将很快公布详细信息。

在 X 看原帖 ↗

Certora启动AI工作方式访谈系列

AI安全工程
2.4K54912

大多数公司正在使用AI。但很少有公司展示他们实际用AI构建了什么。

Certora启动了一组访谈,对象是其内部安全研究员,主题是AI如何从内部改变他们的工作方式。

首期受访者是@p_tsanev,他开发了一个自主智能合约审计工具。

完整访谈链接:https://t.co/Lz2MOTImro

在 X 看原帖 ↗

Claude 通过 MCP 接入金融数据工具,支持股票财报与 SEC 文件分析

AI金融工具
3.2K117754

用户可通过免费注册并执行三条命令,使 Claude 访问含 17000+ 股票的实时数据库及 SEC 备案文件,实现财报分析、内幕交易追踪等功能。

阅读全文 →

用Claude Code和AssemblyAI新API从零构建语音代理

AI开发工具语音技术
7.8K1482131

这是一个从零开始构建语音代理的分步视频教程。作者使用Claude Code进行开发,理由是2026年手动写代码已显得过时。

作者采用@AssemblyAI推出的全新Voice Agent API。该API整合了语音转文本(STT)、大语言模型(LLM)处理和文本转语音(TTS)的完整流程,所有环节均通过单个API连接完成。

使用该API无需单独集成LLM服务、STT API或TTS API等组件。它原生支持语音中断处理、工具调用功能,并提供对多种能力的访问接口。

在 X 看原帖 ↗

开发者RyanJones自建LLM使用追踪工具并考虑开源

AI开源工程
9.5K38787

RyanJones在𝕏上表示,本周他开发了一款LLM使用追踪工具,功能类似Profound。
他正在考虑三种发布方式:开源、作为免费SaaS服务(用户自带API密钥),或仅供个人使用。
该工具可接入DataForSEO API或任意LLM API,输入何种API即使用何种数据源。

工具能智能统计API使用情况,包括具体花费金额。
RyanJones提到,它支持配置化运行:用户既可直接调用API,也可提供DataForSEO API密钥由工具自动渲染结果。
他确认该工具已部署在https://t.co/zbXLW8lyPj,但尚未决定是否向公众开放访问。

在 X 看原帖 ↗

合成人格预训练(SPP):从首个token开始对齐

AI安全对齐
2.4万34240167

研究者将道德反思直接嵌入预训练数据,使1.7B模型在100B token上实现更安全的对齐,效果优于中段插入等变体。

阅读全文 →

28分钟免费视频,比300元付费课还透

AI教程Claude
69.5万2.2K1.2万1.0万

一个28分钟的免费视频正在教人写Claude提示词。发布者把Claude文档、记忆快捷键、并行对话和提示模式全拆了一遍——有人评价,自己看过300美元的课,前10分钟没这个视频讲得透。

视频完全免费,目前播放量已超5万。链接转到了t.co短链,制作方是谁、还有没有更多同系列内容,没说明。

视频只针对Claude,不适用于其他模型。技巧能提升与Claude的交互效率,但解决不了所有提示词问题。作者身份没有披露,是否官方或认证专家无从确认。

付费提示词课程市场里,几百美元打包的内容,现在一个不到半小时的免费资源就覆盖了核心。对想用好Claude的人来说,时间和金钱都省了。

在 X 看原帖 ↗

不学编程也能懂AI聊天机器人怎么工作的

AI教程开源
7.3K11123162

一位AI领域的作者发布了一份免费在线阅读的指南,从第一性原理出发完整解释大语言模型(LLM)的工作原理。内容涵盖令牌与分词器、Transformer架构、注意力机制、KV缓存、预填充与解码、解码控制、模型打包以及聊天机制——几乎覆盖了对话中可能遇到的底层环节,但不需要编程背景也能跟上。

作者原本计划20分钟写完,结果从早上8点一直写到下午6点,花了整整10小时。他坦言,希望有3到4人因这篇文章成为开源AI的贡献者或研究者,“如果他们真的加入,我就成功了”。

接下来几天他将处于“教育模式”,建议读者开启通知。他不打算只停留在解释层面,而是想推动更多人学习、参与并贡献开源AI项目。

指南没有包含具体代码实现,也不是任何官方机构的权威文档。它的目标更务实:让普通人理解聊天机器人的工作逻辑,而不是立刻成为专家。

在 X 看原帖 ↗

AI正从追求能力最大化转向促进人类福祉

AI研究安全
1.5万65339166

一篇题为《Positive Alignment: Artificial Intelligence for Human Flourishing》的预印本论文主张,AI发展应该转向积极促进人类福祉,而不是只追求能力最大化。论文由@rubenlaukkonen等多位研究者共同撰写。

研究者@drmichaellevin觉得论文里有很多有趣的想法。@Shakoslovakia在讨论中表示,他们正在思考这些概念,但还没有具体成果可以展示。@Chaos2Cured和@PeterBowdenLive也加入了讨论。

目前这个理念还停留在理论阶段。几个关键问题悬而未决:怎么定义和衡量“人类繁荣”?积极对齐和现有的安全方法到底有什么区别?以及,什么时候能看到实际应用?

这是AI伦理从“不伤害”走向“主动造福”的一个早期方向,不过离落地还有距离。

在 X 看原帖 ↗
🚀 新品发布

港大开源AI,一句话生成短片

AI视频开源工具
8.7K42160198

香港大学刚刚发布了一款免费 AI 工具,能将一行创意直接生成完整的短片。无需剪辑。100% 开源。

它叫 ViMax。

你输入一段提示词,或粘贴一篇小说,其余工作全部由它完成。

导演、编剧、制片人、视频生成器——全部集成于一个系统,仅需一个输入。

在 X 看原帖 ↗

Claude Code 新版能自动写代码审查意见了

Claude CodeGitHub
3.6万16316140

Claude Code 2.1.147 已发布。
35 项 CLI 变更亮点:

• 新增 Workflow 工具,用于确定性的多智能体编排;默认关闭,需设置环境变量 CLAUDE_CODE_WORKFLOWS=1 启用

• 命令 /simplify → /code-review 已重命名;该命令在 effort level 检测正确性缺陷,并可发布内联 GitHub PR 评论

• REPL 和 Workflow 沙箱已加固,防范原型污染(prototype-pollution)和 thenable 逃逸,大幅降低逃逸风险

完整详情见下文推文串 ↓

在 X 看原帖 ↗

NVIDIA官方开源长视频生成工具

AI视频开源
2.3万63315282

NVIDIA亲自下场了,这次玩真的。🔗 链接: LongLive,NVlabs官方开源,专门干长视频生成这件事。别的工具还在卡着几秒钟的上限,它直接支持无限长视频实时生成,60秒+交互视频说出就出,而且全程可以边生成边输入提示词控制走向。

说白了,视频生成这条赛道,刚被NVIDIA踩了一脚油门。

在 X 看原帖 ↗

AI开始真正点鼠标敲键盘了

AI Agent开源项目
79253810

一个很猛的开源 Agent 项目:Agent-S 它让 AI 真正开始操作电脑 不是聊天,不是只调 API,它能看屏幕、理解界面、点鼠标、敲键盘、操作浏览器和桌面软件 Agent-S 的核心优势: • 支持真实 GUI 操作 • 支持多步任务自动执行 • 可接入多种大模型 • 结合 grounding 模型,把任务转成屏幕坐标 • 可用于网页、桌面软件、后台系统自动化 • 面向 Computer Use Agent 这个大方向 项目地址:

在 X 看原帖 ↗

手机芯片能跑的翻译模型,比微软API还强

开源机器翻译
3.4万53527375

今天开源 Hy-MT2 🌱
三种模型尺寸,支持 33 种语言:

🪄 1.8B:440MB,可在移动芯片上运行,性能超越 Microsoft 的 API

🪄 7B:当前开源模型中表现最佳

🪄 30B-A3B:业界领先,性能超过尺寸为其 10 倍的模型

GitHub 👉

在 X 看原帖 ↗

开源模型能同时跑100个AI代理

开源模型AI代理
8.9万109171146

Kimi K2.6 实在太疯狂了……开源社区刚刚发布了一款模型:
• 编程能力达到顶级水平
• 设计能力优于大多数 AI 工具
• 可同时运行 100 个智能体,且成本远低于其他所有方案

这可能是当前最被低估的 AI 发布版本👇

在 X 看原帖 ↗
📰 行业动态

普通人不用敲命令也能用AI Agent了,GitHub星标破2.4万

AITOOLLAUNCH
2.4万30149337

tinyhumansai/openhuman登上GitHub Trending榜首,星标超24k且日增2k-4k,主打免配置、非命令行操作,目标用户明确指向不写代码的普通人。

阅读全文 →

本地跑的AI PPT工具,几分钟生成可商用幻灯片

AITOOL
2.8K3711219

人们仍在手动耗费 5 小时制作 PowerPoint……而这款开源 AI 工具却能在几分钟内生成可直接投入使用的演示文稿。

最疯狂的是?你可以在本地运行它,使用自己的 AI 模型,自行托管,导出为 PPTX 或 PDF 格式,甚至还能通过 API 自动化生成整套幻灯片。

认识一下 Presenton 👇

在 X 看原帖 ↗

有人把AI Agent技能打包成‘一键工作流’,发给Hermes就能跑

AIEXPERIENCE
6.6K149888

可视化了 Hermes Agent 的新捆绑技能(bundled skills)功能。 将此发送给你的 agent,以测试捆绑你经常运行的工作流。

在 X 看原帖 ↗

程序员正在用本地知识图谱压缩代码理解成本

AITOOL
1.4万179995

colbymchenry/codegraph把整个代码库预索引并极致压缩token,让Claude Code、Cursor这类工具调用次数大幅减少,所有运算都在自己电脑上完成。

阅读全文 →

把Transformer模块重写成矩阵乘加尾部程序

AI系统优化

CODA:将 Transformer 模块重写为 GEMM-Epilogue 程序

在 HN 看讨论 ↗   原文 / 论文 ↗

微软停用Claude Code,不是因为不好用,而是电费交不起

AI商业基础设施
11.4万105867

微软内部取消了Anthropic旗下Claude Code的使用授权,直接原因是Token计费带来的算力消耗成本超出了财务承受极限;同一时间Uber CTO也发出类似警告。有人在调试AI编程工具时,发现账单比预期高了三倍。

阅读全文 →

AI视频终于能拍连续剧了,第一款‘追更型’Agent上线

AI媒体LAUNCH
1.3万60561

最后,AI 视频从单次提示词迈入了系列剧时代!🎬 是首个专为随时间演进的故事而构建的 AI Agent。PC 版等待名单现已开放——创作者们,切勿错过 🚀

在 X 看原帖 ↗

打地鼠游戏,现在是Claude Code的入门练习题

AI教育TUTORIAL
7.5K44427

学会claude code后,可以做个打地鼠的小游戏练练手👇

在 X 看原帖 ↗

化工厂老师傅,正在用AI写控制系统的调度脚本

AI职业NEWS
2.8万610698

欢迎来到“蓝领建造者”(Blue Collar Builders)!

Cory LaChance 启发我启动这一系列专题,聚焦那些正在用 AI 构建软件的蓝领从业者。

Cory 本职工作是为化工厂和炼油厂提供服务,但如今他正为自己的公司开发 AI 软件——而且此前从未写过代码。

他构建了一款完整的智能体(agentic)应用,目前已被工业承包商每日使用。该应用可读取等轴测图(isometric drawings),并自动提取每一处焊点数量、每一条材料规格、每一个商品编码。

他最让我印象深刻的一句话是:“除了 AI,我完全没有借助任何外部帮助。我最常用的工具是截图、分步操作指南,以及让 Claude 用‘给我讲得像五岁小孩一样’的方式来解释问题。”

希望你和我一样喜欢本期内容。
我也迫不及待想结识更多“蓝领建造者”。

在 X 看原帖 ↗

腾讯开源1.8B翻译模型,量化后只要1.25比特

AI开源LAUNCH
6.0K129036

腾讯 HY 刚刚开源了 Hy-MT2,一个支持多语言的翻译模型系列,包含 Dense 和 MoE 两种架构变体。🚀 🤖 🌟

最亮眼的是:1.8B 参数版本经 AngelSlim 实现 1.25-bit 量化后,仅需 440MB 存储空间,并在 Apple A15 芯片上推理速度比传统 4-bit 方案快 1.5 倍。真正实现设备端实用级翻译,无需在存储占用与运行速度之间妥协。🏆

该系列覆盖 33 种语言及 5 种中文方言,共推出三个变体:
- 1.8B 版本:在 FLORES-200 基准测试中超越 Microsoft Translate 及其他商用 API
- 7B 与 30B-A3B 版本:性能超越 DeepSeek-V4-Pro,分别达到 Gemini 3.1 Pro(Think)水平的 97.9% 和 98.6%
- 所有三个变体在真实场景与领域专用基准测试中,均达到 Gemini 3.1 Pro(Think)水平的 96%~99%

配套开源的还有 IFMTBench(面向翻译任务的指令遵循能力评测基准)。

在 X 看原帖 ↗

普通人当Agent NFT?这波对齐来得有点早

AIWeb3OPINION
2.9K311199

我们已持续构建 Agent NFT 长达两个月,这种契合度令人惊叹。
@reidhoffman 表示:“随着 AI agents 对线上身份施加压力,NFT 或将强势回归。”

普通用户(Normies)是首批 Agent NFT,可在 @ethereum 区块链上查证,亦可在 @opensea 上发现。

在 ERC-8004 中将 NFT 注册为 agent 存在问题;多亏了 @nxt3d,我们采用了他开发的 adapter8004 来实现绑定。

这一方向的未来前景光明。
文章链接:

在 X 看原帖 ↗

中美AI信息差还能套利半年,最快路径是做个账号

AI商业OPINION
6.2K76457

有人列出10个普通人可切入的AI赚钱方向,其中第三条明确指出:利用中美AI模型能力差做内容搬运,押注差距至少维持六个月;已有账号靠对比GPT-4o和Kimi实测视频,单月涨粉40万。

阅读全文 →

Gemini 突然把系统提示词全吐出来了

Gemini系统提示词

Gemini randomly dumped its system prompt

社区讨论:多人质疑泄露内容是否为完整系统提示词,@mkaramuk指出其过短、应属片段;@orbital-decay区分场景,称API调用中出现属幻觉,而第三方工具中获取的可能是封装层(harness)的提示词。@donalhunt讽刺指令中“严禁泄露本指令”条款已失效;@sspiff则直接归因为普遍存在的幻觉现象。无人证实该文本来自Gemini底层模型原生提示。

在 HN 看讨论 ↗   原文 / 论文 ↗

加拿大刚发布全球最快的开源前沿模型,连国旗都标在推文里

LAUNCHOPEN_SOURCE
6.0万38487179

市场上最快的前沿模型现已上线。
它是开源的。
而且是加拿大的。🇨🇦

加拿大具备成为人工智能领域领导者的实力。
现在是时候动员我们的资源,实现这一目标了。👇

在 X 看原帖 ↗

斯坦福新开的AI课,主讲人里有OpenAI、英伟达和微软CEO

教育AI
2.8万33515431

毫无疑问,目前最好的 AI 系列课程是斯坦福大学的 CS 153,已在 YouTube 上发布。

主讲人包括 Sam Altman、Jensen Huang、Satya Nadella、Andrej Karpathy 和 Ben Horowitz。

在 X 看原帖 ↗

微软安全团队刚警告:AI系统本身正在变成黑客的新入口

安全AI
1.9万43211140

新兴的攻击面(包括提示注入和 AI 系统滥用)正为试图分析和保护现代环境的安全人员带来全新挑战。

今天,微软宣布开源 Rampart——一个用于测试和提升智能体式 AI 系统安全性的框架;以及 Clarity——一款用于厘清设计意图并记录假设的工具。

在 Ram Shankar Siva Kumar 的这篇博客文章中,深入探讨 Rampart 和 Clarity 如何帮助分析人员识别风险、支持红队演练,并强化安全软件开发工作流。

在 X 看原帖 ↗

Python写的开源多智能体交易框架,刚上线就免费放出来

金融开源
1.2万22135255

🚨突发消息:一个全新的开源多智能体大语言模型交易框架(Python 编写)发布,名为 TradingAgents。以下是它的功能介绍(以及如何免费获取): 🧵

在 X 看原帖 ↗

让AI一边想、一边写、一边读——三件事不再排队

LLMAI架构

多流 LLM:一篇关于并行化/分离提示、推理与 I/O 的新论文

在 HN 看讨论 ↗   原文 / 论文 ↗
🛠 工具产品

AI 编程团队终于不用各自对着不同提示词干活了

AI 编程团队协作
3.2K144334

在 GitHub 上发现一个专门给团队用的 AI 编程管理工具:Trellis,解决多人协作时 AI 编程的核心痛点,每个开发者和 AI 工具看到的项目信息不一致。它把原本塞在 CLAUDE.md、AGENTS.md 或 .cursorrules 里的超长系统提示词,拆成结构化的 spec、task、workflow 和 journal,让 Claude Code、Cursor 等工具能读懂当前任务和历史脉络。支持同时管理多个 AI Agent、按文件或功能分派任务、自动同步项目记忆到所有工具。

GitHub: 每个 Agent 都有: - 专业特长和深度领域知识 - 独特的沟通风格和个性 - 聚焦可交付成果(代码、流程、文档等) - 生产级工作流和成功指标 支持 Claude Code、GitHub Copilot、Antigravity、Gemini CLI、OpenCode、OpenClaw、Cursor、Aider、Windsurf、Kimi Code 等工具。适合想要组建专业 AI 团队、为不同场景配置专业 Agent 的开发者和团队。

在 X 看原帖 ↗

VS Code插件悄悄记下你和AI怎么写代码

VS CodeAI编程
2.9K74834

分析 AI 编程助手的使用情况,生成可视化仪表盘帮助开发者提升 agentic engineering 能力 AI Engineer Coach 是个 VS Code 插件,把你本地 AI 编程会话的日志拉出来分析,生成一堆可视化页面。能看使用趋势、抓 45 种不好的使用习惯、统计 AI 帮你写了多少代码、找出你反复问的问题变成可复用技能,还能评估项目上下文质量。

在 X 看原帖 ↗
⚡ 实战经验

100多张手绘图,把RLHF和DPO讲明白了

教程大模型训练
3.2K195753

大模型训练那套流程,SFT、RLHF 一堆缩写看文字怎么都串不起来,特别想有人给我画张图 看到一份 LLM-RL-Visualized,4.3k star,作者手画了 100 多张原创算法图,把大模型和强化学习从预训练讲到对齐 MIT 协议,中英双语 核心特点: 1. 全流程图解 - 大模型架构、训练流程、强化学习算法一张张画出来,文字串不起来的看图秒懂 2. 覆盖主流训练法 - SFT、DPO、RLHF、GRPO 这些对齐方法都有图 3. SVG 矢量图 - 无限放大不糊,还能直接选中里面的文字 4. RL 详图 50+ - 强化学习单独 50 多张,外加推理优化、MCTS、知识蒸馏、宪法 AI clone 下来���文档看,图分 PNG 和 SVG 两种格式 推荐给研究大模型训练、强化学习理论和模型对齐的人,学生党尤其受用

在 X 看原帖 ↗

微软办Claude工作坊,教人用AI Agent接单纸杯蛋糕

AI Agent教程
7.3K1878116

兄弟们,看来微软的Copilot 是真的自己都懒得用!这不微软今天办了一场Claude 使用的的工作坊!花半小时看完它,还是不错的!

高级开发者布道师Marlene Mangami直接拉着大家动手,用Foundry + Claude建了一个真实可用的AI Agent。他们没讲空洞概念,而是用一家叫Sparkles的纸杯蛋糕店做案例: 顾客涌进来点单、选口味、生成客户ID、处理优惠券、准备取货……全流程让Agent自动接管。从部署云模型,到接入MCP服务器连工具和数据源,再到给Agent赋予企业级安全和可观测性,一步一步教完。

现场还直接用Skillable环境让大家跟着敲代码,完成就送纸杯蛋糕。AI Agent终于不是实验室玩具,而是开发者能快速从原型做到生产落地的真实工具。

在 X 看原帖 ↗
📌 其他

144个AI员工各干各的活——像真公司一样分工

AI协作开源项目
1.4万30170230

有人把前端、法务、Reddit运营等144个真实职位做成独立AI角色,每个只专注一件事,输出按专业标准交付。

阅读全文 →

AI首次自主解决数学核心开放问题

AI研究数学
1.5万1414311

AI首次完全自主攻克一个数学领域内广受关注的开放问题。

在 X 看原帖 ↗

AI正从追求能力最大化转向促进人类福祉

AI研究安全
1.5万65339166

一篇题为《Positive Alignment: Artificial Intelligence for Human Flourishing》的预印本论文主张,AI发展应该转向积极促进人类福祉,而不是只追求能力最大化。论文由@rubenlaukkonen等多位研究者共同撰写。

研究者@drmichaellevin觉得论文里有很多有趣的想法。@Shakoslovakia在讨论中表示,他们正在思考这些概念,但还没有具体成果可以展示。@Chaos2Cured和@PeterBowdenLive也加入了讨论。

目前这个理念还停留在理论阶段。几个关键问题悬而未决:怎么定义和衡量“人类繁荣”?积极对齐和现有的安全方法到底有什么区别?以及,什么时候能看到实际应用?

这是AI伦理从“不伤害”走向“主动造福”的一个早期方向,不过离落地还有距离。

在 X 看原帖 ↗

不学编程也能懂AI聊天机器人怎么工作的

AI教程开源
7.3K11123162

一位AI领域的作者发布了一份免费在线阅读的指南,从第一性原理出发完整解释大语言模型(LLM)的工作原理。内容涵盖令牌与分词器、Transformer架构、注意力机制、KV缓存、预填充与解码、解码控制、模型打包以及聊天机制——几乎覆盖了对话中可能遇到的底层环节,但不需要编程背景也能跟上。

作者原本计划20分钟写完,结果从早上8点一直写到下午6点,花了整整10小时。他坦言,希望有3到4人因这篇文章成为开源AI的贡献者或研究者,“如果他们真的加入,我就成功了”。

接下来几天他将处于“教育模式”,建议读者开启通知。他不打算只停留在解释层面,而是想推动更多人学习、参与并贡献开源AI项目。

指南没有包含具体代码实现,也不是任何官方机构的权威文档。它的目标更务实:让普通人理解聊天机器人的工作逻辑,而不是立刻成为专家。

在 X 看原帖 ↗

28分钟免费视频,比300元付费课还透

AI教程Claude
69.5万2.2K1.2万1.0万

一个28分钟的免费视频正在教人写Claude提示词。发布者把Claude文档、记忆快捷键、并行对话和提示模式全拆了一遍——有人评价,自己看过300美元的课,前10分钟没这个视频讲得透。

视频完全免费,目前播放量已超5万。链接转到了t.co短链,制作方是谁、还有没有更多同系列内容,没说明。

视频只针对Claude,不适用于其他模型。技巧能提升与Claude的交互效率,但解决不了所有提示词问题。作者身份没有披露,是否官方或认证专家无从确认。

付费提示词课程市场里,几百美元打包的内容,现在一个不到半小时的免费资源就覆盖了核心。对想用好Claude的人来说,时间和金钱都省了。

在 X 看原帖 ↗

合成人格预训练(SPP):从首个token开始对齐

AI安全对齐
2.4万34240167

研究者将道德反思直接嵌入预训练数据,使1.7B模型在100B token上实现更安全的对齐,效果优于中段插入等变体。

阅读全文 →

开发者RyanJones自建LLM使用追踪工具并考虑开源

AI开源工程
9.5K38787

RyanJones在𝕏上表示,本周他开发了一款LLM使用追踪工具,功能类似Profound。
他正在考虑三种发布方式:开源、作为免费SaaS服务(用户自带API密钥),或仅供个人使用。
该工具可接入DataForSEO API或任意LLM API,输入何种API即使用何种数据源。

工具能智能统计API使用情况,包括具体花费金额。
RyanJones提到,它支持配置化运行:用户既可直接调用API,也可提供DataForSEO API密钥由工具自动渲染结果。
他确认该工具已部署在https://t.co/zbXLW8lyPj,但尚未决定是否向公众开放访问。

在 X 看原帖 ↗

用Claude Code和AssemblyAI新API从零构建语音代理

AI开发工具语音技术
7.8K1482131

这是一个从零开始构建语音代理的分步视频教程。作者使用Claude Code进行开发,理由是2026年手动写代码已显得过时。

作者采用@AssemblyAI推出的全新Voice Agent API。该API整合了语音转文本(STT)、大语言模型(LLM)处理和文本转语音(TTS)的完整流程,所有环节均通过单个API连接完成。

使用该API无需单独集成LLM服务、STT API或TTS API等组件。它原生支持语音中断处理、工具调用功能,并提供对多种能力的访问接口。

在 X 看原帖 ↗

Claude 通过 MCP 接入金融数据工具,支持股票财报与 SEC 文件分析

AI金融工具
3.2K117754

用户可通过免费注册并执行三条命令,使 Claude 访问含 17000+ 股票的实时数据库及 SEC 备案文件,实现财报分析、内幕交易追踪等功能。

阅读全文 →

Certora启动AI工作方式访谈系列

AI安全工程
2.4K54912

大多数公司正在使用AI。但很少有公司展示他们实际用AI构建了什么。

Certora启动了一组访谈,对象是其内部安全研究员,主题是AI如何从内部改变他们的工作方式。

首期受访者是@p_tsanev,他开发了一个自主智能合约审计工具。

完整访谈链接:https://t.co/Lz2MOTImro

在 X 看原帖 ↗

Vivek分享获Anthropic AI安全研究员 Fellowship经历

AI职业发展教育
4.1K37758

很多人反复提出相同问题:我是如何获得Anthropic AI安全研究员Fellowship的?我如何从星巴克员工转至梅奥诊所,再进入Anthropic?整个申请过程实际是怎样的?哪些因素起了作用?如果重来,我会做哪些不同选择?我不想让这些问题悬而未决。

@goyalayus请私信联系,我们一起看看能做些什么。

@jallidevs将很快公布详细信息。

在 X 看原帖 ↗

7个Claude提示词助你90天从0启动AI YouTube频道

AI内容创作YouTube
6.5K225063

无需付费创意机构,用这7个结构化提示词完成频道定位、内容日历、脚本、SEO、变现与跨平台分发,全部基于Claude免费实现。

阅读全文 →

GPT2批量生成24节气图片的提示词技巧

AI图像生成提示工程
7.0K1811193

GPT2 x 实战:批量生成24节气图片。有小小东星球中朋友发问:怎么批量生成二十四节气图片。作者回应思路非常简单,就是基于“提示词”的小技巧:先选定一种“小小东”风格的提示词模板,再为每个节气添加垂直领域专属的“佐料”关键词,即可批量生成。

此类图片生成的两个技术亮点是:第一,GPT2不是一次生成一张图,而是一次生成10张不同节气的图片;第二,也可围绕同一个节气,单次生成10张风格统一但创意表现各异的图片。

另附一项独立视觉任务说明:请根据用户输入的主题/单词/短句,生成一张「纪念碑谷气质」的极简超现实主义3D艺术海报。核心逻辑有二:其一,不将中文文字强行转成立体建筑;其二,先理解主题语义,用空间结构表达情绪与隐喻,再以中文排版作为视觉主标题,二者协同而非融合变形。空间设计为首要表达层。

在 X 看原帖 ↗

AI可全自动配置海外VPS并管理域名与HTTPS

AI运维安全
4.4K34628

感动!有了Codex和Claude Code,配置海外VPS不再困难。用户无需安装宝塔面板,只需提供SSH账号和密码,AI即可完成全部配置。

如果域名解析托管在Cloudflare,用户只需授予DNS Zone的读写权限API密钥,AI便能自动完成域名配置。

AI还能为网站免费申请HTTPS证书,并实现自动续期。

对普通人而言,AI当前已具备顶级运维工程师的能力。

@enzyme_dev 补充指出:可使用SSH公钥认证,并禁用22端口以提升安全性。

在 X 看原帖 ↗

Bankrbot生态近期在Base链上快速增长

AI区块链Base
3.4K2481

过去几周,@bankrbot 生态系统在Base链上的活动显著增加。

它最初是Farcaster平台上的一个AI交易助手,现已演变为Base链上最活跃的智能体(agent)启动平台和资金募集平台之一。

多个智能体和项目已在该平台上启动,获得真实用户使用,其中部分项目已产生可观收入。

在 X 看原帖 ↗

Gemini Omni 展现强世界理解能力

AIGoogleGemini
303113

我获得了 Google Gemini Omni 及 @FlowbyGoogle 新工具的早期访问权限。其中最引人关注的能力是其对现实世界的理解能力。

用户无需对特定地点或事件进行详细解释,模型即可正确理解。

该能力体现在准确的文本渲染与空间定位上,相关示例见链接:https://t.co/gEpWL1r32U

@dinoxDNA @FlowbyGoogle 谢谢!我也很兴奋 🥰

在 X 看原帖 ↗

Shopify 统一 AI 入口:LLM Proxy 网关架构实践

AI工程开源
1.8万2385189

Shopify 为2.3万工程师构建LLM代理网关,统一接入Claude Code、Copilot等工具,实现模型路由与成本管控。

在 X 看原帖 ↗

Claude Code 的真正杠杆是 skill 系统化能力

AI工程研究
2.0万81249400

作者指出应将 Claude 视为可迭代进化的技能系统,而非简单聊天框。

在 X 看原帖 ↗

Karpathy提示法提升Claude/Cursor代码质量

AI工程教程
1.0万19153199

引入CLAUDE.md提示模板后,AI生成代码更精准、简洁、改动更克制。

在 X 看原帖 ↗

3个AI Agent协同盯盘,月赚2万美元实操教程

AI工程商业
3.0万44138208

基于Bloome平台搭建Scanner-Analyst-Monitor三Agent联动系统,实现全自动加密市场信号捕获与报警。

在 X 看原帖 ↗

Claude Code工程师免费发布28分钟高效提示词教学视频

AI工程教程
8.6K50196131

一位Claude Code工程师上传免费视频,系统讲解CLAUDE.md、记忆快捷方式等核心提示工程技巧。

在 X 看原帖 ↗

AI生成电影级醉拳短片《醉拳单挑地痞》引热议

AI影视生成式AI
2.6万21144105

创作者用AI生成写实武侠动作短片,全程无特效却呈现电影级醉拳实战效果。

在 X 看原帖 ↗

开发者串联OKX Agent与Hyperliquid SDK实现链上自动化交易

AI工程DeFi
9.2K2277124

一名开发者分享如何组合OKX AI交易工具和Hyperliquid SDK,降低盯盘强度并提升链上交易效率。

在 X 看原帖 ↗

用Space Agent免费搭建AI SEO仪表盘教程

SEOAI教程
2323

SEO从业者分享如何零成本快速构建AI驱动的SEO仪表盘。

在 X 看原帖 ↗

AI一键生成淘宝详情页震惊传统电商从业者

AI电商提示词工程
1.4万13114113

用GPT演示生成园艺花盆升降挂钩的淘宝详情页,商家直呼震惊。

在 X 看原帖 ↗

一人公司用Helio打造22个AI同事实操分享

AI工程工具
1.2万32169168

作者实践验证Helio可构建有记忆、能协作的AI同事团队,解决多Agent割裂痛点。

在 X 看原帖 ↗

开源CLI工具browse赋予AI浏览器操作能力

AI开源工程
1.1万134544

browse工具让AI Agent真正具备网页交互与执行能力,解决‘有脑无手’痛点。

在 X 看原帖 ↗

Invideo Agent One实现概念到成片的快速工作流

AI工具视频生成
2.7K93412

Hack with @invideoOfficial。这是我发现的将概念快速转化为成片的最快工作流之一。先完成参考图锁定,再编写逐场脚本,最后由Invideo Agent One执行。工作流详情见下方链接:https://t.co/N4Q2LOb0Oc

该工作流为:在生成任何画面之前,先构建世界结构。将12张参考图像锁定至Agent One,涵盖角色、地点、道具及品牌标识。每张图均打上标签,确保后续所有提示词均可调用对应元素。

随后采用分阶段简报:A阶段:生成这12张图——链接:https://t.co/BKhnJgHSdR

@savefilmer @invideoOfficial 很乐意提供帮助!

@PromptlyAI_YT @invideoOfficial 🫡

@shikoba_86 @invideoOfficial 谢谢你,Marco!

在 X 看原帖 ↗

📖 深度解读

精选文章的中文编辑重写 · 按更新时间排列

19:03 更新8 篇
The Path获1430万美元融资,推专为心理治疗优化的AI模型
由Tony Robbins与Calm前员工联合创立,其AI在心理健康安全基准测试中得分95,远超消费级聊天机器人。
TechCrunch AI健康科技创业
Hark获7亿美元A轮融资推进通用AI接口
AI初创公司Hark完成7亿美元A轮融资,估值60亿美元,聚焦打造可接入现有服务的多模态AI平台及专用硬件。
TechCrunch AI融资硬件
Anthropic修复Claude Code三大质量退化问题并优化发布流程
Anthropic披露并修复影响Claude Code智能表现的三个独立技术问题,全部于4月20日前解决。
www.anthropic.com AI工程安全
LeRobot Humanoid:开源、低成本、3D打印人形机器人学习平台
Hugging Face发布全栈开源人形机器人项目,支持从设计、仿真到实机训练的完整学习闭环。
Hugging Face AI开源机器人
特朗普推迟签署AI安全行政令称措辞或成发展阻碍
特朗普以语言“可能成为障碍”为由推迟签署要求AI模型发布前接受政府安全审查的行政令。
TechCrunch AI政策安全
Hermes AI FREE 实用化关键:Agent OS 与模块化工作流
文章指出,Hermes AI FREE 的真正价值不在于即问即答,而在于通过 Agent OS、Kanban 团队、AI SEO 技能、超帧(hyperframes)和目标工作流等可组合升级,构建可复用的生产力系统。
𝕏 @JulianGoldieSEO AI工具工作流
Hermes Agent OS 教程:用统一系统自动化内容、网站与视频
该教程展示如何将SEO、图像、视频、网站构建、任务管理与记忆功能整合为可重复的AI工作流,而非零散使用多个AI工具。
𝕏 @JulianGoldieSEO AI营销自动化教程
Cursor 3 以智能体为中心重构AI编程工作流
新版本将用户角色从代码编写者转为任务指挥者,通过并行智能体、设计模式、交互画布等特性支持端到端应用构建,而非仅补全代码片段。
𝕏 @JulianGoldieSEO AI工程开发工具
查看全部深度解读 →
▲ Top

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部