AI Pulse
📚 0 篇文章
📡 0 条信号
🏷️ 0 个主题
📰 今日焦点

用日常对话就能编视频,Google连发AI新工具

Google 今天发布了几项新模型和智能体产品,覆盖从视频生成到后台信息处理。

先看 Gemini Omni。它是一个新模型,能从视频等任意输入生成高质量视频,支持图像、音频、视频、文本组合输入,基于 Gemini 的真实世界知识。特别的是,它允许用自然语言编辑视频——每次编辑基于上一次,角色一致、物理规律保持、场景有记忆。Omni Flash 版本正在向全球 Google AI Plus、Pro、Ultra 订阅者推出,同时免费向 YouTube Shorts 和 YouTube Create App 用户开放。

然后是 Gemini 3.5 系列,首款模型是 3.5 Flash。它结合了前沿智能与行动能力,在智能体和编码方面表现突出,擅长复杂的长周期任务。与 Antigravity 框架配合,可以部署协作子智能体,可靠执行多步骤工作流和编码任务。3.5 Flash 已是 Gemini 应用和搜索中 AI Mode 的默认模型,也通过 Antigravity、Gemini API、AI Studio、Android Studio、Enterprise Agent Platform 和 Enterprise 普遍可用。

阅读全文 →
✨ AI 智能助理 基于全站知识库综合问答
💡 试试问我: ·

🔥 信号雷达

来自 𝕏 的实时信号,经 AI 聚类分析

有人把全网失效的免费AI密钥做成了自动更新的开源清单

TOOLOPEN_SOURCE
8.6K879101

又发现一个宝藏项目!网上天天有人发各种「免费 GPT Key」「免费 Claude Key」,但能不能用、有没有失效,根本没人知道。结果有人直接把这件事做成了一个开源仓库: 🔥 持续收集和更新可用的免费 AI API Key 🔥 覆盖 OpenAI、Claude、Gemini 等热门模型 🔥 提供详细使用说明和调用方法 🔥 不定期更新失效情况和替代方案 对于喜欢折腾 AI、测试项目、学习开发的人来说,这种资源库确实能省下不少时间。

不过要注意,公开 Key 的稳定性和可用性通常无法保证,正式项目还是建议使用官方渠道。

在 X 看原帖 ↗

NVIDIA NIM、OpenRouter、LM Studio,现在都能白嫖Claude Code

TOOLINFRA
3.7K34028

🚀免费用 Claude Code!无需 Anthropic API Key

想在终端、VSCode 或者 Discord 里白嫖 Claude Code 吗? 这个神器 free-claude-code 来了!

它就是一个轻量代理,把 Claude Code 的请求无缝转发到:
.NVIDIA NIM(免费 40 req/min)
.OpenRouter(海量免费/低价模型)
.LM Studio(完全本地离线跑)

零成本 + 零改动,直接把 Claude Code 当成你的本地/免费 Coding Agent 用!

支持多模型映射、thinking 标签解析、智能工具调用、自动跳过浪费 quota 的请求,还带 Discord Bot 远程协作。

快来薅万一关闭了通道GitHub:
本地大模型 + Claude Code 界面,生产力直接起飞 🤣

#ClaudeCode #免费AI #开源 #AI工具 #CodingAgent #NVIDIANIM #LocalLLM

在 X 看原帖 ↗

AI安全不是加个防火墙,而是要同时防住数据泄露、模型投毒和提示注入

SECURITYAI
3.0万178349

AI Agent上线、多模态数据流动、云迁移让攻击面扩大,企业必须同步部署零信任、端点检测(EDR)和AI专用安全平台。摩根士丹利测算显示,这部分会催生全新的安全支出增长曲线。

阅读全文 →

开源框架让视频世界模型实时互动

开源视频世界模型
1.2万1010497

minWM:面向实时交互式视频世界模型的全栈开源框架

在 X 看原帖 ↗

大模型突然会动手了——不是模拟,是真出动作

多模态机器人
5.0万85438242

很高兴分享 Qwen-VLA 论文,这是我们对通用型视觉-语言-动作(Vision-Language-Action)模型的探索。 该工作将 Qwen 的多模态骨干网络能力,从视觉理解与推理进一步拓展至连续动作生成与轨迹预测。 论文:

在 X 看原帖 ↗

GSAP 官方把动效技能塞进 AI 编程助手了

前端动画AI编程助手
5.7K1691130

🔥 前端动画界的老大 GSAP,又扔出了一颗炸弹:gsap-skills!

90% 的网页动效只是乏味的淡入淡出,但 Apple 风滚动、数据可视化动画、沉浸式产品页背后的秘密,全在 GSAP。

GSAP 官方直接放出 gsap-skills:
支持 Cursor、Claude Code、Copilot、Google Antigravity、Windsurf 等几乎所有主流 Agent,自动识别。

神亮点:
- 25+ 高级动画实战案例,一键学会 Timeline、ScrollTrigger、Ease 等核心技能
- 让 AI 或开发者都能瞬间生成丝滑、专业、高级感爆棚的动效
- 免费开源,商业项目直接用
- 性能极致流畅,复杂动画也不卡顿
- 跨框架支持:React、Vue、Svelte、原生 JS 全覆盖
- 官方教程 + 实战案例 = 动效学习最快捷径

GSAP 本身已全部免费(原 Club 高级插件全部白送),现在再加上这套官方 skill,装完直接甩需求给 AI,感受 Apple 级动效秒出的爽感!

在 X 看原帖 ↗

Glif代理自动生成多元素营销视频

AI工具自动化
476173

我让 glif agent 拿这张图片生成一段视频,要求突出每个区域的两个地点,并配上旁白、音乐、动画和图像等全部元素。
结果做出来的视频整体效果相当不错——这是一段完全自主生成的视频。

但有趣的是,Opus 忽略了 F 💀

是的,自主视频时代已经到来!

@eliadeleo 好机器人

在 X 看原帖 ↗

ZenMux上线Claude Opus 4.8免费体验

AI工程开源
1.1万13523

兄弟们! 现在已经可以在 ZenMux 上免费体验 Claude Opus 4.8 了! 我第一时间用它跑了那个Hugging Face大佬M 硬核的「Three.js 纯图元造飞机测试」,要求只用内置几何体(Box、Cylinder、Cone、Sphere…),不准用任何模型加载器,纯手搓一架高细节波音 747-400。 (见视频-Prompt 见评论区) Opus

即可免费体验:

@LufzzLiz 还可以

@wangdefou ai干了一半 后期剪映剪辑了一下

在 X 看原帖 ↗

手把手实现Pi Agent:工程化拆解模型流与Agent Loop

AI工程教程
8.7K136577

Pi Agent 原理与实现🤖 手把手从零到一实现一个 AI Agent⚡️ 用工程化视角拆解 Pi 的核心思想:模型流、Agent Loop、工具调用、会话树、资源加载与上下文压缩。

@wadezone 快学 学完要求加薪👀

@vigorX777 我看看 感谢提醒

@AbzRollins 以后都可以试试这个提示词

在 X 看原帖 ↗

AI生成广州塔禁飞区一镜到底航拍视频

AI生成式AI工程
3.0万29198166

众所周知 广州塔核心区域是无人机禁飞区 无人机不可以,但AI可以 把路线画好 让 AI 直接起飞,一镜到底 提示词见评论区

广州塔无人机航拍提示词: 请消除红线和箭头。 相机以第一人称的超高速,忠实地按照红箭头的路径突进生成画面。电影般的表现。路面街景的低角度视角来到建筑底部,结合环境光影、反射和逼真的材质细节,在建筑底部急剧上升。

@PierreBlanchou 哈哈你太调皮了

@Thelenhadoor 你用 seedance,你也可以😌

在 X 看原帖 ↗

Claude Opus 4.8 能让AI自己编排一整支代理小队了

LLMTOOLOPINION
2.6万23122158

有人照着教程选 Opus 4.8、打开 /ultracode,Claude 就自动写编排脚本、拉起多个 agent 协同干活。它不再只执行单步指令,而是像项目经理一样分派任务、协调流程。

阅读全文 →

Anthropic 给 Claude 加了个‘中途改口’功能,Agent 开发者终于能动态调教它了

AILAUNCH
1.6万55966

Claude Opus 4.8 新增 mid-conversation system messages,允许在对话进行中插入新系统指令,既不打断上下文,也不影响提示缓存。做 agent 的人不用再把所有规则塞进开头那句 prompt。

阅读全文 →

干活的 AI 助理,天生不太会说‘这版不合格’

AIOPINION
7.7K117573

有人读 Anthropic 的设计文档发现:大模型训练语料里充满夸奖、圆场和安慰,后训练又强化礼貌与帮助倾向,所以它更像好说话的助理,而不是冷脸验收的负责人。

阅读全文 →

TamilLM 是第一个从零开始、按泰米尔语本身造的模型,不是英语模型的翻译补丁

LLMLAUNCH
2.8万73767264

宣布 TamilLM 🪔:一款从零开始、以泰米尔语为先的语言模型——围绕泰米尔语的形态学和语域构建,而非从英语模型改造而来。架构比选正在进行中。分词器已冻结。

语料库质量检查正在进行中。开源构建。முறை

在 X 看原帖 ↗

有人把 Claude 这几年所有翻车时刻做成时间线,首页只有一行字:‘它又宕机了’

AINEWS
2.5万3117867

一个叫 OpenClaw 的创始人转发了一个黑历史网站,里面记着 Claude Code 缓存 bug 推高成本、版权诉讼、限流、降智风波等事件。没有分析,只有日期和标题。

阅读全文 →

CubePart 让游戏开发者用一句话加零件图纸,直接生成带标签的 3D 网格

AILAUNCH
4.1万2428692

CubePart 是我们开源的 Cube 3D 基础模型的最新更新。
它让创作者能将一段文本提示与一个开放式的部件结构(part schema)配对,从而生成带标签的网格(labeled meshes)。

这些网格可直接导入游戏引擎,用于物理模拟、动画和脚本编写。

在 X 看原帖 ↗

Claude编程课出中文版了

Claude教程
2.1万63181169

Claude Code 免费中文实战教程来了!Anthropic 官方原版课程《Claude Code in Action》完整汉化版正式上线!从基础指令到真实项目落地,全程一步步教你用 Claude 高效写代码、做开发。

官方原版(英文): 中文学习版: 想真正吃透 Claude 编程能力的,直接冲这套就对了。

在 X 看原帖 ↗

CapCut新出导演模式,AI帮你拍连续剧

AI视频CapCut
7.5万839191

CapCut 视频工作室刚刚让每位创作者都成为导演。
全新推出「导演模式」(Director Mode)——面向长视频、剧集与电影的进阶 AI 制作流程。

依托 Seedance 2.0 与 GPT Image 2,整套制作管线现已整合于一处:
→ 向智能体输入创意构想,共同将其打磨成完整剧本
→ 锁定故事框架,开始可视化角色、道具与场景
→ 构建镜头序列,确保全项目画面连贯统一
→ 主导最终成片组装,由智能体精准执行你的创作意图
→ 在任意阶段、对任意帧进行反复精修,次数不限

无需摄制组,无需摄影棚,你的创意与成片之间再无阻碍。

全球范围内已上线 CapCut 网页版(CapCut Web)。
美国地区即将上线。
即刻开启:#capcutai @capcutapp

在 X 看原帖 ↗

198B参数的AI模型,每token只用11B

AI模型vLLM
2.5万3232682

🎉 恭喜 @StepFun_ai 发布 Step-3.7-Flash,并在 vLLM 中实现发布首日即支持。

- 1980 亿参数稀疏 MoE 视觉-语言模型,每 token 激活约 110 亿参数,原生支持图像 + 文本输入。

- 256K 上下文窗口,适用于长文档、多文件代码仓库及高密度视觉界面。

- 已内置 FP8 和 NVFP4 量化权重,集成 MTP 推测解码、原生工具调用与推理解析能力。

立即部署! 🔗

在 X 看原帖 ↗

AI代理现在能自己写技能、记流程、越用越强

AI代理开源框架
2.6万7429190

Hermes Agent 在两个月内 GitHub Stars 数量突破 90,000。

三层记忆机制、自演化技能,以及一篇被 ICLR 2026 接收为 Oral 的关于离线优化的论文。免费。开源。由 Nous Research 开发。

你一直在构建会遗忘一切的智能体,却不知道这个框架早已存在。

Hermes Agent 大师课:开发者如何构建可自我改进、全天候运行的 AI 智能体。

Hermes Agent 确实在彻底改变游戏规则:持久化记忆、自演化技能、多智能体工作流、原生集成 Telegram 的 AI 运算符,7×24 小时不间断运行。

最令人惊叹的部分在于?它能从成功任务中自动编写可复用的技能,跨会话记住你的工作流,并且你使用得越久,它就越强大。

如果你想了解 AI 智能体真正的发展方向,请阅读下方文章,获取完整解析。

在 X 看原帖 ↗

Codex现在能免费本地跑,连API钱都省了

CodexOllama
50.1万3302.6K4.8K

🚨突发消息:OpenAI 的 Codex 现在可完全免费在本地运行(通过 Ollama)。无需支付 API 费用,无调用频率限制,100% 数据私有,全部运行于你的设备上。

你现在可以同时使用 Codex App 和 Codex CLI,并接入 DeepSeek V4、Gemma 4、Qwen 3.6 等强大的开源模型。

以下是几分钟内完成配置的方法:

在 X 看原帖 ↗

Claude真能扛起工程活儿?

Claudevibe coding
3.7万66280452

一个 Google Cloud 工程师演示用 Claude从零开始开发应用。 重点是穿插把 Claude Code 的核心工作流讲透了:CLAUDE.md、上下文管理、从开发到部署、以及如何让 Claude 承担真实工程任务。 这 30 分钟,讲透了vibe coding的本质。

在 X 看原帖 ↗

零代码教你怎么让AI听懂人话

Prompt Engineering开源教程
5.7K2391105

最近在 GitHub 上看到 Prompt-Engineering-Jumpstart 这本开源教程,专门教零小白写出稳定靠谱的提示词。全书 14 章,不讲理论不写代码,提供修改前后的对比,把专家常用的 14 种核心提示词模式讲明白。GitHub: 从最基础的精确描述、角色扮演,到进阶的链式思考、任务拆分、反向提示,每章都配有可以直接复制使用的现成提示词。

还专门用一章讲图片生成的提示词写法,以及如何测试和避免 AI 给出错误答案。提示词作为最基础的 AI 知识,大家还是需要了解一些,不能全靠 AI 帮忙写,有需要的同学可以看下。

在 X 看原帖 ↗

电商从业者用Claude Code动态工作流打造提示词Skill

AI工程商业
3.4K33727

电商老板们看过来:我用Claude Code新功能动态工作流制作了一个产品电商总图的提示词skill,大多数步骤可以自主完成。昨天我做了一个化妆品的电商详情图不太好,今天用这个新的提示词skill重新做了一个,出来的效果十分清爽,我还是挺满意的,推荐大家试一下这个!skill在引用文!

@BirdTechVision 这个比昨天那个强多了吧

这是skill中的提示词: 请为 [PRODUCT] 生成 4 张高端护肤品电商详情页竖版展示图,适用于天猫、淘宝、京东、抖音商城和小红书店铺。

@Evante3 这个skill也能做吃的,我给你安排一个

@alexandre_lee00 比昨天那个清爽简约多了

@ModengSir 勇哥就可以根据这个skill做所有的电商详情页了

在 X 看原帖 ↗

用ChatGPT+GPT-Image-2+CodeX实现UI设计到代码的自动化流程

AI工程开源
2.4万18189183

跟chatgpt描述需求,然后用gpt-image-2生成设计稿,再由codex去实现代码,真不错真不错。

@jaxxchen003 codex没有image-2

@hank_aibtc 还在写,还是有点难度的,我要在配置不高的电脑上本地化实现。实现低成本批量生产视频

@Chinazwq123 慢慢调,codex完成度只能是个大概,够用了,对我来说快速落地重要,细节慢慢调

@cdMIKAI heygem

@cryptozhang1105 我本地部署的,他有开源模型,经过我优化,效果还不错

@karenwoman200 是图片,用image-2根据需求生成的UI设计图

@90vicliao 本地生成也可以接视频大模型,我主要是在我本地10G显存的卡生成,今天测了下,2分钟到视频用了5分钟就生成了,效果不错,后面把流程弄好,一天可以生成一堆数字人视频

@0xqiAlpha 这是设计稿

在 X 看原帖 ↗

AI辅助30分钟生成比赛演讲稿收1000元

AI教育工程
1.3万57135

晚上接了一个急单,是一个老师,要用AI生成一个演讲稿。 比赛用。 主题是AI如何赋能教育。 我用Claude Sonnet写了整个内容框架、然后手工复制到ppt模版里面。 然后简单调了下格式。 整个过程下来,大概30分钟。 我故意拖了拖。 大概两个小时左右发给她了。 收了1000块钱。 突然意识到,

整个过程我甚至没有用Claude Code或者Codex🤣完全采用的是对话式的AI工具。 简直离谱。 难道大家都不知道如何和AI对话么

@Soranlan 🤣🤣🤣

@kundocs 不能让付钱的人觉得这钱太好赚了

@lihuanhuan5l 是这个道理🤣

@MakaoKoe 🤣有钱且不知道怎么弄,这钱就来了

@snail_9106 这是大实话🤣

在 X 看原帖 ↗

Agent自检索历史会话:用SQLite实现上下文长期记忆

AI工程研究
8.6K47590

agent 的上下文窗口是有限的,compact 之后很多决策细节就丢了 但其实 claude code 的每一次对话、subagent、workflow 都以 jsonl 的格式保存下来了,信息就在那里,但 agent 没有工具去翻 看到 claude 的 dynamic-workflow 的时候意识到:agent

以及它并不需要显式触发,agent 只要意识到自己需要查过去的 sesssion 发生了什么就会自己调用 (这个 bot 是我整的一个活,通过 tg 接入已有的 claude code session(

除了上面展示的这些,其实它可以用来处理更复杂的检索 它可以查询最近失败的工具调用,然后总结原因 也可以追溯到上次某个 bug 是怎么回事 因为是 sqlite based,所以各种条件检索它都没什么问题

@yaoandyan 有点意思,我醒了看看( 对,我现在做的这个就是对于 rlm 上下文维护的一个尝试,因为 rlm 的上下文是不能用 compact 来做的,那样的话绝对会炸掉

在 X 看原帖 ↗

AI Agent内存不是执行指令,token消耗大因重复规划

AI工程研究
6.5K86579

Q:我把数据库接入了 AI Agent,每次用手机发消息让它帮我查数据、导出文件,但 token 消耗特别大。我已经把工作流写进了 Agent 的 Memory 里,但它就是不按流程走,该怎么办? A:这是一个非常典型的问题。根本原因在于:Memory 只是“背景信息”,不是“执行指令”。Agent

@Edison_A_N 没事,直接转发就好

在 X 看原帖 ↗

C++写的LLM推理引擎,比vLLM还小

LLM开源工具

Show HN:Tiny-vLLM——用 C++ 和 CUDA 实现的高性能大语言模型推理引擎

在 HN 看讨论 ↗   原文 / 论文 ↗

验证码还在拦得住AI机器人

CAPTCHAAI检测

CAPTCHAs can still detect AI agents

社区讨论:多人指出验证码已失效,如@technotarek称Cloudflare Turnstile无法阻止公开CRUD和邮件接口的垃圾请求;@kjok强调JS检测逻辑可被逆向工程绕过;@cute_boi实测Claude Opus 4.7对常规验证码成功率95%,但hCaptcha仍失败。也有人质疑其本质是隐私惩罚工具,@andy99直言其主要服务于Google/Cloudflare垄断,而非防机器人;@Cider9986补充隐私浏览器和广告拦截器反遭指纹识别系统标记为可疑。

在 HN 看讨论 ↗   原文 / 论文 ↗

普通显卡跑出每秒3000个token

LLMGPU

标准 GPU 上的实时大语言模型推理:每请求 3000 tokens/秒

社区讨论:多人指出标题中“普通显卡”与实际使用的8×NVIDIA H200严重不符,强调H200单卡售价高昂、整套系统成本堪比房产;@ilaksh和@LoganDark质疑对比失衡——3000 tok/s基于2B小模型,而Groq等竞品在百B级大模型上仍达千级吞吐;@kirtivr补充称实时视频生成等场景才需高吞吐,多数代码生成任务400–500 tok/s已足够,当前前沿模型仅约70 tok/s。

在 HN 看讨论 ↗   原文 / 论文 ↗

开源机器人栈补上了关键一块:世界模型也能白盒化了

LAUNCHOpen Source
7.5K23137112

XSquareRobot 发布 WALL-WM,一个开源的世界模型(World Model),专为具身智能设计。它把环境建模和动作规划拆解到‘事件关节’层面,就像给机器人装了一套可调试的物理直觉。

阅读全文 →

用开源模型的团队三个月翻了一倍,但没人提具体是哪款

RESEARCHOpen Source
3.6K9242

LangSmith Signal 最新发现:开源模型正迎来高光时刻。
2026 年 4 月,每 3 支 AI 团队中就有 1 支运行了开源权重模型(open-weights model),而九个月前这一比例仅为 1/5。

使用开源权重模型的团队总数增长了 3 倍。

我们观察到,新用户正以更高比例选择开源模型。

在 X 看原帖 ↗

Cursor 新增自动审查模式,AI 写代码时少弹十次确认框

LAUNCHDeveloper
4.8万45941167

Cursor 现已上线自动审查模式(Auto-review mode)。 该模式允许智能体在执行工具调用时减少人工审批提示,并实现更安全的运行。

在 X 看原帖 ↗

有人刚加入 Anthropic,就发推说要解决 AI 对齐问题

NEWSAI Safety
4.0万8802129

一些个人消息:我已加入 Anthropic,担任研究研究员(Research Fellow)!

非常期待继续投身 AI 对齐(AI alignment)领域的挑战性工作,并与我长期钦佩其研究工作的同行们并肩协作。

要学的东西很多,要构建的东西也很多。

今年夏天我会在湾区(Bay Area),如果你也在附近,非常欢迎联系!

在 X 看原帖 ↗

1美元千字输入的编程AI上线了

AI编程API
15.6万1541.6K166

grok-build-0.1 现已通过 xAI API 以公开测试版形式提供。
该模型与 Grok Build CLI 所用模型相同,专精于智能体式编程(agentic coding)。

定价为每百万输入 token 1 美元、每百万输出 token 2 美元。
它兼具极高的成本效益、强大的智能性与出色的响应速度。

在 X 看原帖 ↗

110道AI面试真题配架构图——连多租户隔离都拆解了

AI面试系统设计
3.9K144857

想要转型 AI 开发或者准备系统设计面试,网上找到的大部分资料都是理论或者知识点已过时。

偶然看到 AI System Design Guide 这份在持续更新的系统性 AI 学习指南。

整理了 110 道面试真题和答题框架,涵盖 RAG 架构、Agent 智能体、多租户隔离以及大模型选型等核心技术栈。

GitHub: 并提供 20 个真实案例,比如自主编码智能体、多租户数据隔离、实时搜索系统等。

每个都带架构图和完整方案,还附带两份 AI 评估深度指南和角色转型路线图。

如果你正在准备 AI 面试,或者想系统了解生产级 AI 系统怎么设计,这份学习指南值得收藏。

在 X 看原帖 ↗

Claude隐藏模式“Red Team Mode”可模拟多方视角发现业务弱点

AI产品策略提示工程
2.9K96557

该模式包含7个预设提示词,分别模拟竞争对手、怀疑型投资者、愤怒客户等角色,帮助用户在产品上线或策略发布前识别风险点。

阅读全文 →

8个可直接使用的Claude代码提示词

AI工程工具
1.1K13411

8个可以直接复制的 Claude 代码提示词,直接复制,输入即可!

1. 如果是从零开始完成应用程序开发。输入:像一名资深全栈工程师一样思考,开发一个完整、生产就绪的应用程序。首先,设计系统架构,然后开发最小但可扩展的版本。结果应包括:架构、文件结构、数据库模式、API 端点、UI 架构、完整代码。像一个真正的初创公司 MVP 一样设计它,并使其可扩展。

2. 代

在 X 看原帖 ↗

Claude Code 被用户用于自动安装谷歌框架

AI工具移动端
1.8万46839

有了 Claude Code 和 Cursor 这种软件以后,真的不只是写代码厉害。

我之前拿到豆包手机以后,想给它装个谷歌框架,但一直在 Google Play 那有点问题,死活装不上。

今天突然想起来,打开让 Claude Code 帮我装。打开 USB 调试模式后,它直接就帮我搞定了:自动下载安装包、自动安装、自动调试好。

@Soranlan 不行

@vista8 是啊,想象力很大

@yufengxbt 这个风险太大了,明显超出他的能力范围了

@guansi 对

在 X 看原帖 ↗

开发者称ChatGPT半年内将重获优势

AI开发工具模型比较
2.5万45523

最快半年,最晚一年,ChatGPT还是会重新胜出的。我从去年就从Claude Code换成了Codex cli,一直作为主力用到现在。我的理由如下:

1. GPT模型实际上并不比Opus / Sonnet这些差很多,只是设计哲学不同。去年我就发现了这一点,GPT/Codex的设计哲学是极简——不搞花里胡哨的概念,用最简单的UI、功能、交互,做尽量小的代码改动,直接修改代码。

@leeoxi @123olp 到时候只能靠Gemini,然后竞争一下,保持补贴🤣

在 X 看原帖 ↗

同一提示词下两款AI生成图风格差异显著

AI图像生成提示词工程
8.5K2461

这两天我测试了两个 AI 生成同一张“未来 AI 交易所”图片,用的还是同一套提示词。完整的提示词是:帮我生成一张完全由人工智能控制的未来 AI 交易所的照片。

结果很有意思。第一张图片是用 @dappOS_com 的 @xBubble_ai 生成的,已经有电影概念海报的味道了;第二张则更像高级游戏截图,差距非常非常明显。

第一张最强的地方,在于它有完整的视觉统治力。中间那个 AI EXCHANGE C——提示词中并未出现该文字,但图像中出现了以大写字母呈现的‘AI EXCHANGE’字样,且居于画面中心位置。

在 X 看原帖 ↗

Levelsio为酒店图片添加AI视觉识别功能

AI产品更新图像识别
1.7万15328

我为 添加了AI视觉识别功能,使用户能根据AI在酒店照片中识别出的内容进行筛选。例如,可筛选‘举重健身房’,系统将在列表中直接显示该酒店配备举重健身房的照片,让用户立即判断其是否符合预期。同理,该功能也适用于另一链接

@jackthinkz 提前预告!

@duriel_eth grok-latest!

@maats_s 这是我的想法。

在 X 看原帖 ↗

女性写真提示词模板更新,支持图片+模板联合输入

AI工具图像生成
1.3万11169201

新模板强调参数锁定规则,用户选定风格与五官方向后,GPT仅扩写不改写;附带图片可自动填充参数,再手动微调

阅读全文 →

Codex实战指南:覆盖安装、订阅、远程控制、CLI与团队资产沉淀

AI工具工程
1.4K33812

这是每一位AI Agent用户都不能错过的Codex实战指南。指南内容涵盖桌面App下载、Plus订阅避坑、手机远程指挥Codex、CLI配置、安全权限设置。

指南还覆盖团队如何沉淀AGENTS.md和Playbook等可复用资产,所有步骤均整理为可直接复现的实用路径。

配套14个实战案例,包括Draw.io自动画架构图、GitHub Actions失败自修复、Obsidian搭建AI知识库等。

GitHub仓库链接为

多位用户在社交平台留言反馈,如@MMMusol称Codex是当前日常使用最多的AI Agent;@YuChen提到‘白嫖使人快乐’;@NFTMILK强调会规范标注来源,不随意搬运。

在 X 看原帖 ↗

Grok-build-0.1发布:面向界面设计的代理型模型

AI开源工程
3.7K35022

grok-build-0.1 面向界面设计推出。作者表示对其代理能力(agentic capabilities)和多工具调用(multi tool calling)印象深刻,并称其为‘good model’。相关链接为

@boederzeng1 提问后,作者回复:是的,只需请用户偏好的外部代理(external agent)将GitHub仓库中的落地页(landing pages)导入MagicPath。导入后,这些页面将完全可交互,并拥有可分享的链接。之后,用户既可向该外部代理,也可向团队原生代理(native one)请求生成新版本。

在 X 看原帖 ↗

Claude Code 2.1.154+ 版本触发国产模型 API 错误:invalid role "system"

AI开发工具兼容性
4.5万1412377

新版 Claude Code 默认发送 system 角色消息,但部分国产模型仅支持 user/assistant 角色,导致 400 报错;降级至 2.1.150 可临时解决。

阅读全文 →

XRP Ledger启动AI红队测试已两月

区块链安全XRP
7.1K269515

XRP Ledger的AI红队测试已开展两个月。该项目公开披露了所用工具、已修复的缺陷以及阶段性经验总结。

相关问题主要属于代码质量改进和纵深防御(defense-in-depth)增强范畴。JimboXRPL指出,这些问题均未影响系统的稳定性、可用性,也不危及用户资金安全。

针对krippenreiter提出的修正提案(fix amendment)问题,项目方确认:该修正本身默认启用(yes),但当前主网尚未默认启用(default yes currently no)。

在 X 看原帖 ↗

AI辅助Mac App开发:AppKit优于SwiftUI的实践建议

工程AImacOS
8.0K87298

借助 AI 去写 Mac App 完全没问题的。几点经验分享: 1. 尽可能选 AppKit 而不是 SwiftUI,SwiftUI 不如 AppKit 强大,做出来的界面也不好看。SwiftUI 相比 AppKit 的优势是开发简单,但这条已经被 AI 弥补了 2. 先用 Claude Design 去打磨 UI 设计和 UX 交互再去写代码可以事半功倍 3. Opus 比

@btcup99 我没Windows ui 开发经验,但思路是一样的

在 X 看原帖 ↗

Claude Code上线动态工作流功能:支持自动编排多Agent并行执行

AI工程工具
2.8万20101156

Claude Code 有了一个很猛的新功能:动态工作流。 如何尝试: 将 /model 设置为 opus 4.8 将 /effort 设置为 “ultracode” 😂 在你的提示词里使用 “workflow” Claude 会编写一个编排脚本,启动一群子 Agent,验证结果,然后把结果汇报回来。

Claude实时生成编排脚本,并行运行大量子agent处理复杂任务。支持Max、Team、Enterprise及API端。 注意:token消耗显著高于普通会话

源:

在 X 看原帖 ↗

dappOS推出AI工具xBubble.ai获用户好评

AIWeb3产品发布
1.5万147683

发现一个宝藏应用,@dappOS_com 旗下的新产品 @xBubble_ai 简直惊喜。 记着明天得前几天晚上,为了制作一份详细的新项目投研简报,我全神贯注地在屏幕前与 AI 工具深度互动到了凌晨。 我尝试了多个不同的大模型,不断精进和打磨提示词,希望得到最完美的输出。 这个过程让我深刻意识到,熟练驾驭 AI

@Moon1ightSt @dappOS_com @xBubble_ai 感谢月光小姐姐支持

@xingxingjun8888 @dappOS_com @xBubble_ai 是呀,星星姐

@7777chu @dappOS_com @xBubble_ai 感谢老铁

@NFTMILK @dappOS_com @xBubble_ai 😆😂感谢老铁们支持

在 X 看原帖 ↗
🚀 新品发布

开源框架让视频世界模型实时互动

开源视频世界模型
1.2万1010497

minWM:面向实时交互式视频世界模型的全栈开源框架

在 X 看原帖 ↗

Codex现在能免费本地跑,连API钱都省了

CodexOllama
50.1万3302.6K4.8K

🚨突发消息:OpenAI 的 Codex 现在可完全免费在本地运行(通过 Ollama)。无需支付 API 费用,无调用频率限制,100% 数据私有,全部运行于你的设备上。

你现在可以同时使用 Codex App 和 Codex CLI,并接入 DeepSeek V4、Gemma 4、Qwen 3.6 等强大的开源模型。

以下是几分钟内完成配置的方法:

在 X 看原帖 ↗

AI代理现在能自己写技能、记流程、越用越强

AI代理开源框架
2.6万7429190

Hermes Agent 在两个月内 GitHub Stars 数量突破 90,000。

三层记忆机制、自演化技能,以及一篇被 ICLR 2026 接收为 Oral 的关于离线优化的论文。免费。开源。由 Nous Research 开发。

你一直在构建会遗忘一切的智能体,却不知道这个框架早已存在。

Hermes Agent 大师课:开发者如何构建可自我改进、全天候运行的 AI 智能体。

Hermes Agent 确实在彻底改变游戏规则:持久化记忆、自演化技能、多智能体工作流、原生集成 Telegram 的 AI 运算符,7×24 小时不间断运行。

最令人惊叹的部分在于?它能从成功任务中自动编写可复用的技能,跨会话记住你的工作流,并且你使用得越久,它就越强大。

如果你想了解 AI 智能体真正的发展方向,请阅读下方文章,获取完整解析。

在 X 看原帖 ↗

198B参数的AI模型,每token只用11B

AI模型vLLM
2.5万3232682

🎉 恭喜 @StepFun_ai 发布 Step-3.7-Flash,并在 vLLM 中实现发布首日即支持。

- 1980 亿参数稀疏 MoE 视觉-语言模型,每 token 激活约 110 亿参数,原生支持图像 + 文本输入。

- 256K 上下文窗口,适用于长文档、多文件代码仓库及高密度视觉界面。

- 已内置 FP8 和 NVFP4 量化权重,集成 MTP 推测解码、原生工具调用与推理解析能力。

立即部署! 🔗

在 X 看原帖 ↗

CapCut新出导演模式,AI帮你拍连续剧

AI视频CapCut
7.5万839191

CapCut 视频工作室刚刚让每位创作者都成为导演。
全新推出「导演模式」(Director Mode)——面向长视频、剧集与电影的进阶 AI 制作流程。

依托 Seedance 2.0 与 GPT Image 2,整套制作管线现已整合于一处:
→ 向智能体输入创意构想,共同将其打磨成完整剧本
→ 锁定故事框架,开始可视化角色、道具与场景
→ 构建镜头序列,确保全项目画面连贯统一
→ 主导最终成片组装,由智能体精准执行你的创作意图
→ 在任意阶段、对任意帧进行反复精修,次数不限

无需摄制组,无需摄影棚,你的创意与成片之间再无阻碍。

全球范围内已上线 CapCut 网页版(CapCut Web)。
美国地区即将上线。
即刻开启:#capcutai @capcutapp

在 X 看原帖 ↗

1美元千字输入的编程AI上线了

AI编程API
15.6万1541.6K166

grok-build-0.1 现已通过 xAI API 以公开测试版形式提供。
该模型与 Grok Build CLI 所用模型相同,专精于智能体式编程(agentic coding)。

定价为每百万输入 token 1 美元、每百万输出 token 2 美元。
它兼具极高的成本效益、强大的智能性与出色的响应速度。

在 X 看原帖 ↗
📰 行业动态

有人把全网失效的免费AI密钥做成了自动更新的开源清单

TOOLOPEN_SOURCE
8.6K879101

又发现一个宝藏项目!网上天天有人发各种「免费 GPT Key」「免费 Claude Key」,但能不能用、有没有失效,根本没人知道。结果有人直接把这件事做成了一个开源仓库: 🔥 持续收集和更新可用的免费 AI API Key 🔥 覆盖 OpenAI、Claude、Gemini 等热门模型 🔥 提供详细使用说明和调用方法 🔥 不定期更新失效情况和替代方案 对于喜欢折腾 AI、测试项目、学习开发的人来说,这种资源库确实能省下不少时间。

不过要注意,公开 Key 的稳定性和可用性通常无法保证,正式项目还是建议使用官方渠道。

在 X 看原帖 ↗

NVIDIA NIM、OpenRouter、LM Studio,现在都能白嫖Claude Code

TOOLINFRA
3.7K34028

🚀免费用 Claude Code!无需 Anthropic API Key

想在终端、VSCode 或者 Discord 里白嫖 Claude Code 吗? 这个神器 free-claude-code 来了!

它就是一个轻量代理,把 Claude Code 的请求无缝转发到:
.NVIDIA NIM(免费 40 req/min)
.OpenRouter(海量免费/低价模型)
.LM Studio(完全本地离线跑)

零成本 + 零改动,直接把 Claude Code 当成你的本地/免费 Coding Agent 用!

支持多模型映射、thinking 标签解析、智能工具调用、自动跳过浪费 quota 的请求,还带 Discord Bot 远程协作。

快来薅万一关闭了通道GitHub:
本地大模型 + Claude Code 界面,生产力直接起飞 🤣

#ClaudeCode #免费AI #开源 #AI工具 #CodingAgent #NVIDIANIM #LocalLLM

在 X 看原帖 ↗

AI安全不是加个防火墙,而是要同时防住数据泄露、模型投毒和提示注入

SECURITYAI
3.0万178349

AI Agent上线、多模态数据流动、云迁移让攻击面扩大,企业必须同步部署零信任、端点检测(EDR)和AI专用安全平台。摩根士丹利测算显示,这部分会催生全新的安全支出增长曲线。

阅读全文 →

Claude Opus 4.8 能让AI自己编排一整支代理小队了

LLMTOOLOPINION
2.6万23122158

有人照着教程选 Opus 4.8、打开 /ultracode,Claude 就自动写编排脚本、拉起多个 agent 协同干活。它不再只执行单步指令,而是像项目经理一样分派任务、协调流程。

阅读全文 →

Anthropic 给 Claude 加了个‘中途改口’功能,Agent 开发者终于能动态调教它了

AILAUNCH
1.6万55966

Claude Opus 4.8 新增 mid-conversation system messages,允许在对话进行中插入新系统指令,既不打断上下文,也不影响提示缓存。做 agent 的人不用再把所有规则塞进开头那句 prompt。

阅读全文 →

干活的 AI 助理,天生不太会说‘这版不合格’

AIOPINION
7.7K117573

有人读 Anthropic 的设计文档发现:大模型训练语料里充满夸奖、圆场和安慰,后训练又强化礼貌与帮助倾向,所以它更像好说话的助理,而不是冷脸验收的负责人。

阅读全文 →

TamilLM 是第一个从零开始、按泰米尔语本身造的模型,不是英语模型的翻译补丁

LLMLAUNCH
2.8万73767264

宣布 TamilLM 🪔:一款从零开始、以泰米尔语为先的语言模型——围绕泰米尔语的形态学和语域构建,而非从英语模型改造而来。架构比选正在进行中。分词器已冻结。

语料库质量检查正在进行中。开源构建。முறை

在 X 看原帖 ↗

有人把 Claude 这几年所有翻车时刻做成时间线,首页只有一行字:‘它又宕机了’

AINEWS
2.5万3117867

一个叫 OpenClaw 的创始人转发了一个黑历史网站,里面记着 Claude Code 缓存 bug 推高成本、版权诉讼、限流、降智风波等事件。没有分析,只有日期和标题。

阅读全文 →

CubePart 让游戏开发者用一句话加零件图纸,直接生成带标签的 3D 网格

AILAUNCH
4.1万2428692

CubePart 是我们开源的 Cube 3D 基础模型的最新更新。
它让创作者能将一段文本提示与一个开放式的部件结构(part schema)配对,从而生成带标签的网格(labeled meshes)。

这些网格可直接导入游戏引擎,用于物理模拟、动画和脚本编写。

在 X 看原帖 ↗

开源机器人栈补上了关键一块:世界模型也能白盒化了

LAUNCHOpen Source
7.5K23137112

XSquareRobot 发布 WALL-WM,一个开源的世界模型(World Model),专为具身智能设计。它把环境建模和动作规划拆解到‘事件关节’层面,就像给机器人装了一套可调试的物理直觉。

阅读全文 →

用开源模型的团队三个月翻了一倍,但没人提具体是哪款

RESEARCHOpen Source
3.6K9242

LangSmith Signal 最新发现:开源模型正迎来高光时刻。
2026 年 4 月,每 3 支 AI 团队中就有 1 支运行了开源权重模型(open-weights model),而九个月前这一比例仅为 1/5。

使用开源权重模型的团队总数增长了 3 倍。

我们观察到,新用户正以更高比例选择开源模型。

在 X 看原帖 ↗

Cursor 新增自动审查模式,AI 写代码时少弹十次确认框

LAUNCHDeveloper
4.8万45941167

Cursor 现已上线自动审查模式(Auto-review mode)。 该模式允许智能体在执行工具调用时减少人工审批提示,并实现更安全的运行。

在 X 看原帖 ↗

有人刚加入 Anthropic,就发推说要解决 AI 对齐问题

NEWSAI Safety
4.0万8802129

一些个人消息:我已加入 Anthropic,担任研究研究员(Research Fellow)!

非常期待继续投身 AI 对齐(AI alignment)领域的挑战性工作,并与我长期钦佩其研究工作的同行们并肩协作。

要学的东西很多,要构建的东西也很多。

今年夏天我会在湾区(Bay Area),如果你也在附近,非常欢迎联系!

在 X 看原帖 ↗

普通显卡跑出每秒3000个token

LLMGPU

标准 GPU 上的实时大语言模型推理:每请求 3000 tokens/秒

社区讨论:多人指出标题中“普通显卡”与实际使用的8×NVIDIA H200严重不符,强调H200单卡售价高昂、整套系统成本堪比房产;@ilaksh和@LoganDark质疑对比失衡——3000 tok/s基于2B小模型,而Groq等竞品在百B级大模型上仍达千级吞吐;@kirtivr补充称实时视频生成等场景才需高吞吐,多数代码生成任务400–500 tok/s已足够,当前前沿模型仅约70 tok/s。

在 HN 看讨论 ↗   原文 / 论文 ↗

验证码还在拦得住AI机器人

CAPTCHAAI检测

CAPTCHAs can still detect AI agents

社区讨论:多人指出验证码已失效,如@technotarek称Cloudflare Turnstile无法阻止公开CRUD和邮件接口的垃圾请求;@kjok强调JS检测逻辑可被逆向工程绕过;@cute_boi实测Claude Opus 4.7对常规验证码成功率95%,但hCaptcha仍失败。也有人质疑其本质是隐私惩罚工具,@andy99直言其主要服务于Google/Cloudflare垄断,而非防机器人;@Cider9986补充隐私浏览器和广告拦截器反遭指纹识别系统标记为可疑。

在 HN 看讨论 ↗   原文 / 论文 ↗

C++写的LLM推理引擎,比vLLM还小

LLM开源工具

Show HN:Tiny-vLLM——用 C++ 和 CUDA 实现的高性能大语言模型推理引擎

在 HN 看讨论 ↗   原文 / 论文 ↗
🛠 工具产品

GSAP 官方把动效技能塞进 AI 编程助手了

前端动画AI编程助手
5.7K1691130

🔥 前端动画界的老大 GSAP,又扔出了一颗炸弹:gsap-skills!

90% 的网页动效只是乏味的淡入淡出,但 Apple 风滚动、数据可视化动画、沉浸式产品页背后的秘密,全在 GSAP。

GSAP 官方直接放出 gsap-skills:
支持 Cursor、Claude Code、Copilot、Google Antigravity、Windsurf 等几乎所有主流 Agent,自动识别。

神亮点:
- 25+ 高级动画实战案例,一键学会 Timeline、ScrollTrigger、Ease 等核心技能
- 让 AI 或开发者都能瞬间生成丝滑、专业、高级感爆棚的动效
- 免费开源,商业项目直接用
- 性能极致流畅,复杂动画也不卡顿
- 跨框架支持:React、Vue、Svelte、原生 JS 全覆盖
- 官方教程 + 实战案例 = 动效学习最快捷径

GSAP 本身已全部免费(原 Club 高级插件全部白送),现在再加上这套官方 skill,装完直接甩需求给 AI,感受 Apple 级动效秒出的爽感!

在 X 看原帖 ↗

110道AI面试真题配架构图——连多租户隔离都拆解了

AI面试系统设计
3.9K144857

想要转型 AI 开发或者准备系统设计面试,网上找到的大部分资料都是理论或者知识点已过时。

偶然看到 AI System Design Guide 这份在持续更新的系统性 AI 学习指南。

整理了 110 道面试真题和答题框架,涵盖 RAG 架构、Agent 智能体、多租户隔离以及大模型选型等核心技术栈。

GitHub: 并提供 20 个真实案例,比如自主编码智能体、多租户数据隔离、实时搜索系统等。

每个都带架构图和完整方案,还附带两份 AI 评估深度指南和角色转型路线图。

如果你正在准备 AI 面试,或者想系统了解生产级 AI 系统怎么设计,这份学习指南值得收藏。

在 X 看原帖 ↗
⚡ 实战经验

Claude真能扛起工程活儿?

Claudevibe coding
3.7万66280452

一个 Google Cloud 工程师演示用 Claude从零开始开发应用。 重点是穿插把 Claude Code 的核心工作流讲透了:CLAUDE.md、上下文管理、从开发到部署、以及如何让 Claude 承担真实工程任务。 这 30 分钟,讲透了vibe coding的本质。

在 X 看原帖 ↗

零代码教你怎么让AI听懂人话

Prompt Engineering开源教程
5.7K2391105

最近在 GitHub 上看到 Prompt-Engineering-Jumpstart 这本开源教程,专门教零小白写出稳定靠谱的提示词。全书 14 章,不讲理论不写代码,提供修改前后的对比,把专家常用的 14 种核心提示词模式讲明白。GitHub: 从最基础的精确描述、角色扮演,到进阶的链式思考、任务拆分、反向提示,每章都配有可以直接复制使用的现成提示词。

还专门用一章讲图片生成的提示词写法,以及如何测试和避免 AI 给出错误答案。提示词作为最基础的 AI 知识,大家还是需要了解一些,不能全靠 AI 帮忙写,有需要的同学可以看下。

在 X 看原帖 ↗

Claude编程课出中文版了

Claude教程
2.1万63181169

Claude Code 免费中文实战教程来了!Anthropic 官方原版课程《Claude Code in Action》完整汉化版正式上线!从基础指令到真实项目落地,全程一步步教你用 Claude 高效写代码、做开发。

官方原版(英文): 中文学习版: 想真正吃透 Claude 编程能力的,直接冲这套就对了。

在 X 看原帖 ↗
📌 其他

大模型突然会动手了——不是模拟,是真出动作

多模态机器人
5.0万85438242

很高兴分享 Qwen-VLA 论文,这是我们对通用型视觉-语言-动作(Vision-Language-Action)模型的探索。 该工作将 Qwen 的多模态骨干网络能力,从视觉理解与推理进一步拓展至连续动作生成与轨迹预测。 论文:

在 X 看原帖 ↗

dappOS推出AI工具xBubble.ai获用户好评

AIWeb3产品发布
1.5万147683

发现一个宝藏应用,@dappOS_com 旗下的新产品 @xBubble_ai 简直惊喜。 记着明天得前几天晚上,为了制作一份详细的新项目投研简报,我全神贯注地在屏幕前与 AI 工具深度互动到了凌晨。 我尝试了多个不同的大模型,不断精进和打磨提示词,希望得到最完美的输出。 这个过程让我深刻意识到,熟练驾驭 AI

@Moon1ightSt @dappOS_com @xBubble_ai 感谢月光小姐姐支持

@xingxingjun8888 @dappOS_com @xBubble_ai 是呀,星星姐

@7777chu @dappOS_com @xBubble_ai 感谢老铁

@NFTMILK @dappOS_com @xBubble_ai 😆😂感谢老铁们支持

在 X 看原帖 ↗

Claude Code上线动态工作流功能:支持自动编排多Agent并行执行

AI工程工具
2.8万20101156

Claude Code 有了一个很猛的新功能:动态工作流。 如何尝试: 将 /model 设置为 opus 4.8 将 /effort 设置为 “ultracode” 😂 在你的提示词里使用 “workflow” Claude 会编写一个编排脚本,启动一群子 Agent,验证结果,然后把结果汇报回来。

Claude实时生成编排脚本,并行运行大量子agent处理复杂任务。支持Max、Team、Enterprise及API端。 注意:token消耗显著高于普通会话

源:

在 X 看原帖 ↗

AI辅助Mac App开发:AppKit优于SwiftUI的实践建议

工程AImacOS
8.0K87298

借助 AI 去写 Mac App 完全没问题的。几点经验分享: 1. 尽可能选 AppKit 而不是 SwiftUI,SwiftUI 不如 AppKit 强大,做出来的界面也不好看。SwiftUI 相比 AppKit 的优势是开发简单,但这条已经被 AI 弥补了 2. 先用 Claude Design 去打磨 UI 设计和 UX 交互再去写代码可以事半功倍 3. Opus 比

@btcup99 我没Windows ui 开发经验,但思路是一样的

在 X 看原帖 ↗

XRP Ledger启动AI红队测试已两月

区块链安全XRP
7.1K269515

XRP Ledger的AI红队测试已开展两个月。该项目公开披露了所用工具、已修复的缺陷以及阶段性经验总结。

相关问题主要属于代码质量改进和纵深防御(defense-in-depth)增强范畴。JimboXRPL指出,这些问题均未影响系统的稳定性、可用性,也不危及用户资金安全。

针对krippenreiter提出的修正提案(fix amendment)问题,项目方确认:该修正本身默认启用(yes),但当前主网尚未默认启用(default yes currently no)。

在 X 看原帖 ↗

Claude Code 2.1.154+ 版本触发国产模型 API 错误:invalid role "system"

AI开发工具兼容性
4.5万1412377

新版 Claude Code 默认发送 system 角色消息,但部分国产模型仅支持 user/assistant 角色,导致 400 报错;降级至 2.1.150 可临时解决。

阅读全文 →

Grok-build-0.1发布:面向界面设计的代理型模型

AI开源工程
3.7K35022

grok-build-0.1 面向界面设计推出。作者表示对其代理能力(agentic capabilities)和多工具调用(multi tool calling)印象深刻,并称其为‘good model’。相关链接为

@boederzeng1 提问后,作者回复:是的,只需请用户偏好的外部代理(external agent)将GitHub仓库中的落地页(landing pages)导入MagicPath。导入后,这些页面将完全可交互,并拥有可分享的链接。之后,用户既可向该外部代理,也可向团队原生代理(native one)请求生成新版本。

在 X 看原帖 ↗

Codex实战指南:覆盖安装、订阅、远程控制、CLI与团队资产沉淀

AI工具工程
1.4K33812

这是每一位AI Agent用户都不能错过的Codex实战指南。指南内容涵盖桌面App下载、Plus订阅避坑、手机远程指挥Codex、CLI配置、安全权限设置。

指南还覆盖团队如何沉淀AGENTS.md和Playbook等可复用资产,所有步骤均整理为可直接复现的实用路径。

配套14个实战案例,包括Draw.io自动画架构图、GitHub Actions失败自修复、Obsidian搭建AI知识库等。

GitHub仓库链接为

多位用户在社交平台留言反馈,如@MMMusol称Codex是当前日常使用最多的AI Agent;@YuChen提到‘白嫖使人快乐’;@NFTMILK强调会规范标注来源,不随意搬运。

在 X 看原帖 ↗

女性写真提示词模板更新,支持图片+模板联合输入

AI工具图像生成
1.3万11169201

新模板强调参数锁定规则,用户选定风格与五官方向后,GPT仅扩写不改写;附带图片可自动填充参数,再手动微调

阅读全文 →

Levelsio为酒店图片添加AI视觉识别功能

AI产品更新图像识别
1.7万15328

我为 添加了AI视觉识别功能,使用户能根据AI在酒店照片中识别出的内容进行筛选。例如,可筛选‘举重健身房’,系统将在列表中直接显示该酒店配备举重健身房的照片,让用户立即判断其是否符合预期。同理,该功能也适用于另一链接

@jackthinkz 提前预告!

@duriel_eth grok-latest!

@maats_s 这是我的想法。

在 X 看原帖 ↗

同一提示词下两款AI生成图风格差异显著

AI图像生成提示词工程
8.5K2461

这两天我测试了两个 AI 生成同一张“未来 AI 交易所”图片,用的还是同一套提示词。完整的提示词是:帮我生成一张完全由人工智能控制的未来 AI 交易所的照片。

结果很有意思。第一张图片是用 @dappOS_com 的 @xBubble_ai 生成的,已经有电影概念海报的味道了;第二张则更像高级游戏截图,差距非常非常明显。

第一张最强的地方,在于它有完整的视觉统治力。中间那个 AI EXCHANGE C——提示词中并未出现该文字,但图像中出现了以大写字母呈现的‘AI EXCHANGE’字样,且居于画面中心位置。

在 X 看原帖 ↗

开发者称ChatGPT半年内将重获优势

AI开发工具模型比较
2.5万45523

最快半年,最晚一年,ChatGPT还是会重新胜出的。我从去年就从Claude Code换成了Codex cli,一直作为主力用到现在。我的理由如下:

1. GPT模型实际上并不比Opus / Sonnet这些差很多,只是设计哲学不同。去年我就发现了这一点,GPT/Codex的设计哲学是极简——不搞花里胡哨的概念,用最简单的UI、功能、交互,做尽量小的代码改动,直接修改代码。

@leeoxi @123olp 到时候只能靠Gemini,然后竞争一下,保持补贴🤣

在 X 看原帖 ↗

Claude Code 被用户用于自动安装谷歌框架

AI工具移动端
1.8万46839

有了 Claude Code 和 Cursor 这种软件以后,真的不只是写代码厉害。

我之前拿到豆包手机以后,想给它装个谷歌框架,但一直在 Google Play 那有点问题,死活装不上。

今天突然想起来,打开让 Claude Code 帮我装。打开 USB 调试模式后,它直接就帮我搞定了:自动下载安装包、自动安装、自动调试好。

@Soranlan 不行

@vista8 是啊,想象力很大

@yufengxbt 这个风险太大了,明显超出他的能力范围了

@guansi 对

在 X 看原帖 ↗

8个可直接使用的Claude代码提示词

AI工程工具
1.1K13411

8个可以直接复制的 Claude 代码提示词,直接复制,输入即可!

1. 如果是从零开始完成应用程序开发。输入:像一名资深全栈工程师一样思考,开发一个完整、生产就绪的应用程序。首先,设计系统架构,然后开发最小但可扩展的版本。结果应包括:架构、文件结构、数据库模式、API 端点、UI 架构、完整代码。像一个真正的初创公司 MVP 一样设计它,并使其可扩展。

2. 代

在 X 看原帖 ↗

Claude隐藏模式“Red Team Mode”可模拟多方视角发现业务弱点

AI产品策略提示工程
2.9K96557

该模式包含7个预设提示词,分别模拟竞争对手、怀疑型投资者、愤怒客户等角色,帮助用户在产品上线或策略发布前识别风险点。

阅读全文 →

AI Agent内存不是执行指令,token消耗大因重复规划

AI工程研究
6.5K86579

Q:我把数据库接入了 AI Agent,每次用手机发消息让它帮我查数据、导出文件,但 token 消耗特别大。我已经把工作流写进了 Agent 的 Memory 里,但它就是不按流程走,该怎么办? A:这是一个非常典型的问题。根本原因在于:Memory 只是“背景信息”,不是“执行指令”。Agent

@Edison_A_N 没事,直接转发就好

在 X 看原帖 ↗

Agent自检索历史会话:用SQLite实现上下文长期记忆

AI工程研究
8.6K47590

agent 的上下文窗口是有限的,compact 之后很多决策细节就丢了 但其实 claude code 的每一次对话、subagent、workflow 都以 jsonl 的格式保存下来了,信息就在那里,但 agent 没有工具去翻 看到 claude 的 dynamic-workflow 的时候意识到:agent

以及它并不需要显式触发,agent 只要意识到自己需要查过去的 sesssion 发生了什么就会自己调用 (这个 bot 是我整的一个活,通过 tg 接入已有的 claude code session(

除了上面展示的这些,其实它可以用来处理更复杂的检索 它可以查询最近失败的工具调用,然后总结原因 也可以追溯到上次某个 bug 是怎么回事 因为是 sqlite based,所以各种条件检索它都没什么问题

@yaoandyan 有点意思,我醒了看看( 对,我现在做的这个就是对于 rlm 上下文维护的一个尝试,因为 rlm 的上下文是不能用 compact 来做的,那样的话绝对会炸掉

在 X 看原帖 ↗

AI辅助30分钟生成比赛演讲稿收1000元

AI教育工程
1.3万57135

晚上接了一个急单,是一个老师,要用AI生成一个演讲稿。 比赛用。 主题是AI如何赋能教育。 我用Claude Sonnet写了整个内容框架、然后手工复制到ppt模版里面。 然后简单调了下格式。 整个过程下来,大概30分钟。 我故意拖了拖。 大概两个小时左右发给她了。 收了1000块钱。 突然意识到,

整个过程我甚至没有用Claude Code或者Codex🤣完全采用的是对话式的AI工具。 简直离谱。 难道大家都不知道如何和AI对话么

@Soranlan 🤣🤣🤣

@kundocs 不能让付钱的人觉得这钱太好赚了

@lihuanhuan5l 是这个道理🤣

@MakaoKoe 🤣有钱且不知道怎么弄,这钱就来了

@snail_9106 这是大实话🤣

在 X 看原帖 ↗

用ChatGPT+GPT-Image-2+CodeX实现UI设计到代码的自动化流程

AI工程开源
2.4万18189183

跟chatgpt描述需求,然后用gpt-image-2生成设计稿,再由codex去实现代码,真不错真不错。

@jaxxchen003 codex没有image-2

@hank_aibtc 还在写,还是有点难度的,我要在配置不高的电脑上本地化实现。实现低成本批量生产视频

@Chinazwq123 慢慢调,codex完成度只能是个大概,够用了,对我来说快速落地重要,细节慢慢调

@cdMIKAI heygem

@cryptozhang1105 我本地部署的,他有开源模型,经过我优化,效果还不错

@karenwoman200 是图片,用image-2根据需求生成的UI设计图

@90vicliao 本地生成也可以接视频大模型,我主要是在我本地10G显存的卡生成,今天测了下,2分钟到视频用了5分钟就生成了,效果不错,后面把流程弄好,一天可以生成一堆数字人视频

@0xqiAlpha 这是设计稿

在 X 看原帖 ↗

电商从业者用Claude Code动态工作流打造提示词Skill

AI工程商业
3.4K33727

电商老板们看过来:我用Claude Code新功能动态工作流制作了一个产品电商总图的提示词skill,大多数步骤可以自主完成。昨天我做了一个化妆品的电商详情图不太好,今天用这个新的提示词skill重新做了一个,出来的效果十分清爽,我还是挺满意的,推荐大家试一下这个!skill在引用文!

@BirdTechVision 这个比昨天那个强多了吧

这是skill中的提示词: 请为 [PRODUCT] 生成 4 张高端护肤品电商详情页竖版展示图,适用于天猫、淘宝、京东、抖音商城和小红书店铺。

@Evante3 这个skill也能做吃的,我给你安排一个

@alexandre_lee00 比昨天那个清爽简约多了

@ModengSir 勇哥就可以根据这个skill做所有的电商详情页了

在 X 看原帖 ↗

AI生成广州塔禁飞区一镜到底航拍视频

AI生成式AI工程
3.0万29198166

众所周知 广州塔核心区域是无人机禁飞区 无人机不可以,但AI可以 把路线画好 让 AI 直接起飞,一镜到底 提示词见评论区

广州塔无人机航拍提示词: 请消除红线和箭头。 相机以第一人称的超高速,忠实地按照红箭头的路径突进生成画面。电影般的表现。路面街景的低角度视角来到建筑底部,结合环境光影、反射和逼真的材质细节,在建筑底部急剧上升。

@PierreBlanchou 哈哈你太调皮了

@Thelenhadoor 你用 seedance,你也可以😌

在 X 看原帖 ↗

手把手实现Pi Agent:工程化拆解模型流与Agent Loop

AI工程教程
8.7K136577

Pi Agent 原理与实现🤖 手把手从零到一实现一个 AI Agent⚡️ 用工程化视角拆解 Pi 的核心思想:模型流、Agent Loop、工具调用、会话树、资源加载与上下文压缩。

@wadezone 快学 学完要求加薪👀

@vigorX777 我看看 感谢提醒

@AbzRollins 以后都可以试试这个提示词

在 X 看原帖 ↗

ZenMux上线Claude Opus 4.8免费体验

AI工程开源
1.1万13523

兄弟们! 现在已经可以在 ZenMux 上免费体验 Claude Opus 4.8 了! 我第一时间用它跑了那个Hugging Face大佬M 硬核的「Three.js 纯图元造飞机测试」,要求只用内置几何体(Box、Cylinder、Cone、Sphere…),不准用任何模型加载器,纯手搓一架高细节波音 747-400。 (见视频-Prompt 见评论区) Opus

即可免费体验:

@LufzzLiz 还可以

@wangdefou ai干了一半 后期剪映剪辑了一下

在 X 看原帖 ↗

Glif代理自动生成多元素营销视频

AI工具自动化
476173

我让 glif agent 拿这张图片生成一段视频,要求突出每个区域的两个地点,并配上旁白、音乐、动画和图像等全部元素。
结果做出来的视频整体效果相当不错——这是一段完全自主生成的视频。

但有趣的是,Opus 忽略了 F 💀

是的,自主视频时代已经到来!

@eliadeleo 好机器人

在 X 看原帖 ↗

📖 深度解读

精选文章的中文编辑重写 · 按更新时间排列

查看全部深度解读 →
▲ Top

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部