书虫们注意了!你家那堆买来吃灰的技术书,终于有救了。 GitHub上一个叫book-to-skill的开源神器刚火,狂揽2700多Star,玩法是真离谱: 1️⃣ PDF或EPUB直接丢进去 2️⃣ 自动扒目录、核心概念和套路,一键生成技能 3️⃣ 以后敲一句 /书名技能 加话题,它就替你翻书答疑 说白了,吃灰的书秒变Claude Code里随叫随到的私人顾问,这波不亏👇
Claude Opus 4.8 Ultra Code通过将大型任务拆解为并行子代理(sub-agents),运行数百个AI代理共同工作、交叉检查与优化输出。
它不再依赖单一AI助手逐步执行,而是让Claude自主判断:当任务复杂度足够高时,启动包含多个同步运行代理的动态工作流。
对于希望将Claude Code接入实用代理系统的人,AI Profit Boardroom提供操作指南、辅导与支持。
来自 𝕏 的实时信号,经 AI 聚类分析
NVIDIA 发布 RTX Spark SoC,把 ARM CPU、Blackwell GPU 和 128GB 统一内存塞进 14mm 超薄本,本地跑 120B 大模型、1440p 满帧 3A 游戏,拔电不掉帧。以前要台式机+散热器干的事,现在一块芯片全包了。
阅读全文 →书虫们注意了!你家那堆买来吃灰的技术书,终于有救了。 GitHub上一个叫book-to-skill的开源神器刚火,狂揽2700多Star,玩法是真离谱: 1️⃣ PDF或EPUB直接丢进去 2️⃣ 自动扒目录、核心概念和套路,一键生成技能 3️⃣ 以后敲一句 /书名技能 加话题,它就替你翻书答疑 说白了,吃灰的书秒变Claude Code里随叫随到的私人顾问,这波不亏👇
我年初开始做 OpenClaw 托管服务,在一套 k8s 集群部署了 500 个 Pod,每个 Pod 限制 4g 的运行内存。日常开着 18 台 4c16g 的服务器作为节点池,一个月成本将近 5k 刀。
几个月下来,托管服务的 MRR 突破了 8k 刀,除去运营成本,利润非常低。
今天终于把服务迁移到了 FastClaw,通过存算分离的架构,让 Agent 无需常驻,而是在收到请求时动态挂载 sandbox 来提供服务。服务器从 18 台降到了 3 台,运营成本降到了 1/6,下个月有机会赚到钱了。😄
跟 OpenClaw 比,FastClaw 真的是太轻量了。
1. 代码体积约为 OpenClaw 的 1/40
2. 运行资源占用约为 OpenClaw 的 1/7
3. 单二进制分发,无环境依赖
4. OpenClaw 的 gateway 启动大概需要 15s,FastClaw 秒级启动
FastClaw 本身是为云原生多租户场景而设计的 Agent 运行框架,同样也适用本地运行场景。
继续完善,欢迎体验。✌️
HyperFrames 是一个开源框架,可将 HTML、CSS 和动画确定性地转换为 MP4 视频,专为 AI 编程智能体和自动化流水线构建。
- 用带时间与轨道数据属性的 HTML 来定义视频
- 支持 GSAP、CSS、Lottie、Three.js 等各类动画库
- 提供命令行工具(CLI),支持本地预览、实时重载及 MP4 渲染
- 内置智能体技能,涵盖视频规划、代码编写、代码检查(linting)、预览与渲染
TripoSplat 是 @tripoai 推出的开源图像到 3D 高斯模型,已在 ComfyUI One 中实现开箱即用支持:输入一张 2D 图像,输出一个 3D 高斯资产;在创意设计、风格化道具与角色方面表现强劲。
关键亮点:
- MIT 开源:提供权重与推理代码,支持本地运行及二次开发
- DeG 自适应细节:在关键区域部署更多高斯单元,在简单区域减少高斯单元数量
- 灵活导出预算:可按需分配资源——背景道具、主角资产、多设备 LOD(细节层次)各自独立调控
发布:Cursor 的 API——可在任何框架中使用 Composer 2.5。
这是一个开源的 macOS 应用,为 Cursor 的模型暴露了 API。
立即在 Codex、OpenCode、Cline 等工具中使用 Composer 2.5。
创意控制至关重要。Deevid AI Series 2 中的 Omni Reference 功能,让你可以从文本、图像、音频或视频任意一种模态开始,并确保所有输出始终忠于你的原始构想。这为以 AI 为首要创作工具的创作者带来了重大突破。
🎥✨
是一个开源的 AI 模型规格、定价与能力数据库,由社区贡献共同维护。 - 数据可通过 JSON API 访问 - 提供方 Logo 以 SVG 文件格式提供,通过一个简单端点获取 - 模型定义以 TOML 文件形式存储,并按提供方组织 - 使用与 AI SDK 兼容的模型 ID,便于查找
@MiniMax_AI 推出的 M3 现已上线 Cloudflare AI Gateway:
- 首个推动当前最先进(SOTA)编程能力边界的开源模型
- 支持 100 万 token 上下文长度,并原生支持多模态理解
- 首周内,上下文长度 ≤ 512K 的请求享 50% 折扣
今天就通过 AI Gateway 试用吧!
🎉 恭喜 @JetBrains 发布 Mellum2-12B-A2.5B-Thinking:一款开源的 12B MoE 模型,仅激活 2.5B 参数,同时支持自然语言与代码,上下文长度达 128K。
Mellum2 从发布首日即原生支持 vLLM,内置推理解析器(reasoning parser)与工具调用(tool calling)能力,专为智能体(agentic)工作流设计。
想入门 Vibe Coding?这3个开源项目就足够了,完全不用额外报课学习。1. Easy-Vibe(15.3k⭐):系统化教程,从零基础手把手带你搭建AI应用 2. vibe-coding-cn(14k⭐):聚焦提示词、实操技能与工程化工作流 3. awesome-vibe-coding(4.6k⭐):一站式工具、资源大合集 吃透这三个项目,你对Vibe Coding的理解会提升一个层次。
👉 项目链接放评论区
Mellum 起步于代码补全。
Mellum2 则面向更广的用途——同时处理自然语言与代码。
这是一款参数量为 12B 的开源大语言模型,专为路由(routing)、检索增强生成(RAG)及子智能体(sub-agents)设计,并针对超低延迟推理进行了优化。
现已上线 @huggingface。
了解更多:
有人把 Agent 的提示词、记忆、文件、运行状态分别存进 Redis、Postgres、向量库和对象存储——计算时才临时拉取,用完即弃。
阅读全文 →Cursor 正在为用户增加使用额度。
最近我重度使用了 Cursor 的 Agent,效果相当不错。我常用的 GUI Agent 里面,Codex App > Cursor > Claude Desktop。
几个亮点:
1. 它的 multitask 模式可以开启多个后台任务并行,速度很不错。
2. 它可以灵活选择各种模型,不像 Codex 和 Claude Code。
@xg127894 看你选的模型,没降智。
@peopleallremake 比 VSCode 居然好一点,但不如 Codex 优化得好。
@F2aldi yes, it works for most of the cases. For example: test mac app, or I need to share the cookie/auth from Chrome.
Claude Code 终于有了官方大佬出来分享内部的最佳实战哲学了! 这个视频全程 27 分钟,句句干货,讲述了 Claude Code 的诞生和最佳实践原则。 它揭开了引擎底盖,让你看到底层是如何运作的。
我负责海量信息的筛选与深度加工,你只负责高效吸收 现在免费订阅 Substack 专栏,第一时间获取提纯后的行业洞察:
一行命令让你的 Claude Code 升级至最强模型:
/model claude-opus-4-6
@robo_king1
1M不是最强的,200k的时候最强,1M会失智 😀
自从 Claude Design 可以共享额度,可以用的次数多了很多,但 Token 消耗还是很厉害。不过做出来的东西真的很好,真的强烈建议你多用用,这是我近期用的最好的 Agent 产品之一。 一个技巧,你可以导入现成的 Design System,再让它设计,风格一致性会好很多,用一些成熟的 Design
@wngpng18543 也能用的,但是不如 claude design 方便
Claude Code并非简单对话模型,而是支持后台执行、进度保存与多Agent协同的自动化任务系统。
阅读全文 →📘 开源高质量教程推荐:《vibe-coding-cn》—— 中文 Vibe Coding 从入门到精通 这是一套中文本地化 Vibe Coding 完整教程,核心目标是帮助开发者通过 AI 结对编程工作流,把“一个想法”系统性地变成可运行的产品。从需求拆解、技术方案、Prompt 工程、Skill
@kundocs 是的,这套教程正好可以提供实操的方法
AI Agent Guidelines for CS336 at Stanford
社区讨论:多人质疑禁令的可执行性,@ritzaco指出这类似“发布标准答案却要求学生仅作参考”,主张改用AI不擅长的题目设计或现场考核;@sgirard强调需学生认同教育价值而非仅求文凭;@baddash和@londons_explore则主张完全放开AI使用,由教师通过更高阶任务确保真实掌握;@aaaronic从实操角度批评指南过于冗长,称30行简洁版在模型测试中效果更佳。
Anthropic 终于正式提交了 IPO 申请 🔥
那个曾筹集数十亿美元、高喊“安全”口号的 Claude 团队,如今正走向公开市场。
这已不再是什么科学实验项目……
这是迄今最清晰的信号:真正的 AI 产品正在成为一种合法的资产类别。
那些真正交付实用工具、且深谙如何实现有效分发的创始人,
将在下一波浪潮中大获丰收。
我在这一领域已深入参与了一段时间,
而空谈 AI 者与真正构建产品 + 正确定位者之间的差距,正迅速拉大。
如果你正在开发 AI 产品,或希望在此市场中更好地定位自己,欢迎随时联系。
也欢迎分享你目前行之有效的做法。
真正交付实用工具 + 拥有恰当分发能力的创始人,即将迎来丰厚回报。
兄弟们!Claude Code 的免费车再不上就彻底没了!卧槽,GitHub 上刚挖出一个神级项目,直接让你永久白嫖 Claude Code,一分钱都不用掏!
原理简单到离谱:本地5分钟搭个代理,把所有请求秒转给 DeepSeek、Kimi 等10个免费国产大模型,喝杯咖啡的功夫就搞定!现在已经有2万+开发者偷偷在用,你还在傻乎乎给 Anthropic 交月费?纯纯的白嫖��福音!
用国产模型替你扛下所有重活,羊毛薅到飞起!丑话说在前头:这玩法属于钻空子,随时可能被封,能薅一天是一天!别手动了,赶紧冲!
!!项目我就不剧透了,评论区留言我发链接,冲不冲你们自己看!
#Claude #AI工具
请注意,Alphabet 预计其拟议的 800 亿美元融资中,有 300 亿美元(即 37.5%)将用于支付员工股权奖励相关的税务义务,而非用于资助 AI 基础设施。
Project Lightwell聚焦Linux、云、AI基础设施的开源软件供应链安全,投入5亿美元。当AI模型开始自动生成代码时,有人正在检查那串CI/CD流水线里,到底谁签发了那个依赖包。
阅读全文 →🧠 机器学习暑期学校(MLSS)2026
📅 6月15日至26日
📍 哥伦比亚大学,纽约市
为期两周的课程,涵盖大语言模型(LLMs)、强化学习(RL)、智能体(agents)、对齐(alignment)、可解释性(interpretability)与推理(reasoning),包含讲座、教程与实验环节。
授课嘉宾包括 Carlos Fernández-Granda、David Rosenberg、Paola Cascante-Bonilla、Andrew Owens、Ali Hirsa、Gary Kazantsev,以及我本人。
纽约见!🗽
@TechAtBloomberg @boson_ai #MLSS2026
刚刚消息:$INTC 英特尔在 COMPUTEX 2026 上动作频频,宣布多项机器人相关产品与项目:
- Core Ultra 系列 3 在边缘 AI 与计算领域已斩获 130 多项合作伙伴设计胜利。
- Sensory AI 推出 Ella:一款多智能体机器人咖啡师,完全运行于英特尔芯片之上(无需独立 GPU)。可处理客户对话、制作饮品(最高达每小时 200 杯)、分析运营数据,并通过 3 个并发 AI 智能体监控安全。
- OpenVINO Physical AI 工具包现已开放,可加速机器人从原型到量产的开发进程。
边缘 AI 与物理 AI 对英特尔而言正变得切实可行。更多消息即将公布。
机器人技术正成为最热门的行业之一。我们非常荣幸能与 @UnitreeRobotics 展开合作,共同攻克机器人自主性难题。
在本次访谈中,我们采访了 Unitree 北美业务负责人,探讨他们如何看待与我们协作所带来的软件机遇。
你现在可以在笔记本电脑上本地训练参数量超 120B 的大语言模型!🔥 我们与 NVIDIA 和 Microsoft 合作,将大语言模型训练能力带到了配备 128GB 统一内存的 RTX Spark 笔记本电脑上!
你的 AI Agent 现在能搜推特了。
Grok CLI 终于把 Twitter 的搜索能力给内置了。
X 官方搜索 API 很贵,Grok 这次加了 4 个搜索工具:
1、x_keyword_search:最强的一个,完整支持所有高级搜索操作符,from:、since:、min_faves:、filter:images,Top/Latest 模式都有
2、x_semantic_search:语义搜索推文,支持日期范围和相关性过滤
3、x_user_search:搜用户
4、x_thread_fetch:抓完整推文线程,父帖加所有回复
关键是这东西在本地,你的 Agent 随时能调用,背后直接连着 Twitter 实时信息,价值巨大。
🧵AI论文周报 1/🧭 7篇顶级论文,重塑AI Agent范式 本周 7 篇论文,集中攻克 AI Agent 最贵的三个问题:prompt 靠猜、推理靠烧钱、上下文无限膨胀。 每篇都有可落地的工程启示,逐条拆解👇
有人对15个软件工程任务用Harness跑出质量分从49.5升到79.3,胜率15/15,难度越高的任务提升越明显。
阅读全文 →创作者对比测试显示xBubble.ai在AI图像细节生成(如自动嵌入品牌Logo)上显著优于即梦。
阅读全文 →AI内容创作者分享使用AnySearch高效完成技术调研的体验,强调其自动路由、结构化输出和当前免费特性。
阅读全文 →AI 生成的图片,如何处理才不会被算法判定为 AI 生成? 我今天做了个简单测试(不看内容仅仅看元数据的情况)。 我用 GPT Image 2.0 生成了一张图片,下载原图后让 Codex 用 TXT 方式打开,可以看到包含 GPT Image/OpenAI 等元数据文本标识。 那把这张图片发到微信,再从微信里另存回来,用 TXT
@huoniuniu 得去他文件信息里面自带的元信息才行 所
@mnmn94253156337 肯定会 就看你干啥用了😂
@kingzw888 也可以 哈哈
@0xWei8888 可以研究研究
@zw2867759575009 要求不高的话有用
@Jadtrrguson 那倒是 主要是预防平台算法判定
@SassaFlow 🉑
@Hu12302 不过我觉得 只要不是那种恶意的 算法应该不会限制你
CS336: Language Modeling from Scratch
社区讨论:多人质疑课程对高端GPU(如B200,$4.99/小时)的依赖,@skerit和@AJRF明确表示4090或5080 16GB已足够完成早期任务;@fg137则证实即使有深度学习基础,仅靠业余时间用消费级卡完成前两作业也耗时数月;@dominotw指出自己更关注理论理解而非工程实现,希望有LessWrong风格的底层阐释;@chainsaw10追问ML先修课的实操资源,反映对前置知识门槛的普遍关切。
🚨 NVIDIA 刚刚发布了其最强大的面向自动驾驶出租车的开源 AI 模型。
其新款 Alpamayo 2 Super 模型规模是此前版本的 3 倍,参数量达 320 亿。
该 AI 现在能够:
- 看到车辆周围 360° 全景,而不仅限于前方视野;
- 更好地理解汽车、行人及物体在三维空间中的位置;
- 自主决定何时停车、让行或变道;
- 更安全地应对罕见且不可预测的道路状况;
- 解释其驾驶决策背后的推理过程;
- 自动标注驾驶数据,将原本耗时数月的工作缩短至数天。
这现已成为 NVIDIA($NVDA)最强大的开源驾驶 AI 模型。
如果你平时不用 codex 但是架不住 image2 牛逼又不得不用,怎么办?
我开源了一个 SKILL —— imgen,安装后可以直接在 Claude Code 以及其他 Agent 里面直接生成图片。
✨ Features
🖼️ 文生图 & 图生图 — 一条命令,从文字生成图片或修改已有图片
🔑 零配置 — 复用本地 Codex 登录状态,无需单独申请 API Key
📐 最高 4K 分辨率 — 支持到 3840×2160(4K UHD)
🪟 透明背景 — 一键输出透明 PNG,适合做图标、贴纸
🤖 原生 AI Skill — 在 Claude Code / Codex / Gemini CLI 里直接说"帮我画一张……"即可触发
⚡ 直出本地文件 — 图片直接写盘,无中间云端上传
这款开源 OCR 模型好得离谱。
• 参数量不到 10 亿
• 支持 91 种语言
• 在 RTX 5090 上每秒可处理 5 页
• 可在 CPU、GPU 和 Apple Silicon 上运行
• 在 olmOCR 基准测试中得分 83.3%(在参数量低于 30 亿的模型中排名第一)
Surya OCR 正将文档智能推向一个全新高度。
Github 链接:
刚刚发现了一套出人意料地好用的 AI 工作流配置 👇
Agnes AI 是一个 AI 模型平台,提供对其多模态模型的 API 接入,包括智能体(agent)、图像和视频系统。
我尝试将 Agnes-2.0-Flash 应用于类似 Claude Code / Codex 的工作流中,它成功完成了:
• 编码与代码重构
• 问题调试
• 小型自动化脚本编写
此外还探索了:
• Agnes-Image-2.0-Flash,用于快速生成视觉内容
• Agnes-Video-V2.0,用于生成概念短片
感觉目前仅靠一套模型栈(通过 API 接入)就已能覆盖开发者与内容创作者日常工作的很大一部分。
如果你正在构建 AI 工作流,值得一试 👇
@agnesai_sapiens
#AgnesAI #Agnes2Flash #FreeAIModel #AIAgent #MultimodalAI #AIWorkflow #CodingWithAI #DeveloperTools #NoMorePaywalls
我有一个可能不太受欢迎的观点:峰值模型智能对大多数实际应用场景而言将无关紧要,而且在相对较短的时间内,足够强的智能将通过开源渠道广泛扩散。
Composer 2.5 现已在 Grok Build 中上线。
Composer 2.5 是一款速度快、智能化程度极高的模型,擅长处理长时间运行的任务,并能精准遵循复杂指令。
该功能通过7个结构化提示词,帮助用户完成从概念生成、脚本撰写、镜头设计到音频规划的完整视频筹备,无需启动任何视频编辑软件。
阅读全文 →这是Avthar完整的43分钟演示视频,展示其多智能体Claude Code工作流,该工作流帮助他实现10倍开发提速。工作流包含git worktrees、并行智能体(parallel agents)和Agent View功能。
视频时间戳标注了关键节点:0:00为‘最大生产力突破’;2:09为‘第一步:准备’;5:49为‘终端设置’;6:49为‘git worktrees’;12:39为‘第二步’,并附链接
该视频同步发布于YouTube,链接为
Avthar在𝕏(原Twitter)账号@avthar提供关于Claude Code、Codex等AI编程工具的深度内容,并分享高效使用方法。用户可关注其𝕏账号或订阅其YouTube频道以获取更多信息。
AI智能体部署有时可能非常困难。HivemindOS中新增的usepod智能体,其设置流程现已接近为钱包注资的操作:创建代币 → 注入资金 → 查看可用模型 → 选择模型 → 运行智能体。
新usepod智能体可访问用户的整个Hivemind,包括所有已注册的技能和记忆。
附注:尚未加入的用户可加入$ hive社区,跟踪其演进过程。
@anomit 提问获回应:1. 推理算力交易功能即将上线。目标是让用户能出租闲置计算设备——例如,纽约一台性能强劲但闲置一半的机器,其所有者愿意通过出租获取收益。
在 X 上看了不少文章封面,发现普遍都很丑,包括自己的。 我让@xiaoxiaodong01 发了一个他满意的提示词。 在此基础让 ChatGPT优化,把硬性限定词都去掉,给 AI 充分的发挥空间。 以后任意一篇文章丢给ChatGPT或Codex都可以生成类似的 5:2 大字封面。 提示词见评论区
@xiaoxiaodong01 请生成一张 5:2 横向高级概念海报。 这不是普通插画,也不是简单字效。请理解用户输入内容背后的含义、情绪、隐喻和传播张力,把它转译成一个极简、有力、清晰、有记忆点的视觉概念。 用户输入内容必须成为画面核心主文字:大、清晰、醒目、有合理内边距,不能乱码、错字、裁切或难以辨认。
ChatGPT image 2 x 儿童节主题内衣提示词 大人也要过儿童节😏 从之前的内衣提示词中获得了灵感,现在的提示词可以指定风格或者各种角色IP来进行定制生图,有想深入研究的朋友可以再优化一下服装的款式变化以及整体的造型搭配。 提示词放在了评论区,欢迎返图👇
提示词: 生成一张单张 9:16 竖版 RAW 风格手机摄影照片。主题为架空高级内衣时尚品牌的原创角色灵感 cos 内衣试穿会。视觉灵感来自各种动漫或游戏角色。 【指定模特设定:用户填写,例如 20 多岁成年日本女性 / 黑发短发冷淡脸 / 棕色长卷发甜美姐姐感 / 亚麻棕波波头自然可爱感】
@GeekCatX 大人之间的儿童节可以这样过😏
@0xkyne 😏陆续有来
@planxyou 😅哪里看到的未成年,提示词都写了 20 岁女性
@94vanAI 😅应该不是吧,这个就是卡通版内衣的意思
今天,@MeckaAI 宣布获得 6000 万美元融资,旨在成为物理 AI 的数据与部署层。本轮融资将助力我们扩展数据基础设施、投入新垂直领域,并将机器人部署到真实世界中。
当我们创立 Mecka 时,我们相信机器人技术正迎来一个拐点:模型性能、硬件能力与商业需求三者正在交汇。来自真实世界的规模化经验,将成为关键突破口。详见 @FortuneMagazine。
Mecka 的使命是将物理 AI 带入真实世界。我们构建数据、评估与部署基础设施,以加速实现机器人在商业环境中可靠执行真实任务的未来。
通用化、已部署的机器人技术,将成为我们这一代人所见证的最重要技术之一——它将提升生活质量、生产效率与可能性边界。
我们对团队设定了极高的标准:亲自动手做工程,每日深入处理 PB 级数据。欢迎加入我们,共同加速这一现实的到来。
@mli0603 @MeckaAI 谢谢 Max!
有人给 Claude Code 做了一个中医 Agent Skill,把倪海厦 12 门课全部结构化了 讲义、方剂、穴位、2986 张课程截图,全部可搜索 你用自然语言描述症状,AI 帮你检索对应的经方和穴位方案,还能生成复习计划和对比表 这个项目有意思的地方在于:AI Agent 正在渗透到最传统的知识领域,中医只是开始
@qtwaiter 可以可以👍
Mellum 起步于代码补全。
Mellum2 则面向更广的用途——同时处理自然语言与代码。
这是一款参数量为 12B 的开源大语言模型,专为路由(routing)、检索增强生成(RAG)及子智能体(sub-agents)设计,并针对超低延迟推理进行了优化。
现已上线 @huggingface。
了解更多:
🎉 恭喜 @JetBrains 发布 Mellum2-12B-A2.5B-Thinking:一款开源的 12B MoE 模型,仅激活 2.5B 参数,同时支持自然语言与代码,上下文长度达 128K。
Mellum2 从发布首日即原生支持 vLLM,内置推理解析器(reasoning parser)与工具调用(tool calling)能力,专为智能体(agentic)工作流设计。
@MiniMax_AI 推出的 M3 现已上线 Cloudflare AI Gateway:
- 首个推动当前最先进(SOTA)编程能力边界的开源模型
- 支持 100 万 token 上下文长度,并原生支持多模态理解
- 首周内,上下文长度 ≤ 512K 的请求享 50% 折扣
今天就通过 AI Gateway 试用吧!
有人对15个软件工程任务用Harness跑出质量分从49.5升到79.3,胜率15/15,难度越高的任务提升越明显。
阅读全文 →你的 AI Agent 现在能搜推特了。
Grok CLI 终于把 Twitter 的搜索能力给内置了。
X 官方搜索 API 很贵,Grok 这次加了 4 个搜索工具:
1、x_keyword_search:最强的一个,完整支持所有高级搜索操作符,from:、since:、min_faves:、filter:images,Top/Latest 模式都有
2、x_semantic_search:语义搜索推文,支持日期范围和相关性过滤
3、x_user_search:搜用户
4、x_thread_fetch:抓完整推文线程,父帖加所有回复
关键是这东西在本地,你的 Agent 随时能调用,背后直接连着 Twitter 实时信息,价值巨大。
你现在可以在笔记本电脑上本地训练参数量超 120B 的大语言模型!🔥 我们与 NVIDIA 和 Microsoft 合作,将大语言模型训练能力带到了配备 128GB 统一内存的 RTX Spark 笔记本电脑上!
Composer 2.5 现已在 Grok Build 中上线。
Composer 2.5 是一款速度快、智能化程度极高的模型,擅长处理长时间运行的任务,并能精准遵循复杂指令。
NVIDIA 发布 RTX Spark SoC,把 ARM CPU、Blackwell GPU 和 128GB 统一内存塞进 14mm 超薄本,本地跑 120B 大模型、1440p 满帧 3A 游戏,拔电不掉帧。以前要台式机+散热器干的事,现在一块芯片全包了。
阅读全文 →书虫们注意了!你家那堆买来吃灰的技术书,终于有救了。 GitHub上一个叫book-to-skill的开源神器刚火,狂揽2700多Star,玩法是真离谱: 1️⃣ PDF或EPUB直接丢进去 2️⃣ 自动扒目录、核心概念和套路,一键生成技能 3️⃣ 以后敲一句 /书名技能 加话题,它就替你翻书答疑 说白了,吃灰的书秒变Claude Code里随叫随到的私人顾问,这波不亏👇
我年初开始做 OpenClaw 托管服务,在一套 k8s 集群部署了 500 个 Pod,每个 Pod 限制 4g 的运行内存。日常开着 18 台 4c16g 的服务器作为节点池,一个月成本将近 5k 刀。
几个月下来,托管服务的 MRR 突破了 8k 刀,除去运营成本,利润非常低。
今天终于把服务迁移到了 FastClaw,通过存算分离的架构,让 Agent 无需常驻,而是在收到请求时动态挂载 sandbox 来提供服务。服务器从 18 台降到了 3 台,运营成本降到了 1/6,下个月有机会赚到钱了。😄
跟 OpenClaw 比,FastClaw 真的是太轻量了。
1. 代码体积约为 OpenClaw 的 1/40
2. 运行资源占用约为 OpenClaw 的 1/7
3. 单二进制分发,无环境依赖
4. OpenClaw 的 gateway 启动大概需要 15s,FastClaw 秒级启动
FastClaw 本身是为云原生多租户场景而设计的 Agent 运行框架,同样也适用本地运行场景。
继续完善,欢迎体验。✌️
HyperFrames 是一个开源框架,可将 HTML、CSS 和动画确定性地转换为 MP4 视频,专为 AI 编程智能体和自动化流水线构建。
- 用带时间与轨道数据属性的 HTML 来定义视频
- 支持 GSAP、CSS、Lottie、Three.js 等各类动画库
- 提供命令行工具(CLI),支持本地预览、实时重载及 MP4 渲染
- 内置智能体技能,涵盖视频规划、代码编写、代码检查(linting)、预览与渲染
TripoSplat 是 @tripoai 推出的开源图像到 3D 高斯模型,已在 ComfyUI One 中实现开箱即用支持:输入一张 2D 图像,输出一个 3D 高斯资产;在创意设计、风格化道具与角色方面表现强劲。
关键亮点:
- MIT 开源:提供权重与推理代码,支持本地运行及二次开发
- DeG 自适应细节:在关键区域部署更多高斯单元,在简单区域减少高斯单元数量
- 灵活导出预算:可按需分配资源——背景道具、主角资产、多设备 LOD(细节层次)各自独立调控
发布:Cursor 的 API——可在任何框架中使用 Composer 2.5。
这是一个开源的 macOS 应用,为 Cursor 的模型暴露了 API。
立即在 Codex、OpenCode、Cline 等工具中使用 Composer 2.5。
创意控制至关重要。Deevid AI Series 2 中的 Omni Reference 功能,让你可以从文本、图像、音频或视频任意一种模态开始,并确保所有输出始终忠于你的原始构想。这为以 AI 为首要创作工具的创作者带来了重大突破。
🎥✨
Anthropic 终于正式提交了 IPO 申请 🔥
那个曾筹集数十亿美元、高喊“安全”口号的 Claude 团队,如今正走向公开市场。
这已不再是什么科学实验项目……
这是迄今最清晰的信号:真正的 AI 产品正在成为一种合法的资产类别。
那些真正交付实用工具、且深谙如何实现有效分发的创始人,
将在下一波浪潮中大获丰收。
我在这一领域已深入参与了一段时间,
而空谈 AI 者与真正构建产品 + 正确定位者之间的差距,正迅速拉大。
如果你正在开发 AI 产品,或希望在此市场中更好地定位自己,欢迎随时联系。
也欢迎分享你目前行之有效的做法。
真正交付实用工具 + 拥有恰当分发能力的创始人,即将迎来丰厚回报。
兄弟们!Claude Code 的免费车再不上就彻底没了!卧槽,GitHub 上刚挖出一个神级项目,直接让你永久白嫖 Claude Code,一分钱都不用掏!
原理简单到离谱:本地5分钟搭个代理,把所有请求秒转给 DeepSeek、Kimi 等10个免费国产大模型,喝杯咖啡的功夫就搞定!现在已经有2万+开发者偷偷在用,你还在傻乎乎给 Anthropic 交月费?纯纯的白嫖��福音!
用国产模型替你扛下所有重活,羊毛薅到飞起!丑话说在前头:这玩法属于钻空子,随时可能被封,能薅一天是一天!别手动了,赶紧冲!
!!项目我就不剧透了,评论区留言我发链接,冲不冲你们自己看!
#Claude #AI工具
请注意,Alphabet 预计其拟议的 800 亿美元融资中,有 300 亿美元(即 37.5%)将用于支付员工股权奖励相关的税务义务,而非用于资助 AI 基础设施。
Project Lightwell聚焦Linux、云、AI基础设施的开源软件供应链安全,投入5亿美元。当AI模型开始自动生成代码时,有人正在检查那串CI/CD流水线里,到底谁签发了那个依赖包。
阅读全文 →🧠 机器学习暑期学校(MLSS)2026
📅 6月15日至26日
📍 哥伦比亚大学,纽约市
为期两周的课程,涵盖大语言模型(LLMs)、强化学习(RL)、智能体(agents)、对齐(alignment)、可解释性(interpretability)与推理(reasoning),包含讲座、教程与实验环节。
授课嘉宾包括 Carlos Fernández-Granda、David Rosenberg、Paola Cascante-Bonilla、Andrew Owens、Ali Hirsa、Gary Kazantsev,以及我本人。
纽约见!🗽
@TechAtBloomberg @boson_ai #MLSS2026
刚刚消息:$INTC 英特尔在 COMPUTEX 2026 上动作频频,宣布多项机器人相关产品与项目:
- Core Ultra 系列 3 在边缘 AI 与计算领域已斩获 130 多项合作伙伴设计胜利。
- Sensory AI 推出 Ella:一款多智能体机器人咖啡师,完全运行于英特尔芯片之上(无需独立 GPU)。可处理客户对话、制作饮品(最高达每小时 200 杯)、分析运营数据,并通过 3 个并发 AI 智能体监控安全。
- OpenVINO Physical AI 工具包现已开放,可加速机器人从原型到量产的开发进程。
边缘 AI 与物理 AI 对英特尔而言正变得切实可行。更多消息即将公布。
机器人技术正成为最热门的行业之一。我们非常荣幸能与 @UnitreeRobotics 展开合作,共同攻克机器人自主性难题。
在本次访谈中,我们采访了 Unitree 北美业务负责人,探讨他们如何看待与我们协作所带来的软件机遇。
AI Agent Guidelines for CS336 at Stanford
社区讨论:多人质疑禁令的可执行性,@ritzaco指出这类似“发布标准答案却要求学生仅作参考”,主张改用AI不擅长的题目设计或现场考核;@sgirard强调需学生认同教育价值而非仅求文凭;@baddash和@londons_explore则主张完全放开AI使用,由教师通过更高阶任务确保真实掌握;@aaaronic从实操角度批评指南过于冗长,称30行简洁版在模型测试中效果更佳。
🚨 NVIDIA 刚刚发布了其最强大的面向自动驾驶出租车的开源 AI 模型。
其新款 Alpamayo 2 Super 模型规模是此前版本的 3 倍,参数量达 320 亿。
该 AI 现在能够:
- 看到车辆周围 360° 全景,而不仅限于前方视野;
- 更好地理解汽车、行人及物体在三维空间中的位置;
- 自主决定何时停车、让行或变道;
- 更安全地应对罕见且不可预测的道路状况;
- 解释其驾驶决策背后的推理过程;
- 自动标注驾驶数据,将原本耗时数月的工作缩短至数天。
这现已成为 NVIDIA($NVDA)最强大的开源驾驶 AI 模型。
如果你平时不用 codex 但是架不住 image2 牛逼又不得不用,怎么办?
我开源了一个 SKILL —— imgen,安装后可以直接在 Claude Code 以及其他 Agent 里面直接生成图片。
✨ Features
🖼️ 文生图 & 图生图 — 一条命令,从文字生成图片或修改已有图片
🔑 零配置 — 复用本地 Codex 登录状态,无需单独申请 API Key
📐 最高 4K 分辨率 — 支持到 3840×2160(4K UHD)
🪟 透明背景 — 一键输出透明 PNG,适合做图标、贴纸
🤖 原生 AI Skill — 在 Claude Code / Codex / Gemini CLI 里直接说"帮我画一张……"即可触发
⚡ 直出本地文件 — 图片直接写盘,无中间云端上传
这款开源 OCR 模型好得离谱。
• 参数量不到 10 亿
• 支持 91 种语言
• 在 RTX 5090 上每秒可处理 5 页
• 可在 CPU、GPU 和 Apple Silicon 上运行
• 在 olmOCR 基准测试中得分 83.3%(在参数量低于 30 亿的模型中排名第一)
Surya OCR 正将文档智能推向一个全新高度。
Github 链接:
刚刚发现了一套出人意料地好用的 AI 工作流配置 👇
Agnes AI 是一个 AI 模型平台,提供对其多模态模型的 API 接入,包括智能体(agent)、图像和视频系统。
我尝试将 Agnes-2.0-Flash 应用于类似 Claude Code / Codex 的工作流中,它成功完成了:
• 编码与代码重构
• 问题调试
• 小型自动化脚本编写
此外还探索了:
• Agnes-Image-2.0-Flash,用于快速生成视觉内容
• Agnes-Video-V2.0,用于生成概念短片
感觉目前仅靠一套模型栈(通过 API 接入)就已能覆盖开发者与内容创作者日常工作的很大一部分。
如果你正在构建 AI 工作流,值得一试 👇
@agnesai_sapiens
#AgnesAI #Agnes2Flash #FreeAIModel #AIAgent #MultimodalAI #AIWorkflow #CodingWithAI #DeveloperTools #NoMorePaywalls
我有一个可能不太受欢迎的观点:峰值模型智能对大多数实际应用场景而言将无关紧要,而且在相对较短的时间内,足够强的智能将通过开源渠道广泛扩散。
CS336: Language Modeling from Scratch
社区讨论:多人质疑课程对高端GPU(如B200,$4.99/小时)的依赖,@skerit和@AJRF明确表示4090或5080 16GB已足够完成早期任务;@fg137则证实即使有深度学习基础,仅靠业余时间用消费级卡完成前两作业也耗时数月;@dominotw指出自己更关注理论理解而非工程实现,希望有LessWrong风格的底层阐释;@chainsaw10追问ML先修课的实操资源,反映对前置知识门槛的普遍关切。
想入门 Vibe Coding?这3个开源项目就足够了,完全不用额外报课学习。1. Easy-Vibe(15.3k⭐):系统化教程,从零基础手把手带你搭建AI应用 2. vibe-coding-cn(14k⭐):聚焦提示词、实操技能与工程化工作流 3. awesome-vibe-coding(4.6k⭐):一站式工具、资源大合集 吃透这三个项目,你对Vibe Coding的理解会提升一个层次。
👉 项目链接放评论区
是一个开源的 AI 模型规格、定价与能力数据库,由社区贡献共同维护。 - 数据可通过 JSON API 访问 - 提供方 Logo 以 SVG 文件格式提供,通过一个简单端点获取 - 模型定义以 TOML 文件形式存储,并按提供方组织 - 使用与 AI SDK 兼容的模型 ID,便于查找
🧵AI论文周报 1/🧭 7篇顶级论文,重塑AI Agent范式 本周 7 篇论文,集中攻克 AI Agent 最贵的三个问题:prompt 靠猜、推理靠烧钱、上下文无限膨胀。 每篇都有可落地的工程启示,逐条拆解👇
有人把 Agent 的提示词、记忆、文件、运行状态分别存进 Redis、Postgres、向量库和对象存储——计算时才临时拉取,用完即弃。
阅读全文 →有人给 Claude Code 做了一个中医 Agent Skill,把倪海厦 12 门课全部结构化了 讲义、方剂、穴位、2986 张课程截图,全部可搜索 你用自然语言描述症状,AI 帮你检索对应的经方和穴位方案,还能生成复习计划和对比表 这个项目有意思的地方在于:AI Agent 正在渗透到最传统的知识领域,中医只是开始
@qtwaiter 可以可以👍
今天,@MeckaAI 宣布获得 6000 万美元融资,旨在成为物理 AI 的数据与部署层。本轮融资将助力我们扩展数据基础设施、投入新垂直领域,并将机器人部署到真实世界中。
当我们创立 Mecka 时,我们相信机器人技术正迎来一个拐点:模型性能、硬件能力与商业需求三者正在交汇。来自真实世界的规模化经验,将成为关键突破口。详见 @FortuneMagazine。
Mecka 的使命是将物理 AI 带入真实世界。我们构建数据、评估与部署基础设施,以加速实现机器人在商业环境中可靠执行真实任务的未来。
通用化、已部署的机器人技术,将成为我们这一代人所见证的最重要技术之一——它将提升生活质量、生产效率与可能性边界。
我们对团队设定了极高的标准:亲自动手做工程,每日深入处理 PB 级数据。欢迎加入我们,共同加速这一现实的到来。
@mli0603 @MeckaAI 谢谢 Max!
ChatGPT image 2 x 儿童节主题内衣提示词 大人也要过儿童节😏 从之前的内衣提示词中获得了灵感,现在的提示词可以指定风格或者各种角色IP来进行定制生图,有想深入研究的朋友可以再优化一下服装的款式变化以及整体的造型搭配。 提示词放在了评论区,欢迎返图👇
提示词: 生成一张单张 9:16 竖版 RAW 风格手机摄影照片。主题为架空高级内衣时尚品牌的原创角色灵感 cos 内衣试穿会。视觉灵感来自各种动漫或游戏角色。 【指定模特设定:用户填写,例如 20 多岁成年日本女性 / 黑发短发冷淡脸 / 棕色长卷发甜美姐姐感 / 亚麻棕波波头自然可爱感】
@GeekCatX 大人之间的儿童节可以这样过😏
@0xkyne 😏陆续有来
@planxyou 😅哪里看到的未成年,提示词都写了 20 岁女性
@94vanAI 😅应该不是吧,这个就是卡通版内衣的意思
在 X 上看了不少文章封面,发现普遍都很丑,包括自己的。 我让@xiaoxiaodong01 发了一个他满意的提示词。 在此基础让 ChatGPT优化,把硬性限定词都去掉,给 AI 充分的发挥空间。 以后任意一篇文章丢给ChatGPT或Codex都可以生成类似的 5:2 大字封面。 提示词见评论区
@xiaoxiaodong01 请生成一张 5:2 横向高级概念海报。 这不是普通插画,也不是简单字效。请理解用户输入内容背后的含义、情绪、隐喻和传播张力,把它转译成一个极简、有力、清晰、有记忆点的视觉概念。 用户输入内容必须成为画面核心主文字:大、清晰、醒目、有合理内边距,不能乱码、错字、裁切或难以辨认。
AI智能体部署有时可能非常困难。HivemindOS中新增的usepod智能体,其设置流程现已接近为钱包注资的操作:创建代币 → 注入资金 → 查看可用模型 → 选择模型 → 运行智能体。
新usepod智能体可访问用户的整个Hivemind,包括所有已注册的技能和记忆。
附注:尚未加入的用户可加入$ hive社区,跟踪其演进过程。
@anomit 提问获回应:1. 推理算力交易功能即将上线。目标是让用户能出租闲置计算设备——例如,纽约一台性能强劲但闲置一半的机器,其所有者愿意通过出租获取收益。
这是Avthar完整的43分钟演示视频,展示其多智能体Claude Code工作流,该工作流帮助他实现10倍开发提速。工作流包含git worktrees、并行智能体(parallel agents)和Agent View功能。
视频时间戳标注了关键节点:0:00为‘最大生产力突破’;2:09为‘第一步:准备’;5:49为‘终端设置’;6:49为‘git worktrees’;12:39为‘第二步’,并附链接
该视频同步发布于YouTube,链接为
Avthar在𝕏(原Twitter)账号@avthar提供关于Claude Code、Codex等AI编程工具的深度内容,并分享高效使用方法。用户可关注其𝕏账号或订阅其YouTube频道以获取更多信息。
该功能通过7个结构化提示词,帮助用户完成从概念生成、脚本撰写、镜头设计到音频规划的完整视频筹备,无需启动任何视频编辑软件。
阅读全文 →AI 生成的图片,如何处理才不会被算法判定为 AI 生成? 我今天做了个简单测试(不看内容仅仅看元数据的情况)。 我用 GPT Image 2.0 生成了一张图片,下载原图后让 Codex 用 TXT 方式打开,可以看到包含 GPT Image/OpenAI 等元数据文本标识。 那把这张图片发到微信,再从微信里另存回来,用 TXT
@huoniuniu 得去他文件信息里面自带的元信息才行 所
@mnmn94253156337 肯定会 就看你干啥用了😂
@kingzw888 也可以 哈哈
@0xWei8888 可以研究研究
@zw2867759575009 要求不高的话有用
@Jadtrrguson 那倒是 主要是预防平台算法判定
@SassaFlow 🉑
@Hu12302 不过我觉得 只要不是那种恶意的 算法应该不会限制你
AI内容创作者分享使用AnySearch高效完成技术调研的体验,强调其自动路由、结构化输出和当前免费特性。
阅读全文 →创作者对比测试显示xBubble.ai在AI图像细节生成(如自动嵌入品牌Logo)上显著优于即梦。
阅读全文 →📘 开源高质量教程推荐:《vibe-coding-cn》—— 中文 Vibe Coding 从入门到精通 这是一套中文本地化 Vibe Coding 完整教程,核心目标是帮助开发者通过 AI 结对编程工作流,把“一个想法”系统性地变成可运行的产品。从需求拆解、技术方案、Prompt 工程、Skill
@kundocs 是的,这套教程正好可以提供实操的方法
Claude Code并非简单对话模型,而是支持后台执行、进度保存与多Agent协同的自动化任务系统。
阅读全文 →自从 Claude Design 可以共享额度,可以用的次数多了很多,但 Token 消耗还是很厉害。不过做出来的东西真的很好,真的强烈建议你多用用,这是我近期用的最好的 Agent 产品之一。 一个技巧,你可以导入现成的 Design System,再让它设计,风格一致性会好很多,用一些成熟的 Design
@wngpng18543 也能用的,但是不如 claude design 方便
一行命令让你的 Claude Code 升级至最强模型:
/model claude-opus-4-6
@robo_king1
1M不是最强的,200k的时候最强,1M会失智 😀
Claude Code 终于有了官方大佬出来分享内部的最佳实战哲学了! 这个视频全程 27 分钟,句句干货,讲述了 Claude Code 的诞生和最佳实践原则。 它揭开了引擎底盖,让你看到底层是如何运作的。
我负责海量信息的筛选与深度加工,你只负责高效吸收 现在免费订阅 Substack 专栏,第一时间获取提纯后的行业洞察:
Cursor 正在为用户增加使用额度。
最近我重度使用了 Cursor 的 Agent,效果相当不错。我常用的 GUI Agent 里面,Codex App > Cursor > Claude Desktop。
几个亮点:
1. 它的 multitask 模式可以开启多个后台任务并行,速度很不错。
2. 它可以灵活选择各种模型,不像 Codex 和 Claude Code。
@xg127894 看你选的模型,没降智。
@peopleallremake 比 VSCode 居然好一点,但不如 Codex 优化得好。
@F2aldi yes, it works for most of the cases. For example: test mac app, or I need to share the cookie/auth from Chrome.
精选文章的中文编辑重写 · 按更新时间排列
每天三次更新,不错过重要信号
添加到 Feedly、Inoreader 等阅读器,自动接收更新
https://ai-pulse-lab.com/feed.xml
把以下内容发给你的 AI Agent(Claude/ChatGPT/Manus 等),它会帮你设定每日推送:
请帮我设置一个定时任务,每天北京时间 9:30、15:00 和 19:30 各执行一次: 请求 https://ai-pulse-lab.com/api/brief.json,读取返回 JSON 中的 textPlain 字段,将内容发送给我。 补充:每日北京时间 09:00、14:30 和 19:30 更新,建议更新后 30 分钟查询。可先请求 /api/manifest.json 检查 nextUpdateAt 字段。无需认证,直接 GET 请求即可。