自从 Golden Gate Claude 以来,我一直对“控制(steering)”着迷:这个概念是指在推理过程中直接操纵模型的激活状态,从而引导 LLM 输出的想法。
这篇帖子的灵感来自 antirez 最近的项目 DwarfStar 4,它是一个精简过的 llama.cpp 版本,专门用于运行 DeepSeek-V4-Flash。这个模型有何特别之处?它可能是许多工程师一直在等待的:一个足以与前沿模型低级代理编码能力竞争的本地模型。
来自 𝕏 的实时信号,经 AI 聚类分析
有人整理出7个Gemini提示词,声称可大幅提升学习效率;教程指向具体操作路径,不是泛泛而谈‘AI辅助学习’,而是给出可立即复制的输入模板;链接指向实操指南。
Higgsfield推出名为Supercomputer的新工具,多数人以为是视频生成器,实际定位是AI首席营销官;它能接管品牌策略、内容规划、传播节奏等原本由人承担的CMO职能;竞品尚未明确对标。
有人指出Markdown信息密度低,已不适应AI时代;HTML既能被人阅读,也能被AI代理直接解析和生成;新工具链正绕过Markdown,转向原生支持HTML的编辑与协作流。
Intern-S2-Preview是35B参数的科学多模态模型,核心科学任务表现接近万亿参数的Intern-S1-Pro;它是首个开源的、面向科研场景优化的轻量级基础模型;训练成本和部署门槛明显降低。
Orchard是开源的agentic建模框架,用一套轻量廉价沙盒基础设施支持SWE、GUI、个人助理等AI代理的训练。
牛津大学博士后 Kevin Lin 开源 Violin 工具,整合语音识别、LLM 翻译、语音合成,支持多语言互译、个性化翻译风格、视频对话三合一。
一个自由职业者用 KroWork 和 GPT-image-2 做商品主图和品牌视觉,在闲鱼和 Fiverr 挂单,从接需求到自动交付打包加水印,全链路固化成桌面应用。
Gemini Spark 被描述为不再等待用户输入提示词,而是主动筛选邮件、预约会议、跟进在线任务,甚至代人上网点击按钮填写表单。
有人把飞书 CLI 当作日常AI协作枢纽,让 AI 搜索资料后直接写入飞书文档,或调用 AI 审阅 PR 并自动评论,工作流起点是 Codex 和 Claude Code。
一笔融资背后的核心判断是:不是给现有业务加AI模块,而是从第一天起就按AI Agent能自主运行的方式设计公司结构和流程。
通过 Ollama 工具,用户可在本地运行开源模型(如 DeepSeek V4、Gemma)来复现 Codex 功能,整个过程不依赖 OpenAI 服务器。
Supertonic 是一个纯设备端语音合成引擎,用 ONNX 实现跨平台推理,支持31种语言,不依赖GPU,也能还原情绪细节。
Seeed Studio下周发布reComputer RK3576/RK3588,是基于Rockchip芯片的开源AI盒子,面向开发者和嵌入式AI创新者,配备最高32GB LPDDR5内存和6 TOPS NPU算力。
这个开源技能包让AI智能体调用AnySearch的实时搜索API,支持通用搜索、23个垂直领域和批量并行查询。
Codex和Claude Code在nanoGPT速度赛中自主优化,Opus以2930步打破人类2990步记录;强制提出新算法时,两者均无法脱离已有开源代码或论文跑通任何想法。
教程教人用Claude Code部署网站,声称只需用 plain English(纯英文自然语言)。
html-anything 开源项目让 Claude Code、Cursor 等 8 种本地 CLI Agent 直接将 Markdown、CSV、JSON、图片、SQL 转成 HTML,内置 75 套 Skill 模板,覆盖 9 类场景,零 API Key,自动识别已登录的本地 Agent。
Matt Pocock 开源了他每天用 Claude 写代码的真实方法,包含 18 个技能,针对沟通不对齐、术语不统一、缺反馈循环、代码熵增四个痛点。
Tencent AI团队专注解决AI agent长会话中上下文丢失问题,最终开源的记忆系统支持实时压缩过期上下文;有人看完分享发现,多数人还在堆上下文长度,而真正让agent变稳的,是这三招硬核操作。
CodeGraph为代码库提前构建语义知识图谱,Claude Code不再逐文件扫描,而是直接查图;VS Code这类巨型项目里,探索速度提升71%,token消耗大幅下降;有人用它把原本卡顿的调试流程变顺了。
TradingAgents是新开源的多智能体LLM交易框架,纯Python实现;它内置模拟环境、策略调度器和券商API适配层;量化新手用它搭了个新闻驱动型策略,在本地跑通了从舆情解析到下单的闭环。
Anthropic Fellows Program开放申请,提供每周3850美元薪资,无博士学位或科研经历要求;入选者全职学习AI系统设计与对齐实践;有人刚辞掉咨询工作报名,打算用三个月搞懂模型行为边界。
ScienceClaw 是一个框架,把科研流程拆成 285 个 Skill,接入 PubMed、Semantic Scholar、ArXiv 和 Google Scholar,供 LLM 调用。
牛津大学博士后 Kevin Lin 开源 Violin 工具,整合语音识别、LLM 翻译、语音合成,支持多语言互译、个性化翻译风格、视频对话三合一。
Orchard是开源的agentic建模框架,用一套轻量廉价沙盒基础设施支持SWE、GUI、个人助理等AI代理的训练。
html-anything 开源项目让 Claude Code、Cursor 等 8 种本地 CLI Agent 直接将 Markdown、CSV、JSON、图片、SQL 转成 HTML,内置 75 套 Skill 模板,覆盖 9 类场景,零 API Key,自动识别已登录的本地 Agent。
Seeed Studio下周发布reComputer RK3576/RK3588,是基于Rockchip芯片的开源AI盒子,面向开发者和嵌入式AI创新者,配备最高32GB LPDDR5内存和6 TOPS NPU算力。
ScienceClaw 是一个框架,把科研流程拆成 285 个 Skill,接入 PubMed、Semantic Scholar、ArXiv 和 Google Scholar,供 LLM 调用。
有人整理出7个Gemini提示词,声称可大幅提升学习效率;教程指向具体操作路径,不是泛泛而谈‘AI辅助学习’,而是给出可立即复制的输入模板;链接指向实操指南。
Higgsfield推出名为Supercomputer的新工具,多数人以为是视频生成器,实际定位是AI首席营销官;它能接管品牌策略、内容规划、传播节奏等原本由人承担的CMO职能;竞品尚未明确对标。
有人指出Markdown信息密度低,已不适应AI时代;HTML既能被人阅读,也能被AI代理直接解析和生成;新工具链正绕过Markdown,转向原生支持HTML的编辑与协作流。
Intern-S2-Preview是35B参数的科学多模态模型,核心科学任务表现接近万亿参数的Intern-S1-Pro;它是首个开源的、面向科研场景优化的轻量级基础模型;训练成本和部署门槛明显降低。
一个自由职业者用 KroWork 和 GPT-image-2 做商品主图和品牌视觉,在闲鱼和 Fiverr 挂单,从接需求到自动交付打包加水印,全链路固化成桌面应用。
Gemini Spark 被描述为不再等待用户输入提示词,而是主动筛选邮件、预约会议、跟进在线任务,甚至代人上网点击按钮填写表单。
有人把飞书 CLI 当作日常AI协作枢纽,让 AI 搜索资料后直接写入飞书文档,或调用 AI 审阅 PR 并自动评论,工作流起点是 Codex 和 Claude Code。
一笔融资背后的核心判断是:不是给现有业务加AI模块,而是从第一天起就按AI Agent能自主运行的方式设计公司结构和流程。
通过 Ollama 工具,用户可在本地运行开源模型(如 DeepSeek V4、Gemma)来复现 Codex 功能,整个过程不依赖 OpenAI 服务器。
Supertonic 是一个纯设备端语音合成引擎,用 ONNX 实现跨平台推理,支持31种语言,不依赖GPU,也能还原情绪细节。
Tencent AI团队专注解决AI agent长会话中上下文丢失问题,最终开源的记忆系统支持实时压缩过期上下文;有人看完分享发现,多数人还在堆上下文长度,而真正让agent变稳的,是这三招硬核操作。
CodeGraph为代码库提前构建语义知识图谱,Claude Code不再逐文件扫描,而是直接查图;VS Code这类巨型项目里,探索速度提升71%,token消耗大幅下降;有人用它把原本卡顿的调试流程变顺了。
TradingAgents是新开源的多智能体LLM交易框架,纯Python实现;它内置模拟环境、策略调度器和券商API适配层;量化新手用它搭了个新闻驱动型策略,在本地跑通了从舆情解析到下单的闭环。
Anthropic Fellows Program开放申请,提供每周3850美元薪资,无博士学位或科研经历要求;入选者全职学习AI系统设计与对齐实践;有人刚辞掉咨询工作报名,打算用三个月搞懂模型行为边界。
Matt Pocock 开源了他每天用 Claude 写代码的真实方法,包含 18 个技能,针对沟通不对齐、术语不统一、缺反馈循环、代码熵增四个痛点。
教程教人用Claude Code部署网站,声称只需用 plain English(纯英文自然语言)。
Codex和Claude Code在nanoGPT速度赛中自主优化,Opus以2930步打破人类2990步记录;强制提出新算法时,两者均无法脱离已有开源代码或论文跑通任何想法。
这个开源技能包让AI智能体调用AnySearch的实时搜索API,支持通用搜索、23个垂直领域和批量并行查询。
精选文章的中文编辑重写 · 按更新时间排列
每天两次更新,不错过重要信号
添加到 Feedly、Inoreader 等阅读器,自动接收更新
https://ai-pulse-lab.com/feed.xml
把以下内容发给你的 AI Agent(Claude/ChatGPT/Manus 等),它会帮你设定每日推送:
请帮我设置一个定时任务,每天北京时间 9:30 和 15:00 各执行一次: 请求 https://ai-pulse-lab.com/api/brief.json,读取返回 JSON 中的 textPlain 字段,将内容发送给我。 补充:每日北京时间 09:00 和 14:30 更新,建议更新后 30 分钟查询。可先请求 /api/manifest.json 检查 nextUpdateAt 字段。无需认证,直接 GET 请求即可。