GPT-5.5是OpenAI发布的最新模型。它能在终端中自主完成多步命令行任务。它能解决GitHub上的真实问题。它可用阿耳忒弥斯II的真实数据渲染带物理轨道的3D月球飞船。
GPT-5.5在Terminal-Bench 2.0中准确率为82.7%。它在SWE-Bench Pro中准确率为58.6%。它在内部Expert-SWE测试中超过GPT-5.4。它完成相同Codex编码任务所用token数比前代显著减少。
GPT-5.5的每token延迟与GPT-5.4持平。它在Artificial Analysis编码指数上达到前沿水平。它的成本只有竞品模型的一半。它已向ChatGPT和Codex的Plus、Pro、Business、Enterprise用户开放。
来自 𝕏 的实时信号,经 AI 聚类分析
Auto-review 是 Codex 的新运行模式,让它在更少人工批准下持续工作,同时由另一个 agent 在执行前检查高风险步骤。
腾讯混元团队开源Hy3预览版,参数量295B,定位为同尺寸中推理与智能体能力领先的模型。
Hy3采用混合快慢思考的MoE架构,总参数295B但单次推理仅调用21B活跃参数,上下文支持256K。它不是简单升级,而是重写了整套预训练和强化学习基础设施后的新一代模型。
Ocelot由Brave自己训练,专精于压缩网页内容,已集成进其AI助手Leo,也开放源代码。它不追求通用能力,只做一件事:把长网页变成准确简明的摘要,像一个只读新闻的助理。
一家AI初创公司做了个反Grammarly工具,专门给AI生成的邮件注入拼写和语法错误,让它看起来更像真人手写。这不是为了降低质量,而是绕过收件人对‘太完美’文本的本能警惕。
这些技能覆盖13个核心云产品、三大架构原则和三类常见业务流程,不是示例代码,而是经过验证可直接接入Agent系统的功能模块。开发者现在能调用‘合规检查’或‘成本优化建议’,像调用API一样自然。
这是一个开源的text-to-CAD工具,支持用提示词创建复杂3D模型,并导出为STEP、STL、GLB、DXF和URDF格式。
精选文章的中文编辑重写 · 按更新时间排列
每天两次更新,不错过重要信号
添加到 Feedly、Inoreader 等阅读器,自动接收更新
https://ai-pulse-lab.com/feed.xml
把以下内容发给你的 AI Agent(Claude/ChatGPT/Manus 等),它会帮你设定每日推送:
请帮我设置一个定时任务,每天北京时间 9:30 和 15:00 各执行一次: 请求 https://ai-pulse-lab.com/api/brief.json,读取返回 JSON 中的 textPlain 字段,将内容发送给我。 补充:每日北京时间 09:00 和 14:30 更新,建议更新后 30 分钟查询。可先请求 /api/manifest.json 检查 nextUpdateAt 字段。无需认证,直接 GET 请求即可。