Google推出Gemini API双新推理层:Flex降本50%,Priority保障关键业务
Google为Gemini API新增Flex(低成本、高延迟)和Priority(高可靠性、自动降级)两个同步推理层级,开发者仅需设置service_tier参数即可统一调度,无需切换异步Batch API。
Google
AI工程商业
微软发布三款自研基础模型:语音转写、语音生成与图像生成
微软AI实验室推出MAI-Transcribe-1、MAI-Voice-1和MAI-Image-2三款多模态基础模型,主打低成本、高效率,并已上线Foundry与MAI Playground平台。
TechCrunch
AI工程商业
自动化抢购Lambda Labs A100实例:开源工具lambda-manager上线
开发者Giles Thomas开发命令行工具lambda-manager,自动轮询Lambda Labs API,检测并启动8×A100等紧缺GPU实例,支持Telegram通知。
Giles Thomas
AI工程开源
OpenAI收购科技播客TBPN,强化AI公共对话与独立媒体合作
OpenAI宣布收购AI领域知名播客TBPN,保留其编辑独立性,将其纳入战略部门以推动全球AI公共讨论,并提升技术传播的深度与可信度。
openai.com
AI媒体工程
OpenAI 推出 Codex 按量付费模式,支持团队灵活试用与扩展
OpenAI 为 ChatGPT Business/Enterprise 团队新增 Codex 独立席位,按 token 消耗计费、无速率限制,并提供最高 $500 新人激励;ChatGPT Business 年费同步降至 $20/座。
openai.com
AI工程商业
Zep AI 招募工程师:打造 AI 代理的实时上下文引擎
YC W24 孵化企业 Zep AI 正加速扩张,其开源时间上下文图引擎 Graphiti 已获 2.4 万 GitHub Stars,专注解决 LLM 代理在生产环境中的上下文检索难题。
Y Combinator
AI工程开源
Lemonade:开源本地AI平台,分钟级部署支持多模态推理
Lemonade 是一个轻量级开源本地AI服务,支持文本、图像与语音全模态处理,兼容 OpenAI API,1分钟安装,自动适配 GPU/NPU,单机可并行运行多个模型。
lemonade-server.ai
AI开源工程
Pika 推出 AI 代理实时视频通话功能,支持接入 Google Meet
Pika 新上线 AI 代理实时视频通话能力,Claude、OpenClaw 等 LLM 可直接加入 Google Meet 会议,实现音视频双向交互。
𝕏 @minchoi
🧵 Thread
AI工程产品
GitHub Copilot 正式推出命令行版 Copilot CLI
GitHub 推出 Copilot CLI 工具,支持通过 npm、Homebrew 或 WinGet 快速安装,登录 GitHub 账户后即可在终端中直接调用 AI 编程辅助功能。
𝕏 @github
🧵 Thread
AI开发工具工程
Vibe Jam 2026 推出轻量级 JS 小工具,支持一键嵌入游戏页
开发者 @s13k_ 与 @levelsio 合作推出 Vibe Jam 2026 官方 JS widget,仅需一行 script 标签即可在游戏页面右下角显示活动徽章。
𝕏 @levelsio
🧵 Thread
AI工程开源