AI Pulse · 2026 年 6 月 30 日

今日焦点

AI模型投票平台靠卖深度分析报告年入1亿美元

你打开一个网页，输入“写一首关于秋天的诗”，屏幕左右并排出现两个AI模型的回答，你比较后点击你认为更好的那个。这个动作看似简单，却是衡量AI模型水平的重要方式。

这个网站叫Arena，它的AI模型排行榜对公众免费开放。你输入一段提示，Arena随机发给两个模型，你来选哪个更好。这套机制起源于2023年加州大学伯克利分校的一个研究项目，由Anastasios Angelopoulos、Wei-Lin Chiang和Ion Stoica联合创立。到2025年4月，它正式注册为公司。

千万次投票，催生一门生意

阅读全文 →

🔥 信号雷达

𝕏 实时信号 + arXiv 前沿论文，经 AI 聚类解读 · 一眼扫完全貌

行业动态 · Hacker News▲ 45

DeepSeek V4 调整了峰谷定价，大模型降价了？

大模型API服务商调整定价，使用成本会随之变化，直接影响每次调用API的开销

在 HN 看讨论 ↗ 原文 / 论文 ↗

行业动态 · Hacker News▲ 51

Anthropic CEO称开源AI正在变得越来越危险

这是2023年的旧讨论被重新挖出来，这一观点持续影响开源AI发展的监管方向

在 HN 看讨论 ↗ 原文 / 论文 ↗

行业动态 · Hacker News▲ 563

通义千问3.6 27B被评为本地开发最优选择

做本地大模型开发一直需要平衡性能和硬件需求，这个模型被开发者认为刚好卡在最合适的点上。

社区讨论：多数开发者质疑该评测的门槛过高，128GB内存的MacBook Pro起售价达6699美元，高配版本更是近万美元，远超出普通开发者的硬件配置水平，这笔费用足够购买大量云服务API credits甚至一辆新车。有人指出在该笔记本上本地跑大模型会发烫噪音大，无法日常coding。也有普通配置用户提问，希望能推出适配中低端硬件、小参数量能良好支持工具调用的量化版本。

还有人提到Gemma4 31B体验也很好，只是比较被低估。

在 HN 看讨论 ↗ 原文 / 论文 ↗

行业动态 · Hacker News▲ 52

能自己搭框架的自主编码大模型发布了

这是一个针对自主编码任务设计的自脚手架大语言模型，可以省掉人工搭建框架的步骤

在 HN 看讨论 ↗ 原文 / 论文 ↗

行业动态 · Hacker News▲ 142

开源自主编码模型，居然能自己迭代优化

做编码相关工作的人，可以多一条免费自主迭代的开源工具路径

社区讨论：多数试用者认为这个通义千问微调的开源编码模型表现不错，能给出有创造性的编码方案，没人要求9-35B参数的模型一键生成完整应用。不少人质疑它只是堆基准分的换皮千问，有人实际测试发现它 bug 查找能力差，无工具对话时幻觉严重，长会话工具调用表现拉胯，甚至连声称的31B稠密模型都找不到权重和基准测试数据，还有开发者提到9B稠密版需要单张80GB显存GPU，普通用户根本用不了。

在 HN 看讨论 ↗ 原文 / 论文 ↗

大模型 · @xiaohu▲ 2.4万

马斯克的Grok 4.5现在已经内部测性能了

基于1.5T V9基础模型，补充训练加入了Cursor数据，已经在SpaceX和Tesla测试，早期评估性能接近甚至超过Opus

马斯克说他们的Grok 4.5，基于他们的的 1.5T V9 基础模型并在补充训练中加入了 Cursor 数据现已在 SpaceX 和 Tesla 进入早前测试阶段早期评估显示性能接近 Opus，甚至可能已超过Opus

AI模型投票平台靠卖深度分析报告年入1亿美元

千万次投票，催生一门生意

🔥 信号雷达

DeepSeek V4 调整了峰谷定价，大模型降价了？

Anthropic CEO称开源AI正在变得越来越危险

通义千问3.6 27B被评为本地开发最优选择

能自己搭框架的自主编码大模型发布了

开源自主编码模型，居然能自己迭代优化

马斯克的Grok 4.5现在已经内部测性能了

多家顶流开源 coding 模型打包包月，刚好撞上闭源模型收紧权限

不用GPU，5万颗中国ASIC跑出一流大模型

一站式用多个开源大模型，不用再管理一堆API密钥

Google AI Studio 新增功能，分享应用可带完整对话

用最土办法实现了多个AI一起协作干活

马斯克要求优化Grok中各细小AI性能瓶颈

你听说吗？字节跳动能一键生成4K30秒短片了

LlamaIndex推出了同时支持两种搜索的检索工具

AI智能体现在支持程序自动创建子智能体了

有CEO说量子计算能把AI训练提速好几个量级

有人吐槽Anthropic是对开源最不友好的公司

美团预训练大模型，用了五万多颗AI ASIC

AI代理不再事后打分，边聊边修正方向

检测AI智能体错误，成本只要闭源模型的1%

把LangGraph智能体转成语音智能体，现在超简单

Cursor AI推出远程开发+iOS新功能 需手动开启

开发者Omar分享实测有效的人物搜索工具CLODOAI

AI编码开始改变开发习惯 项目瞄准AI原生Web3开发

分享普通人研究美股的标准化流程工具

M5 Max MacBook Pro对比NVIDIA DGX Spark本地AI运行

Google AI Studio 新增功能，分享应用可带完整对话

一站式用多个开源大模型，不用再管理一堆API密钥

检测AI智能体错误，成本只要闭源模型的1%

不用GPU，5万颗中国ASIC跑出一流大模型

多家顶流开源 coding 模型打包包月，刚好撞上闭源模型收紧权限

美团预训练大模型，用了五万多颗AI ASIC

你听说吗？字节跳动能一键生成4K30秒短片了

马斯克的Grok 4.5现在已经内部测性能了

LlamaIndex推出了同时支持两种搜索的检索工具

AI智能体现在支持程序自动创建子智能体了

有CEO说量子计算能把AI训练提速好几个量级

有人吐槽Anthropic是对开源最不友好的公司

开源自主编码模型，居然能自己迭代优化

能自己搭框架的自主编码大模型发布了

通义千问3.6 27B被评为本地开发最优选择

Anthropic CEO称开源AI正在变得越来越危险

DeepSeek V4 调整了峰谷定价，大模型降价了？

AI代理不再事后打分，边聊边修正方向

用最土办法实现了多个AI一起协作干活

把LangGraph智能体转成语音智能体，现在超简单

马斯克要求优化Grok中各细小AI性能瓶颈

M5 Max MacBook Pro对比NVIDIA DGX Spark本地AI运行

分享普通人研究美股的标准化流程工具

AI编码开始改变开发习惯 项目瞄准AI原生Web3开发

开发者Omar分享实测有效的人物搜索工具CLODOAI

Cursor AI推出远程开发+iOS新功能 需手动开启

📖 深度解读

AI模型投票平台靠卖深度分析报告年入1亿美元

谷歌用AI摘要替代搜索：劣化传统搜索后的必然结局

Anthropic推出Claude apps gateway，管理员可统一管理Claude Code权限与费用

Claude模型上线Azure企业平台，微软账号直接调用

加州政府折扣价用Claude，文件处理提速但决策权不交AI

📬 订阅 AI Pulse

Cursor AI推出远程开发+iOS新功能需手动开启

AI编码开始改变开发习惯项目瞄准AI原生Web3开发

AI编码开始改变开发习惯项目瞄准AI原生Web3开发

Cursor AI推出远程开发+iOS新功能需手动开启