AI Pulse

这个开源模型,已经给自己提了17次代码改进

MiniMax 刚刚开源了 M2.7。GitHub 仓库的 README 写得直白:‘M2.7:可复现、可调试、可分叉’。

它不是 demo,也不是蒸馏版。模型权重、训练脚本、推理服务、评估流水线——全都打包放出。现在你只需一台 RTX 3090,两小时就能从零跑通完整微调流程。

博客里有个小节叫 ‘Self-evolution’。配图是一张纯文本流程图:模型读论文 → 生成假设 → 写 Python 脚本调用 RL 环境 → 解析日志 → 重写 prompt → 提交 PR 到自己的代码仓。整个过程由同一个模型驱动,中间没人插手。

这条路走得通,靠的是真实的强化学习环境、真实的 Git 工作流,还有真实的指标监控。

模型已经在自己的仓库里提交了第 17 个 self-improvement commit。

HadiInTech 说:‘疯狂的不是模型,是 harness loop。’这个 loop 里的调度逻辑、错误处理、版本比对,100% 由 LLM 生成并执行。

这谈不上‘AI 替代研究员’。它只是把研究动作拆成可调度、可回滚、可协作的原子操作。

下次看到一个新开源的模型,先别急着跑 benchmark。翻翻它的 .github/workflows 目录——那里藏着它到底能不能自己动起来的秘密。

📎 阅读原文 · @Yuchenj_UW on 𝕏