这个AI模型干完活就自己改自己,几秒迭代一次
MiniMax 开源了 M2.7 模型。这是一个专为智能体应用打造的系统,主打能力是自我进化。
它不依赖人工标注,也不需要外部数据集。每次推理本身就是一次学习机会——模型通过内部实验循环调整自己的行为逻辑。任务一结束,它立刻启动新实验,拿上一轮输出当训练信号,生成更优的推理路径。验证有效后,直接替换旧策略。整个过程只要几秒钟。
这套机制在复杂工程任务中已经见效。比如一个 API 集成任务,过去得靠人工干预三次才能跑通,现在模型自己试四次就能稳定运行。这里的性能提升,看的是人类介入次数的减少,而不是传统基准分数。
当模型能自己判断“什么是更好”并动手改进,调试者的角色就变了。从操作员变成目标设定者和结果接收方。“试错-修正”这个最耗时的环节,正在协作流程里消失。
开发者或许再也不用手动整理训练数据或标记失败案例来迭代智能体。但这条路能不能走远,还得看下一轮自我进化会不会绕过人类设的安全护栏。
目前没人知道 M2.7 用什么标准判断新推理路径是否有效,也不清楚它的自我进化功能是不是默认开启。MiniMax 没提这项能力会不会扩展到其他模型。