AI Pulse

日常办公软件里改图,就跟改错别字一样简单

日常办公软件里改图,就跟改错别字一样简单

微软发布了一款新的图像生成与编辑模型,叫 MAI Image Generator。核心特点是四件事:图像逼真、文字清晰、人脸保持一致、编辑精确。

模型分两个版本。全保真版做高质量最终图像,Flash 版跑快速草稿。两种都强调“视觉推理”——不只是画像素,而是理解一个场景里的比例、角度、阴影、透视和物体该怎么放。

精确编辑是重点。你可以改图像里的某一块——比如换个人物手里的东西——其余部分不动。人脸和身份一致性也在设计里:同一张脸换了姿势、表情、视角,照样能认出来。文字渲染也改进了,图片里写字不再糊成一团。

模型已经放进微软自己的产品里:PowerPoint 做幻灯片配图、OneDrive 做文件预览和缩略图。开发者可以用 Microsoft Foundry 或 OpenRouter 调接口,普通用户可以在 MAI Playground 里试提示词。

首发基准测试表现不错,尤其在图像编辑这一项上。但别指望它全能——场景定位在缩略图、产品模型、幻灯片视觉和培训材料上,不是艺术级生成。

如果你要做一版演示、一张产品示意、或一组社交媒体配图,这个模型目前跑得动,而且能和现有的 Office 工作流直接搭起来。

阅读原文
📚 相关主题 工具微软

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部