日常办公软件里改图，就跟改错别字一样简单

📅 2026 年 6 月 6 日 📖 约 20 分钟 @JulianGoldieSEO on 𝕏 AI工具微软

微软发布了一款新的图像生成与编辑模型，叫 MAI Image Generator。核心特点是四件事：图像逼真、文字清晰、人脸保持一致、编辑精确。

模型分两个版本。全保真版做高质量最终图像，Flash 版跑快速草稿。两种都强调“视觉推理”——不只是画像素，而是理解一个场景里的比例、角度、阴影、透视和物体该怎么放。

精确编辑是重点。你可以改图像里的某一块——比如换个人物手里的东西——其余部分不动。人脸和身份一致性也在设计里：同一张脸换了姿势、表情、视角，照样能认出来。文字渲染也改进了，图片里写字不再糊成一团。

模型已经放进微软自己的产品里：PowerPoint 做幻灯片配图、OneDrive 做文件预览和缩略图。开发者可以用 Microsoft Foundry 或 OpenRouter 调接口，普通用户可以在 MAI Playground 里试提示词。

首发基准测试表现不错，尤其在图像编辑这一项上。但别指望它全能——场景定位在缩略图、产品模型、幻灯片视觉和培训材料上，不是艺术级生成。

如果你要做一版演示、一张产品示意、或一组社交媒体配图，这个模型目前跑得动，而且能和现有的 Office 工作流直接搭起来。

📚 相关主题工具微软

📬 订阅 AI Pulse