AI 终于能把菜单上的字写对了
前两年你让 AI 画个墨西哥卷饼店菜单,它能把 'burrito' 拼成 'burrto','margarita' 写成 'margartas'。这不是它马虎,是压根没把文字当回事——扩散模型从噪点里重建图像,优先学大块颜色和形状,几个像素的文字?直接当杂讯糊掉。
ChatGPT Images 2.0 现在真能写出像样的菜单了。字不歪、拼写对、行距自然,连小图标都规整,2K 分辨率下看着跟饭馆门口贴的真菜单没两样。
有人试过用类似大语言模型的方式逐块生成图像,更贴近“写字”的逻辑。但 OpenAI 没说是不是这么干的,只含糊提了句新模型有“思考能力”:能联网查资料、一提示出多图、还能自己检查错别字。
日语、韩语、印地语这些非拉丁文字支持明显变强。gpt-image-2 API 已上线,按分辨率和质量收费。复杂图还是要等几分钟,但已经快到能塞进工作流了。
所有 ChatGPT 和 Codex 用户从周二起就能用,付费用户还能批量生成不同尺寸的营销图或多格漫画。不过它的知识库停在 2025 年 12 月——完蛋,文件名果然都是乱码。
当 AI 能稳定写出正确文字,很多原本得设计师手动调半天的活,现在普通人点几下就行。牛皮吹爆了?其实不过是终于肯把文字当人看了。