GPT-5.5处理扫描旧文件错误减少46%,可自主完成企业任务
OpenAI新模型GPT-5.5在Databricks的OfficeQA Pro基准测试中达到50%准确率,创下新纪录。这个基准专门评估模型处理扫描PDF、遗留文件和长上下文文档时的解析、检索和推理能力。相比GPT-5.4,GPT-5.5的错误减少了46%。
不再绕路
上一代GPT-5.4经常在任务中不必要的绕来绕去,导致效率低下。GPT-5.5在检索相关上下文和完成复杂工作流方面更可靠,不需要额外人工盯着。研究工程师Arnav Singhvi说,GPT-5.5在知识工作上是阶跃函数式的变化——它不再需要用户时刻监督每一步。
企业如何用上
Databricks通过AI Unity Gateway提供GPT-5.5,客户可以在AgentBricks和Agent Supervisor API搭建的工作流里直接用。模型负责协调解析、检索和执行,让多个AI智能体协作完成从头到尾的任务。Singhvi表示,基于GPT-5.5的Codex是目前所有代理和模型里最先进的。
目前还没有明确说明GPT-5.5在OfficeQA Pro上剩下50%错误具体是什么类型,定价和区域限制也没公开。但这一步已经让企业处理老旧文档和扫描件的自动化往前迈了一大截。