OpenAI Codex 本地运行用 Ollama 怎么配置

Question

Accepted Answer

OpenAI的Codex编程助手现在可以通过Ollama工具在本地电脑上免费运行，整个过程不依赖OpenAI服务器，避免了API费用和调用限制 [2][3]。Ollama是一个轻量级的本地模型运行框架，它让用户无需复杂的环境配置，就能直接在自己电脑上加载和运行多种开源大模型，从而复现Codex的核心编程辅助功能。这意味着开发者可以将代码补全、智能问答等能力完全控制在自己的硬件中，数据无需上传云端。

在实际配置上，流程非常简洁。首先需要在本机安装Ollama，然后通过一条命令拉取你希望使用的开源模型，例如Gemma 4或DeepSeek V4，这些模型已被验证可以良好支撑Codex类功能的本地运行 [1][2]。接着，启动Codex应用，并将其后端推理指向本地Ollama服务即可。根据知识库的描述，这种配置方式支持自定义推理参数，并且重启电脑后数据不丢失，配置持久化 [1]。对于已经使用其他本地AI工具的用户，Ollama也提供了统一的接入入口，例如通过类似“ollama launch”的命令来直接调用本地模型，简化不同模型之间的切换 [4]。

这种本地运行方案带来的直接好处是成本归零和数据隐私保护。由于不走API，用户不会按token付费，也不存在速率限制，可以无限次调用 [3]。所有代码库、业务数据和对话记录都留在本地电脑或企业内部网络中，满足金融、医疗等行业的合规需求 [5]。例如，戴尔已经将Codex直接部署在企业自有基础设施上，确保数据不离网 [5]。此外，本地运行还能灵活选择不同规格的开源模型，比如MiniMax M2.7等接近顶级性能的量化模型也能在消费级硬件上跑 [11]。

📬 订阅 AI Pulse