DeepSeek-v4-Pro对比GPT-5.5：相同提示词构建Agent Chatbot的差异与局限

📅 2026 年 5 月 4 日 📖 约 1 分钟 @laozhang2579 on 𝕏 AI工程研究

@laozhang2579: 用相同的AI Agent提示词从零构建Agent Chatbot，GPT-5.5在架构和工程基建上做到了90分，但Agent核心代码并没有完全按照规划的文档生成——这和大家最近说的降智、偷懒一样。DeepSeek-V4-Pro这边则是工程外围相对粗糙，但Agent核心是真的能跑。GPT-5.5 https://t.co/UhGnG9mMv7

上图为DeepSeek的实现，展示了Agent工具调用的推理过程可视化。如果要实现更强大的功能，不走Manus的虚拟机路线提供Agent运行环境，单靠大模型和纯工具调用确实会让Agent能力受限。E2B和microVM看来是成熟Agent产品都绕不过去的方式。

@limuvibecoding: flash参数量太小，幻觉太高，做客服还可以，开发我不敢用😂。我一直用主力的pro做全流程开发测试，整体很稳，大部分开发场景都能应对，比上个版本提升太多了，有种Claude 4.5-4.6 Sonnet的感受。

@smilexu7: 我也不信，从发布测到现在，对比mimo和kimi做了大量的代码实战和debug对比，用Claude4.7辅助评判，主要是agent构建场景，供参考。

@unbug: 感谢unbug的分享。我用的是Claude Code作为主力。你这一说，下次Codex额度用完我也体验一下。Codex的完全控制+/goal是真香，Claude自动模式必须用自家模型才会触发分类器才支持。

@Deep_Star_Six: Wow，这个分享很有价值。没想到DeepSeek深度还能做到这样。感谢你的分享，让看到的朋友了解到更多的能力边界。

📎 阅读原文 · @laozhang2579 on 𝕏

📬 订阅 AI Pulse