Try Out Codex GPT-5.5

一次用 Agent 模式和 SDD 开发 Atlas 的周末实验

为什么要做这个实验

2026 年 5 月,明显感觉 AI Coding 的能力又上了一个台阶。之前我试过 Cursor、Claude、Gemini 等工具,这一次 OpenAI Codex 的表现给我的感受很不一样,所以决定用一个真实的小产品来试试它到底能走多远。

我一直觉得 AI 辅助开发不是一个静态能力,它每隔一段时间就会突然变强一截。这次 Codex 的 Agent 模式让我有了很强的冲动:不再只是让 AI 写几个函数,而是把一个完整产品从想法、规划、前端、后端、部署,一路交给它推进。

这次我给自己的限制是:尽量不碰代码,只描述需求、判断结果、提出修改。

尝试 SDD

这次我特意在开发前使用了最近一直在了解的 Specification Driven Development。

一开始不是直接让 Codex 写代码,而是先让它建立产品需求、前端 Spec、后端 Spec、数据模型、地图路线能力、工程规范和 AI 开发协议。后续每次有新需求,都先判断是否需要更新 Spec,再进入实现。

这一步很关键。它让整个项目不是靠聊天上下文硬撑,而是有了一套能持续迭代的工程记忆。

从 Journey 到 Atlas

最早的想法很简单:做一个记录和规划旅程的 Web 应用。左边是旅程列表,右边是一张有艺术感的地图。每段旅程有事件节点、时间、地点、照片和交通方式。

后来在不断打磨和与 Codex 的人文主义探讨中,它逐渐变成了 Atlas:一个更像“私人地图集”的产品。

Git 历史也大致记录了这个过程:

  • 5 月 22 日:初始化项目、地图动画、侧边栏、地图交互、颜色系统
  • 5 月 23 日:继续打磨地图、时间线、交通方式
  • 5 月 24 日:接入 Supabase、公开空间、社交分享、移动端体验
  • 最后几轮主要集中在移动端、微信分享、事件照片和地图面板体验 这不是一次“生成一个 Demo”式的尝试,而更接近一个小产品的真实开发过程。

Codex 给我的惊讶

最让我意外的是,它不是简单执行命令,而是会给出非常专业的产品和工程建议。

比如它会建议:

  • 先确定产品理念和信息架构
  • 前端先用 Mock 数据把体验打磨清楚
  • 后端先定义接口边界,再接 Supabase
  • 地图能力单独拆 Spec,区分 Mapbox、AMap、路线规划和公共交通边界
  • 提前考虑 SEO、分享页、Open Graph、移动端、Vercel、域名
  • 数据模型预留未来多人使用和 AI 生成旅程的扩展空间

这已经不像过去“让 AI 帮我写代码”,更像是身边坐了一个很专业的全栈产品工程师。

优化体验时的能力

后面大量时间都花在体验打磨上,比如地图缩放、fly-over、事件节点图标、交通方式图标、移动端抽屉、照片展示、微信分享卡片等等。

很多时候我并不能非常准确地描述问题,只能说“这里不够好看”、“感觉太乱”、“这个交互不自然”。但 Codex 通常能理解我真正想表达的东西,然后拆成具体的 UI、交互和工程修改。

更重要的是,它不太像那种只会迎合你的 AI。它会按专业判断工作,必要时也会指出更合理的路径。

Agent 模式真的变可靠了

这次还有一个明显变化:每一轮开发结束后,它会自己跑检查,自己打开浏览器验证页面,自己看控制台错误和视觉效果。

过去使用 AI Coding,常常会有一种“它写完了,但你不知道能不能跑”的不确定感。这次 Codex 调用浏览器 Skills 做视觉验证的体验很好,很多问题它会自己发现、自己修掉。

这让 Agent 模式真正开始像一个可靠的开发流程,而不是一个高级代码补全。

成本也变成了真实问题

另一个真实感受是:20 美元/月的额度,在这种高强度 Agent 开发里很快就用完了。我大概 1 小时内就把5小时的额度打满,最后忍不住升级到了 100 美元/月。

如果只是问答,这个价格可能显得贵。但如果把它当成一个能陪你做个人产品的开发搭档,100 美元/月的额度对个人小产品开发来说已经差不多够用。

usage.png

Codex 不只是编码工具

开发到后面我会自然地让它做很多编码以外的事情:整理 Spec、维护 roadmap、总结 GitHub 版本管理规范、帮我分析博客结构、操作本地服务、处理依赖问题。

考虑到它还能控制电脑、浏览器、终端和各种工具,它的边界其实已经远远超过“写代码”。听说有人直接用它优化家里的网络,这种可能性确实很大。

成果

这次一个周末的密集开发,最终得到了一个可运行、可分享、可部署、也初步接入后端的小产品。(顺便把6月底的日本之行真实旅程安排给录入进去了)

项目地址: atlas.xumeng.me

index.png

总结

这次尝试让我很确定地感觉到,AI Coding 又进入了一个新阶段。

它不只是更会写代码了,而是开始能参与产品规划、工程决策、体验打磨、验证和发布。对于个人开发者来说,这意味着很多以前因为成本太高而放弃的小想法,现在真的可以用一个周末做出来。

当然,它还不是万能的,仍然需要人来判断方向、控制审美、提出需求、做最终选择。但如果把它放在一个清晰的工作流里,尤其是配合 SDD 这样的方式,它已经足够成为一个非常强的开发伙伴。