EP1. 同样的 LLM,不同的结果
👥 你的 AI 代表多少位开发者?
「ChatGPT,给我写一个登录模块!」
如果你是开发者,大概一天里会像这样抛出好几次请求——用的是同一个 Claude、同一个 GPT。可结果却可能天差地别。
有人把 AI 生成的代码复制粘贴,通宵改到崩溃;有人却像带领十名顶尖工程师一样从容掌舵。工具一模一样——差距从何而来?
今天我们来聊聊这个秘密。
说实话:如今的 AI 能力惊人。它能在几秒内吐出一个函数——甚至一整块功能。一个 LLM 瞬间就能完成可能需要几十名开发者的工作量。这是令人兴奋的时代。
但这里我们要问一个严肃的问题。
「如果我面前有一百个不知疲倦、从不睡觉的初级开发者,我真的能领导他们吗?」
即便有一百个天才队友,若没有设定方向、分配任务、审查产出并整合结果的项目经理——或总监——会怎样?项目一夜之间就会陷入混乱。
我们正处在这样的境地。手边有一支庞大的 AI 大军,却仍需要做好准备去领导它。
🔍 初级开发者 A 与 B 的一天
来看两种常见模式,当作镜子:今天的你更像哪一个?
🚨 「AI 说什么就做什么」——开发者 A
忙碌的初级开发者 A 又在赶截止日期。情急之下,他问 AI:
「加一个登录模块。」
AI 很快给出看起来靠谱的代码。A 心想,AI 大概没搞错吧,没怎么多想就粘贴进项目。暂时能跑——松了口气。
但真正的问题一周后才浮现。
安全审查发现会话管理漏洞——或与另一模块的接口不匹配。从没搞懂自己粘贴了什么代码的 A,只好又通宵从头重写。
代码库在膨胀,A 的脑子里却堆满他不知道的东西——无知的雪球越滚越大。
🤝 「与 AI 一起思考」——开发者 B
同样资历的开发者 B 也需要登录模块。但他与 AI 的关系完全不同。
「我们的项目大约会有 10 万用户,安全至关重要。请先建议几种可用的认证方案,并比较各自的权衡。」
当 AI 提出基于会话的认证、JWT、OAuth 2.0 等选项时,B 与它来回推敲——为项目的未来(例如移动应用扩展性等)设计最佳结构。
经过一小时激烈讨论、架构敲定之后,B 才要代码。表面结果或许与 A 相似——但 B 完全理解为何这样设计、为何错误处理采用这种模式,以及背后每一条设计理由。
💡 是态度,不是技术
关键洞察在于:用最新模型,还是 Claude Code 对 Codex 对 Cursor 对 Antigravity,都没你想的那么重要。真正的差距来自你如何对待 AI。
- A 的态度:「AI 会搞定。我复制结果就行。」(交出主导权)
- B 的态度:「AI 是好工具,但最终我说了算。我必须完全理解。」(协作中保留主导权)
工具不会升级你。你如何对待工具,才会升级你。
若只把活丢给 AI,成长会很慢。若与 AI 一起思考、共同设计架构,每一次对话都会拓宽视野,能力持续扩展。
在 AI 能做百人工作的时代——你会是领导他们的总监,还是反复复制粘贴的工人?
🦉 Cocrates Harness 作为你的教练
你大概已经知道该像 B 那样工作。但在忙碌的日常里,每次都要问替代方案、比较权衡——没有体系的话——很难。
这时主角 Cocrates 登场。
Cocrates 不是丢下代码就消失的 AI 秘书。它是** AI 教练**,引导对话,让你学会用好 AI,并养成自己思考、自己决定的习惯。
- 若你说「教我一下」,它不会甩给你维基百科。它会用精准的问题,让你自己发现概念。
- 若你说「帮我做」,它不会用代码淹没你。它先设计架构——「若选这种架构,权衡是什么?」——等你理解并批准再继续。
简言之,Cocrates 是一套系统的 harness,帮你自然地掌舵,像总监 B 那样行动。
📌 要点回顾
- 同样的 LLM,不同的结果: 用户对工具的态度,比 AI 本身的性能更重要。
- A 与 B: 听令复制粘贴,对比共同设计架构并理解它。
- Cocrates 的角色: 用提问引导你,成长为有主导权的总监——而非不加批判的助手。
🎬 下期预告
在本系列中,有一条强有力的原则贯穿始终:
「未经审视的代码,不值得生成。」
下次我们会拆解:这句苏格拉底式的话,为何是初级开发者的真武器——以及审视究竟意味着什么。
已经好奇下一集?那你已经在总监 B 的路上了。下期见!👋
本系列介绍 Cocrates Harness 框架。Cocrates 是为苏格拉底式对话设计的 agent harness,使用户保留主导权并持续成长。