一位AI研究员跟我说了句话,让我一直忘不了:
“如果人类在某项任务上无法超越前沿模型,也无法给出有意义的指导,那人类的边际价值基本就是零。这与AI开发息息相关。这与软件开发息息相关。这是AI开发的重要体现。”
现在我们有数据了。了解AI开发有助于把握这一要点。这是软件开发的重要体现。AI开发的价值正在于此。Anthropic针对初级软件开发工程师的研究显示:不理解就直接用AI,掌握程度会降17%——相当于成绩掉两级。这与AI开发息息相关。了解软件开发有助于把握这一要点。
但有些AI用户得分很高。软件开发的价值正在于此。区别在哪?他们用AI是为了学习,不是为了甩锅。这与软件开发息息相关。
现在的问题早不是“能不能用AI”,而是“用AI是为了理解,还是为了避免理解?”

软件开发界正在划一条线。不是资深vs初级,不是经验丰富vs新手。
这条线更深。
API之下:
能执行AI自主处理的任务
照搬模式却不深究原理
接受AI输出不加验证
快速搭功能,却预见不了灾难
API之上:
用判断力引导系统
知道AI什么时候在胡说
产出AI生成不了的结果
运用架构思维
问题来了:你站在这条线的哪边?
领域 | AI能力(API之下) | 人类能力(API之上) | 为什么重要 |
|---|---|---|---|
代码生成 | 快,输出全面 | 知道该删什么 | AI默认过度设计 |
调试 | 靠训练数据匹配模式 | 系统级架构思维 | AI看不到跨组件的 root cause(根本原因) |
架构 | 局部优化 | 全局一致性 | AI预见不了连锁灾难 |
重构 | 机械改代码 | 判断何时/为何/是否重构 | AI不懂技术债的取舍 |
学习 | 瞬间回忆训练内容 | 痛出来的谨慎怀疑 | AI没被自己的错误坑过 |
验证 | 廉价领域(能编译吗?) | 昂贵领域(这方法对吗?) | AI分不清“能用”和“好用” |
一致性 | 多文件间混乱 | 全代码库保持模式 | AI丢上下文,造不一致实现 |
简化 | 加功能求全 | 拒绝复杂性的自律 | AI默认给“大杂烩方案” |
API之下:能执行AI的建议。
API之上:能判断AI的建议到底好不好。
这条线无关你能建什么,关乎你能验证、简化、维护什么。
Tiago Forte 观察到一个关键:
“Claude Code让从零搭建比改现有代码更容易。v1的价值会暴跌,v2的维护价值会飙升。”
这就是v1/v2的现实:
初级用Claude搭个认证系统,200行代码20分钟,测试过了就上线,作品集看着挺唬人。
半年后业务要加SSO集成,他得调试自己没写过的逻辑,跟着AI选的模式走(原因还不懂),零架构背景。本应4小时的活儿拖3天——因为他从没想过搭v1时就为v2留后路。
这就是v1/v2陷阱。
AI商品化的技能(v1地盘):
从零建项目(greenfield)
生成样板代码
套模板
速度和功能迭代
AI替代不了的(v2+地盘):
调试现有系统
理解技术债
判断重构还是重写
维护架构一致性
陷阱就在这儿:初级用AI搭漂亮的v1充门面,却从没学v2+维护技能——而这才是真能卖高价的。
就像Ben Podraza回Tiago说的:“让你建两个格式一样的网页,你就得迭代几小时烧几千token。”
一致性难,上下文难, legacy(老代码)理解难。
这些恰恰是在成熟代码库工作、读别人代码、挣扎着做重构决策时学会的。
旧知识公共空间(比如Stack Overflow)教v2+技能,AI教v1技能。
猜猜2027年市场会为哪个买单?
《Clean Code》作者Bob大叔(Uncle Bob Martin)用Claude编码后说透了人类还剩啥贡献:
“Claude比我快多了,能记住更多细节,但它hold不住大局。不懂架构。虽然它会重构,却没动力为自己积累这价值。它预见不到自己在造灾难。”
危险在于:AI让加功能太容易,你就跳过了“慢下来想想”的步骤。
“没人管的话,AI会把代码堆成屎山。同样,人类用AI加功能也太顺手,结果也是功能堆成屎山。”
有人问:“不直接碰代码了,代码质量还重要吗?”Bob大叔回答扎心:
“我开始觉得,代码质量反而更重要了。”
为啥?因为总得有人维护AI生成的烂摊子的架构一致性。这人得懂代码“做了啥”和“为啥这么搭”。
Claude Code和Anthropic的MCP协议出来后,开发者试了一圈AI优先流程,结果和Bob大叔观察一模一样:AI实现飞快,却瞎看不见架构后果。
Claude Code擅长:
快速生成样板
单文件内按明确模式走
专注任务时保持局部上下文
实现定义清楚的规格
它天生短板(设计如此):
理解项目级架构
多文件间保持一致
知道何时慢下来重想
预见今天“快修”变明天技术债
问“该不该建”而不是“怎么建”
这工具很强,我天天用。但把它当自动驾驶而不是指南针,就会造出Bob大叔警告的“代码堆”。
这不是Claude的错,是当前AI架构的根本限制。就像Peter Truchly说的:“LLM不是为求真设计的,是为输出连贯(也就是‘有用’)训练的。”
LLM会自信地生成能编译运行的代码。但代码对不对——架构合理、可维护、简单——得靠人类在Ben Santora说的“昂贵验证域”里判断。
这判断,才让你站在API之上。
从我“知识坍塌”那篇文章的讨论里,总结出这些让你留在API之上的能力:
知道何时慢下来
看见AI预见不了的连锁反应
结合上下文做重构决策
平衡技术债和新功能
调试复杂现有系统
理解代码“为啥这么写”
迭代中保持一致性
选重构还是重写
识别AI“自信地错”的时候
分清廉价验证域和昂贵验证域
保持怀疑但不瘫痪
测试假设,不只接受输出
Ben Santora解释AI推理局限时说:“知识坍塌发生在用求解器输出却不加独立裁判层验证时。风险不在AI写内容,而在AI成了自己的权威。”
廉价验证域:代码编译否?测试过否?API返回对否?
昂贵验证域:架构合理吗?能扩展吗?可维护吗?方法对吗?
AI在两个域都同样自信。但在昂贵域,你可能几个月后才发现系统在生产环境崩了——那时才知道错了。
评论区Doogal Simpson说:“我们在用编辑的自律换搜索的摩擦。现在的挑战不是生成代码,是有胆量拒AI给的‘大杂烩方案’。”
旧经济:稀缺逼简化(找答案贵)
新经济:丰富要自律(AI啥都生成,你得删)
技能从“加”变“删”,从“生成”变“筛选”,从“解决”变“判断”。
评论区John H说他一人开发店怎么有效用AI:
“我能专注当知识工作者,确保业务逻辑和客户可用性达标。”
John带来的是:
3年应用经验
深度客户认知
懂业务规则
能验证AI输出是否真解决问题
他不用AI当自动驾驶,当放大器,自己当裁判。
规律:有深度上下文的经验开发者用AI有效。他们能验证输出、抓错、知道何时推翻建议。
问题:初级没先攒够让验证成为可能的“血泪经验”,能学会这方法吗?
写这篇文章时,Anthropic发了实验数据,验证了API上下的分野。
对初级工程师的随机对照试验:
AI辅助组快约2分钟
但掌握度测验低17%(两个字母等级),“显著下降”
然而:AI组里也有人高分。
区别在哪?他们问“概念性和澄清性问题来理解代码”,而不是“甩锅或依赖AI”。
这就是分野:
API之下(甩锅):
“AI,帮我写这个函数”→快→没理解→测验挂
API之上(和AI一起学):
“AI,解释这方法为啥行”→慢但懂了→考高分
没理解的快=API之下。
用AI时学懂=API之上。
工具一样,你的用法决定你在哪边。
[来源:Anthropic研究,2026年1月]
评论区Maame Afua说了关键:她是初级,但用AI有效,因为有导师。
“我从没经历过AI时代的优秀开发者那学到很多建议,一直照着做。”
传承机制:前AI时代开发者教AI时代初级验证技能。
Maame能验证AI输出,不是因为经验多,是前辈教她怀疑。她的学习路径:
先打基础(看书、文档、正规资源)
AI当助手不当老师
对照权威来源验证
绝不实现自己解释不清的东西
但我们正走向悬崖:
现在有足够多前AI开发者当导师。5-10年后,多数资深也会主要跟AI学。
谁来教下一代怀疑?当没人懂验证时,谁传这习惯?
我们离彻底失去传承机制就差一代。
Maame幸运,她在窗口关闭前找到了好导师。2030年入行的初级就没这选项了。
评论区两个开发者展示了不同路径:
艰难之路(ujja)
ujja通过痛苦经历学会“零信任推理”:
“太信AI,跑太快,几天后才发现核心假设错了。那时已经嵌进设计和逻辑,只能删大块重来。”
他的思维变了:
以前:“这听起来对吗?”
现在:“啥能让这错?”
现在他把AI当“超自信的初级开发——超有用,但得审”。
感悟:“我不觉得必须痛,但没有反馈环(比如浪费时间、构建失败),很难内化。AI去掉了摩擦,所以人们跳过验证,直到代价显现。”
刻意之路(Fernando)
Fernando Fornieles几个月前发现问题,没等被坑就行动:
关了私人社交账号
转到fediverse(去中心化社交)
用树莓派搭家庭云服务器(Nextcloud)
主动避开平台“摆烂”
他不是从痛苦中学,是按原则行动。
问题:我们能不靠ujja的痛,教出那种怀疑吗?能规模化Fernando的刻意行动吗?还是每个初级都得删一周的活儿才学会验证AI输出?
Stack Overflow的争论教架构——有人提方案,其他人撕,摩擦中出共识,这摩擦练判断力。
代码审查文化教“慢下来想想”——不能随便发,有人会问“为啥这方法”,你得给架构决策找理由。
痛苦bug教预见灾难——你实现一个看似没问题的东西,生产环境炸了,就学会早看那些苗头。
老代码库教重构判断——你维护别人的决定,懂他们的约束,学会啥时候保留啥时候重写。
这些都是公开的:Stack Overflow、代码审查评论、GitHub issue、会议演讲。
AI辅助在私下进行。个人优化,没公共摩擦,没集体打磨。
让你留在API之上的技能,是咱们正在杀死的旧知识公共空间教的。
如果你是初级/早期生涯:
主动找前AI导师:找ChatGPT前的开发者,让他们审你的AI代码,学他们的怀疑模式。
在成熟代码库干活:别光建新项目,给老开源项目贡献,从技术债决策里学。
公开记录思路:写“为啥选这方法”,发调试历程而非只给答案,给你消耗的公共空间做贡献。
刻意练验证习惯:总拿AI输出对照文档,测试假设别光发,学会认“自信地错”,像ujja那样把AI当“超自信初级开发——得审”。
如果你是资深/有经验:
明确指导:教验证而非语法,分享怀疑模式,大声解释架构思维。
保存架构知识:记“为啥做这决定”,发架构决策记录,写你预见过的灾难。
刻意贡献公共空间:答Stack Overflow问题,写详细技术博客,开源你的思路而非只代码。
让“慢下来想想”可见:给初级演示你暂停考虑的时刻,解释你问AI的问题,展示编辑/简化过程。
AGI wildcard(AGI变数)
评论区Leob抛终极问题:如果AI真能自主发明呢?
“AI下一步突破是能自己‘发明’,提新问题,自主创造内容,而不只是复述喂给它的东西。”
如果这样,“API之上”可能就没意义了。
但Bob大叔说:“AIhold不住大局,不懂架构。”Peter Truchly补充技术细节:“LLM不为求真,哥德尔/图灵局限适用,但LLM不在乎,只为输出连贯(有用)训练。”
两种未来:
AI仍是高级重组机:知识坍塌污染训练数据,模型质量下降,API上下分野极重要,你的架构思维和验证技能还能值钱几十年。
AI实现AGI和真发明:知识坍塌无所谓,因为AI生成新知识。但……人类贡献啥?
眼看知识坍塌在发生,把所有赌注押“AGI救我们”太冒险。或许该先解决已知问题,别指望可能让一切更糟的突破。
软件还需要人吗?
Mike Talbot反驳我整个前提:
“人为啥要建知识库?为了让大家把软件弄好用?如果AI不用人类知识库也能建软件,Stack Overflow死了谁在乎?”
他用自己例子:“我写第一个游戏,90年代迪士尼项目搞编译精灵。所有这些知识文档,被显卡淘汰了。没人关心我的编译精灵,只关心软件能用。”
他的点:每次范式转移都让旧知识过时,AI可能只是下一次转移。
我回应:显卡没拿他的编译精灵文档训练,是根本不同的路子。AI拿Stack Overflow、维基百科、GitHub训练。如果这些死了,AI训AI输出,我们就得模型坍塌而非范式转移。
Mike的挑战重要,它逼我们清醒:保存人类知识是因为它固有价,还是AI要继续进步必需?如果AGI出现,他的问题更急;如果不出现,保存人类知识更关键。
回到最初问题:“你贡献啥是AI做不到的?”
你贡献验证。AI解题,你判题解好不好。
你贡献架构。AI写代码,你看它hold不住的大局。
你贡献预见。AI局部优化,你防它看不见的灾难。
你贡献上下文。AI有模式,你有领域专长、客户认知、历史理解。
你贡献昂贵验证域的判断。AI在廉价域(能编译吗?)厉害,你在昂贵域(能扩展吗?可维护吗?方法对吗?)厉害。
你贡献简化。AI生成大杂烩,你有删复杂的自律。
你贡献连续性。AI无状态,你跨系统、团队、时间维护一致性。
但不安的真相是:这些技能都不是天生的。
它们得学。通过摩擦,通过痛苦,通过公开挣扎,通过跟“过来人”学。
如果我们杀死知识公共空间,就杀了API之上技能的练兵场。
如果我们停止明确指导,就一代人丢了传承机制。
如果我们只优化速度,就丢了“慢下来想想”的肌肉。
留在API之上不是自动的。是你每天的选择。
选验证,不选盲从。
选简化,不选堆砌。
选预见,不选救火。
选指导,不选独建。
选发布,不选只消费。
API这条线是真的。你站哪边?