电话&微信

18600577194

当AI涉足软件开发,开发者价值几何?

标签: 软件开发 AI开发 2026-02-04 

一位AI研究员跟我说了句话,让我一直忘不了:

“如果人类在某项任务上无法超越前沿模型,也无法给出有意义的指导,那人类的边际价值基本就是零。这与AI开发息息相关。这与软件开发息息相关。这是AI开发的重要体现。”

现在我们有数据了。了解AI开发有助于把握这一要点。这是软件开发的重要体现。AI开发的价值正在于此。Anthropic针对初级软件开发工程师的研究显示:不理解就直接用AI,掌握程度会降17%——相当于成绩掉两级。这与AI开发息息相关。了解软件开发有助于把握这一要点。

但有些AI用户得分很高。软件开发的价值正在于此。区别在哪?他们用AI是为了学习,不是为了甩锅。这与软件开发息息相关。

现在的问题早不是“能不能用AI”,而是“用AI是为了理解,还是为了避免理解?”

当AI能编码时

新的分水岭

软件开发界正在划一条线。不是资深vs初级,不是经验丰富vs新手。

这条线更深。

API之下

  • 能执行AI自主处理的任务

  • 照搬模式却不深究原理

  • 接受AI输出不加验证

  • 快速搭功能,却预见不了灾难

API之上

  • 用判断力引导系统

  • 知道AI什么时候在胡说

  • 产出AI生成不了的结果

  • 运用架构思维

问题来了:你站在这条线的哪边?

分水岭:AI做什么,人类还握着什么

领域

AI能力(API之下)

人类能力(API之上)

为什么重要

代码生成

快,输出全面

知道该删什么

AI默认过度设计

调试

靠训练数据匹配模式

系统级架构思维

AI看不到跨组件的 root cause(根本原因)

架构

局部优化

全局一致性

AI预见不了连锁灾难

重构

机械改代码

判断何时/为何/是否重构

AI不懂技术债的取舍

学习

瞬间回忆训练内容

痛出来的谨慎怀疑

AI没被自己的错误坑过

验证

廉价领域(能编译吗?)

昂贵领域(这方法对吗?)

AI分不清“能用”和“好用”

一致性

多文件间混乱

全代码库保持模式

AI丢上下文,造不一致实现

简化

加功能求全

拒绝复杂性的自律

AI默认给“大杂烩方案”

API之下:能执行AI的建议。

API之上:能判断AI的建议到底好不好。

这条线无关你能建什么,关乎你能验证、简化、维护什么。

为啥AI让初级快,却让资深无可替代

Tiago Forte 观察到一个关键:

“Claude Code让从零搭建比改现有代码更容易。v1的价值会暴跌,v2的维护价值会飙升。”

这就是v1/v2的现实:

初级用Claude搭个认证系统,200行代码20分钟,测试过了就上线,作品集看着挺唬人。

半年后业务要加SSO集成,他得调试自己没写过的逻辑,跟着AI选的模式走(原因还不懂),零架构背景。本应4小时的活儿拖3天——因为他从没想过搭v1时就为v2留后路。

这就是v1/v2陷阱。

AI商品化的技能(v1地盘)

  • 从零建项目(greenfield)

  • 生成样板代码

  • 套模板

  • 速度和功能迭代

AI替代不了的(v2+地盘)

  • 调试现有系统

  • 理解技术债

  • 判断重构还是重写

  • 维护架构一致性

陷阱就在这儿:初级用AI搭漂亮的v1充门面,却从没学v2+维护技能——而这才是真能卖高价的。

就像Ben Podraza回Tiago说的:“让你建两个格式一样的网页,你就得迭代几小时烧几千token。”

一致性难,上下文难, legacy(老代码)理解难。

这些恰恰是在成熟代码库工作、读别人代码、挣扎着做重构决策时学会的。

旧知识公共空间(比如Stack Overflow)教v2+技能,AI教v1技能。

猜猜2027年市场会为哪个买单?

架构鸿沟

《Clean Code》作者Bob大叔(Uncle Bob Martin)用Claude编码后说透了人类还剩啥贡献:

“Claude比我快多了,能记住更多细节,但它hold不住大局。不懂架构。虽然它会重构,却没动力为自己积累这价值。它预见不到自己在造灾难。”

危险在于:AI让加功能太容易,你就跳过了“慢下来想想”的步骤。

“没人管的话,AI会把代码堆成屎山。同样,人类用AI加功能也太顺手,结果也是功能堆成屎山。”

有人问:“不直接碰代码了,代码质量还重要吗?”Bob大叔回答扎心:

“我开始觉得,代码质量反而更重要了。”

为啥?因为总得有人维护AI生成的烂摊子的架构一致性。这人得懂代码“做了啥”和“为啥这么搭”。

Claude Code的现实检验

Claude Code和Anthropic的MCP协议出来后,开发者试了一圈AI优先流程,结果和Bob大叔观察一模一样:AI实现飞快,却瞎看不见架构后果。

Claude Code擅长

  • 快速生成样板

  • 单文件内按明确模式走

  • 专注任务时保持局部上下文

  • 实现定义清楚的规格

它天生短板(设计如此)

  • 理解项目级架构

  • 多文件间保持一致

  • 知道何时慢下来重想

  • 预见今天“快修”变明天技术债

  • 问“该不该建”而不是“怎么建”

这工具很强,我天天用。但把它当自动驾驶而不是指南针,就会造出Bob大叔警告的“代码堆”。

这不是Claude的错,是当前AI架构的根本限制。就像Peter Truchly说的:“LLM不是为求真设计的,是为输出连贯(也就是‘有用’)训练的。”

LLM会自信地生成能编译运行的代码。但代码对不对——架构合理、可维护、简单——得靠人类在Ben Santora说的“昂贵验证域”里判断。

这判断,才让你站在API之上。

真正重要的技能

从我“知识坍塌”那篇文章的讨论里,总结出这些让你留在API之上的能力:

1. 架构思维(Bob大叔的“大局观”)

  • 知道何时慢下来

  • 看见AI预见不了的连锁反应

  • 结合上下文做重构决策

  • 平衡技术债和新功能

2. v2+精通(Tiago的维护技能)

  • 调试复杂现有系统

  • 理解代码“为啥这么写”

  • 迭代中保持一致性

  • 选重构还是重写

3. 验证能力(Ben Santora的“裁判层”)

  • 识别AI“自信地错”的时候

  • 分清廉价验证域和昂贵验证域

  • 保持怀疑但不瘫痪

  • 测试假设,不只接受输出

Ben Santora解释AI推理局限时说:“知识坍塌发生在用求解器输出却不加独立裁判层验证时。风险不在AI写内容,而在AI成了自己的权威。”

廉价验证域:代码编译否?测试过否?API返回对否?

昂贵验证域:架构合理吗?能扩展吗?可维护吗?方法对吗?

AI在两个域都同样自信。但在昂贵域,你可能几个月后才发现系统在生产环境崩了——那时才知道错了。

4. 简化的自律(Doogal Simpson的“编辑力”)

评论区Doogal Simpson说:“我们在用编辑的自律换搜索的摩擦。现在的挑战不是生成代码,是有胆量拒AI给的‘大杂烩方案’。”

旧经济:稀缺逼简化(找答案贵)

新经济:丰富要自律(AI啥都生成,你得删)

技能从“加”变“删”,从“生成”变“筛选”,从“解决”变“判断”。

5. 领域专长(John H的上下文)

评论区John H说他一人开发店怎么有效用AI:

“我能专注当知识工作者,确保业务逻辑和客户可用性达标。”

John带来的是:

  • 3年应用经验

  • 深度客户认知

  • 懂业务规则

  • 能验证AI输出是否真解决问题

他不用AI当自动驾驶,当放大器,自己当裁判。

规律:有深度上下文的经验开发者用AI有效。他们能验证输出、抓错、知道何时推翻建议。

问题:初级没先攒够让验证成为可能的“血泪经验”,能学会这方法吗?

Anthropic研究:用AI vs 和AI一起学

写这篇文章时,Anthropic发了实验数据,验证了API上下的分野。

对初级工程师的随机对照试验:

  • AI辅助组快约2分钟

  • 但掌握度测验低17%(两个字母等级),“显著下降”

然而:AI组里也有人高分。

区别在哪?他们问“概念性和澄清性问题来理解代码”,而不是“甩锅或依赖AI”。

这就是分野:

API之下(甩锅)

“AI,帮我写这个函数”→快→没理解→测验挂

API之上(和AI一起学)

“AI,解释这方法为啥行”→慢但懂了→考高分

没理解的快=API之下。

用AI时学懂=API之上。

工具一样,你的用法决定你在哪边。

[来源:Anthropic研究,2026年1月]

最后一代问题

评论区Maame Afua说了关键:她是初级,但用AI有效,因为有导师。

“我从没经历过AI时代的优秀开发者那学到很多建议,一直照着做。”

传承机制:前AI时代开发者教AI时代初级验证技能。

Maame能验证AI输出,不是因为经验多,是前辈教她怀疑。她的学习路径:

  • 先打基础(看书、文档、正规资源)

  • AI当助手不当老师

  • 对照权威来源验证

  • 绝不实现自己解释不清的东西

但我们正走向悬崖:

现在有足够多前AI开发者当导师。5-10年后,多数资深也会主要跟AI学。

谁来教下一代怀疑?当没人懂验证时,谁传这习惯?

我们离彻底失去传承机制就差一代。

Maame幸运,她在窗口关闭前找到了好导师。2030年入行的初级就没这选项了。

人们怎么学验证

评论区两个开发者展示了不同路径:

艰难之路(ujja)

ujja通过痛苦经历学会“零信任推理”:

“太信AI,跑太快,几天后才发现核心假设错了。那时已经嵌进设计和逻辑,只能删大块重来。”

他的思维变了:

以前:“这听起来对吗?”

现在:“啥能让这错?”

现在他把AI当“超自信的初级开发——超有用,但得审”。

感悟:“我不觉得必须痛,但没有反馈环(比如浪费时间、构建失败),很难内化。AI去掉了摩擦,所以人们跳过验证,直到代价显现。”

刻意之路(Fernando)

Fernando Fornieles几个月前发现问题,没等被坑就行动:

  • 关了私人社交账号

  • 转到fediverse(去中心化社交)

  • 用树莓派搭家庭云服务器(Nextcloud)

  • 主动避开平台“摆烂”

他不是从痛苦中学,是按原则行动。

问题:我们能不靠ujja的痛,教出那种怀疑吗?能规模化Fernando的刻意行动吗?还是每个初级都得删一周的活儿才学会验证AI输出?

旧知识公共空间教了啥

Stack Overflow的争论教架构——有人提方案,其他人撕,摩擦中出共识,这摩擦练判断力。

代码审查文化教“慢下来想想”——不能随便发,有人会问“为啥这方法”,你得给架构决策找理由。

痛苦bug教预见灾难——你实现一个看似没问题的东西,生产环境炸了,就学会早看那些苗头。

老代码库教重构判断——你维护别人的决定,懂他们的约束,学会啥时候保留啥时候重写。

这些都是公开的:Stack Overflow、代码审查评论、GitHub issue、会议演讲。

AI辅助在私下进行。个人优化,没公共摩擦,没集体打磨。

让你留在API之上的技能,是咱们正在杀死的旧知识公共空间教的。

实用行动

如果你是初级/早期生涯

  • 主动找前AI导师:找ChatGPT前的开发者,让他们审你的AI代码,学他们的怀疑模式。

  • 在成熟代码库干活:别光建新项目,给老开源项目贡献,从技术债决策里学。

  • 公开记录思路:写“为啥选这方法”,发调试历程而非只给答案,给你消耗的公共空间做贡献。

  • 刻意练验证习惯:总拿AI输出对照文档,测试假设别光发,学会认“自信地错”,像ujja那样把AI当“超自信初级开发——得审”。

如果你是资深/有经验

  • 明确指导:教验证而非语法,分享怀疑模式,大声解释架构思维。

  • 保存架构知识:记“为啥做这决定”,发架构决策记录,写你预见过的灾难。

  • 刻意贡献公共空间:答Stack Overflow问题,写详细技术博客,开源你的思路而非只代码。

  • 让“慢下来想想”可见:给初级演示你暂停考虑的时刻,解释你问AI的问题,展示编辑/简化过程。

不安的问题

AGI wildcard(AGI变数)

评论区Leob抛终极问题:如果AI真能自主发明呢?

“AI下一步突破是能自己‘发明’,提新问题,自主创造内容,而不只是复述喂给它的东西。”

如果这样,“API之上”可能就没意义了。

但Bob大叔说:“AIhold不住大局,不懂架构。”Peter Truchly补充技术细节:“LLM不为求真,哥德尔/图灵局限适用,但LLM不在乎,只为输出连贯(有用)训练。”

两种未来:

  1. AI仍是高级重组机:知识坍塌污染训练数据,模型质量下降,API上下分野极重要,你的架构思维和验证技能还能值钱几十年。

  2. AI实现AGI和真发明:知识坍塌无所谓,因为AI生成新知识。但……人类贡献啥?

眼看知识坍塌在发生,把所有赌注押“AGI救我们”太冒险。或许该先解决已知问题,别指望可能让一切更糟的突破。

软件还需要人吗?

Mike Talbot反驳我整个前提:

“人为啥要建知识库?为了让大家把软件弄好用?如果AI不用人类知识库也能建软件,Stack Overflow死了谁在乎?”

他用自己例子:“我写第一个游戏,90年代迪士尼项目搞编译精灵。所有这些知识文档,被显卡淘汰了。没人关心我的编译精灵,只关心软件能用。”

他的点:每次范式转移都让旧知识过时,AI可能只是下一次转移。

我回应:显卡没拿他的编译精灵文档训练,是根本不同的路子。AI拿Stack Overflow、维基百科、GitHub训练。如果这些死了,AI训AI输出,我们就得模型坍塌而非范式转移。

Mike的挑战重要,它逼我们清醒:保存人类知识是因为它固有价,还是AI要继续进步必需?如果AGI出现,他的问题更急;如果不出现,保存人类知识更关键。

你到底贡献啥

回到最初问题:“你贡献啥是AI做不到的?”

你贡献验证。AI解题,你判题解好不好。

你贡献架构。AI写代码,你看它hold不住的大局。

你贡献预见。AI局部优化,你防它看不见的灾难。

你贡献上下文。AI有模式,你有领域专长、客户认知、历史理解。

你贡献昂贵验证域的判断。AI在廉价域(能编译吗?)厉害,你在昂贵域(能扩展吗?可维护吗?方法对吗?)厉害。

你贡献简化。AI生成大杂烩,你有删复杂的自律。

你贡献连续性。AI无状态,你跨系统、团队、时间维护一致性。

但不安的真相是:这些技能都不是天生的。

它们得学。通过摩擦,通过痛苦,通过公开挣扎,通过跟“过来人”学。

如果我们杀死知识公共空间,就杀了API之上技能的练兵场。

如果我们停止明确指导,就一代人丢了传承机制。

如果我们只优化速度,就丢了“慢下来想想”的肌肉。

留在API之上不是自动的。是你每天的选择。

选验证,不选盲从。

选简化,不选堆砌。

选预见,不选救火。

选指导,不选独建。

选发布,不选只消费。

API这条线是真的。你站哪边?