
用AI花3个月完成百名程序员7年工作
这并非孤例。就在不久前的2026年2月,OpenAI曝光了一项内部实验,彻底撕下了AI编程的最后一块遮羞布。在那项名为“驾驭工程”的实验中,一个最初仅3人的工程师团队,利用Codex智能体在5个月内从零造出了一个百万行代码产品。整个过程中,人类程序员不被允许写一行手工代码。他们的任务只有一个:想清楚要什么、把规则立起来,剩下的交给AI。
结果令人震撼:每人每天平均能推进3.5个代码合并请求,而请求的执行环节——实现、测试、文档、配置——全程由智能体代劳。实验早期进展缓慢,不是因为AI不行,而是因为环境定义得不够清晰。一旦人类把“地图”画好,AI就能连续工作六个小时以上,甚至是在人类睡觉的时候。
OpenAI给这套工作流起了一个意味深长的名字:驾驭工程。人不再是码农,而是驾驭AI的“牧羊人”。
谷歌则在另一个维度上摊了牌。2026年4月的Cloud Next大会上,CEO皮查伊扔出一颗重磅炸弹:谷歌内部75%的新代码,现在由AI生成,工程师只负责审核。半年前这个数字还是50%,增速之快连谷歌自己的人都没缓过神来。
一个特别复杂的代码迁移项目,在AI辅助下完成速度是纯人工的6倍。Gemini Mac版应用的初始版本,从idea到原型只用了几天——全程由谷歌内部的Agentic开发平台搭建。
更有趣的是,谷歌内部出现了一种新的阶层分化:能用Claude的人,和不能用Claude的人。谷歌DeepMind竟给部分员工“开绿灯”允许使用竞争对手Claude编程,因为不少工程师私下坦言,在编程表现上,Gemini确实逊色于Claude。
连谷歌自己的人都这么说了,你大概能感受到这场变革的烈度。说回那位CTO朋友的案例。三个月、6000美金,撬动的是百人七年的工作量。这意味着什么?
首先,成本结构被击穿了。100多名程序员七年的薪资,哪怕按平均年薪30万人民币计算,也是2个多亿的人力成本。而AI只花了6000美金——折算下来不到5万人民币。这不是降本增效,这是降维打击。
其次,技术债的偿还周期被压缩了。遗留系统重构一直是软件工程的噩梦。传统模式下,面对一个混乱了七八年的老项目,多数团队会选择“能跑就别动”。因为重构的成本和风险高到没人敢拍板。但AI的出现改变了这个算账逻辑——三个月就能重写一遍,谁还会忍受那个满是窟窿的老系统?
第三,人的角色被彻底重新定义了。过去,程序员的核心竞争力是写得快、写得好、经验多。现在这些正在被AI快速抹平。正如Cognition AI创始人Scott Wu所说,软件开发大约10%的时间用来思考要做什么,剩下90%的时间都在处理实现的细节。现在那90%不用人干了。
那么剩下的10%是什么?理解问题、设计方案、决定架构。而这些,正是过去那些只会“接需求写代码”的人最不擅长的事。
当然,需要泼一盆冷水的是:这种“三个月顶七年”的奇迹,目前仍有前提条件。那位CTO重写的是自家公司的项目。这意味着他对业务逻辑、架构设计、边界条件了如指掌。AI负责执行,他负责拍板和纠偏。如果没有这个“人”在,单靠AI从零理解一个复杂业务系统,三个月恐怕远远不够。
方汉在采访中也提到,他每月消耗20亿至30亿Token——这个量级足以说明,即便是AI辅助,算力成本依然不低。每天20亿Token,这背后是实打实的计算资源和金钱投入。
但趋势已经明朗。OpenAI的实验中,智能体的代码审查工作已经大部分移交给了“智能体对智能体”,人类的干预正在逐渐后撤。当AI能自己审自己写的代码时,那10%的“人”的领地,还能守多久?
这场变革最残酷的地方,或许不在于淘汰多少人,而在于重新分配“谁值钱”。过去,一个经验丰富但反应稍慢的老程序员,工资可能比刚毕业的年轻人高两三倍。但当AI能瞬间写出标准答案时,经验的溢价正在缩水。反倒是那些敢于做决策、能承担不确定性风险、愿意同时跑五六条路径并行探索的人,正在被AI成倍放大价值。
Cognition AI的招聘逻辑很能说明问题。面试时AI工具随便用,要求从零构建一个完整产品。考察的不是你能不能写代码,而是你认为应该构建什么、开发中怎么做决策、面对不同路径怎么取舍。这些问题,AI回答不了。
三个月顶七年,这句话既是效率的赞歌,也是职业的丧钟。它宣告了一个旧时代的结束:靠堆人头、熬时间来完成项目的模式,正在变得不合时宜。同时也开启了一个新时代的悬念:当AI包办了90%的执行,那剩下的10%——那个真正值钱的“人”——你准备好了吗?




