AI编程如今无处不在，但并非所有人都信服。

AI编程工具真能提升效率吗？研究揭示惊人真相：开发者速度竟变慢19%，代码质量下降引争议！

AI coding is now everywhere. But not everyone is convinced.

# AI编程工具：生产力革命还是技术债务陷阱？

开发者们正面临着期望与现实之间的困惑鸿沟，我们其他人也是如此。

对于AI驱动的编程，观点两极分化：有人认为它带来了前所未有的生产力提升，也有人警告其正在产生大量设计拙劣的代码，分散开发者注意力，并为软件项目埋下严重的长期维护隐患。问题在于，目前很难判断哪种说法更接近真相。

巨头的豪赌与开发者的现实

随着科技巨头向大语言模型投入数百亿美元，编程被吹捧为该技术的杀手级应用。微软CEO萨提亚·纳德拉和谷歌CEO桑达尔·皮查伊均声称，其公司约四分之一的代码现已由AI生成。今年3月，Anthropic CEO达里奥·阿莫代预测，六个月内90%的代码将由AI编写。

这确实是一个诱人且显而易见的用例：代码是一种语言形式，需求量大，且人工生产成本高昂。验证其是否有效也相对简单——运行程序即可立即知晓。

然而，MIT Technology Review在采访了30多位开发者、技术高管、分析师和研究人员后发现，实际情况远比表面复杂。

生产力神话遭遇现实检验

一线开发者的最初热情正在消退，因为他们不断触及技术的局限性。越来越多的研究表明，所谓生产力提升可能只是幻象。

关键数据对比：
* 早期研究（来自GitHub、Google、Microsoft等AI工具供应商）：开发者完成任务速度提升20%至55%。
* 贝恩公司2024年9月报告：实际节省“并不显著”。
* GitClear数据：自2022年以来，工程师产出的“持久代码”（数周内未被删除或重写）增加了约10%，但多项代码质量指标显著下降。
* METR（非营利研究组织）2024年7月研究：经验丰富的开发者主观认为AI使其速度提升20%，但客观测试显示他们实际上慢了19%。

软件咨询公司Substantial的首席开发者迈克·贾奇对此深有感触。他曾是AI工具的早期热情采用者，但逐渐对其局限性和有限的生产力提升感到沮丧。他进行了一项为期六周的自我测试，结果发现AI平均使他慢了21%——与METR的研究结果惊人一致。

贾奇进一步分析数据后提出质疑：如果这些工具真的大幅提升了效率，我们应该看到新应用、网站注册、视频游戏和GitHub项目出现爆炸式增长。然而，他分析所有公开数据后，“到处看到的都是平直的线条”。他的结论是：AI工具对大多数开发者的生产力提升微乎其微。

AI编程的“两面性”：效率与陷阱

擅长领域（“高光时刻”）

受访开发者普遍认同AI工具在以下方面表现出色：
* 生成“样板代码”（可在多处重复使用且几乎无需修改的代码块）。
* 编写测试。
* 修复错误。
* 向新开发者解释不熟悉的代码。
* 克服“空白页问题”，提供一个不完美的初稿以激发创意。
* 让非技术同事快速构建软件功能原型，减轻工程师负担。

显著局限与风险

然而，对于决定工程师价值的更复杂问题，这些工具面临重大障碍：

1. “近视”与上下文限制：LLM的“上下文窗口”（工作记忆）有限，难以解析大型代码库，且容易在长任务中遗忘目标。这可能导致代码虽然局部有效，但缺乏整体协调性，最终形成难以维护的“意大利面条式代码”。

2. 无视惯例，制造混乱：AI倾向于不理解项目/团队内现有的编码规范，经常以略有不同的方式解决问题，破坏代码一致性。GitClear CEO比尔·哈丁指出，这导致了复制粘贴代码量显著上升（很可能基于AI建议），而清理代码库的迁移操作大幅减少。

3. “幻觉”与隐蔽错误：编码模型会“幻觉”（输出看似合理但错误的内容）。由于其输出代码看起来非常工整，错误难以察觉。Mediaocean软件工程总监詹姆斯·刘形容，使用这些工具“很像拉老虎机的拉杆”——有时效率提升20倍，有时则完全失败，浪费大量时间。

4. 加剧技术债务：达特茅斯学院工程创新教授杰弗里·G·帕克指出，开发者常在开发速度与代码可维护性之间权衡，产生“技术债务”。AI工具让时间紧迫的工程师更容易走捷径。Sonar CEO塔里克·肖卡特警告，AI生成的代码正变得越来越冗长和复杂，虽然明显缺陷和安全漏洞减少，但导致维护问题的“代码异味”却增加了。Sonar近期研究发现，领先AI模型生成的代码中，超过90%的问题属于此类。

5. 安全隐患：乔治城大学安全研究员杰西卡·纪指出，代码越难更新和修复，随时间推移变得不安全的可能性就越大。具体风险包括：模型引用不存在的软件包（攻击者可创建同名恶意包）；以及“数据投毒攻击”，黑客通过污染训练数据使模型在特定触发条件下生成不安全代码。Anthropic的研究发现，仅需250份恶意文档就可在LLM中植入此类后门。

前沿探索与范式转变

尽管问题重重，但回归纯手工编码的时代“正迅速离我们远去”（GitHub COO凯尔·戴格尔语）。开发者正在学习与AI协作的新范式。

* 智能体（Agents）的突破：能够根据高级规划独立构建完整程序的自主编码工具是AI编程的最新前沿。Anthropic的编码智能体Claude Code负责人鲍里斯·切尔尼表示，最新的推理模型通过分步处理复杂问题并调用外部工具，实现了“真正的编码而不仅仅是谈论编码”。在SWE-bench Verified基准测试中，顶级模型解决真实错误的比例已从2024年8月的33% 提升至一年后的超过70%。

* “氛围编码”与效率飞跃：OpenAI联合创始人、特斯拉前AI总监安德烈·卡帕西提出了“氛围编码”概念，即用自然语言描述软件，让AI完成编写、优化和调试。软件开发机构Twenty20 Ideas的CTO特雷弗·迪利体验了Claude Code后，一个4小时的任务在2分钟内完成，且代码质量优于他的手写代码。他表示：“那一刻，真的，再也回不去了。”

* 学习曲线：浅但长：知名开源开发者阿明·罗纳赫尔指出，这些工具的学习曲线“浅但长”。经过数月专注实验，他现在90%的代码由AI生成。关键在于通过大量试错，弄清楚哪些问题容易让工具出错，哪些它们能高效处理。

* 角色转变：从码农到架构师：兽医 staffing 公司IndeVets的CTO尼科·韦斯特代尔认为，要最大化利用这些工具，开发者必须放弃对单行代码的控制，专注于整体软件架构。他最近通过提示模型而非亲自编写，构建了一个长达10万行代码的数据科学平台。他强调，虽然过程需要不断引导和审查，但产出的代码质量与他以往的作品一样好，“绝对是革命性的”。

组织挑战与未来展望

在大型工程团队中实现一致的结果则困难得多。谷歌产品管理高级总监瑞安·J·萨尔瓦指出，AI工具会放大工程文化的优缺点。清晰的流程、编码模式和最佳实践至关重要，需要将机构知识编码化以供模型有效利用。

加密货币交易所Coinbase是AI工具的积极采用者，其CEO布莱恩·阿姆斯特朗曾因解雇不愿使用AI工具的员工而登上头条。但其平台负责人罗布·维托夫透露，生产力提升并不均衡。在重构代码库和编写测试等简单任务上，AI工作流实现了高达90% 的加速。但对于其他任务，提升则较为有限，且改造现有流程带来的混乱常常抵消了编码速度的提升。

一个突出问题是：AI工具让初级开发者产出更多代码，但审核负担（通常由高级开发者承担）急剧增加，导致中层员工审核变更的能力迅速饱和。“这是我们几乎每月都要经历的循环，”维托夫说。

贝恩公司合伙人王珏指出，开发者仅将20%至40% 的时间用于编码，因此即使编码速度大幅提升，整体效率增益也往往有限。要获得显著提升，公司可能需要在问题分析、客户反馈处理、产品策略等所有环节应用生成式AI。

技术演进与可能出路

技术本身在快速进化。Anthropic的切尔尼表示，“每隔几个月模型就会改进，编码能力出现重大阶跃变化，你必须重新校准。”例如，Claude增加了规划模式、在需要时主动提问的能力，以及通过总结关键细节和使用子智能体来管理上下文，实现了“无限”上下文窗口。该公司称其最新模型Claude 4.5 Sonnet可以自主编码超过30小时而性能没有显著下降。

新的软件开发方法也可能规避编码智能体的缺陷：
* 验证编码：MIT教授马克斯·泰格马克提出了“验证编码”，旨在让智能体从自然语言描述中生成完全无错误的代码。这基于“形式化验证”方法，即创建软件的数学模型来无可辩驳地证明其正确性。在专为形式化验证设计的语言Dafny上测试约2000个问题时，最好的LLM解决了超过60%。泰格马克预计，针对验证编码进行专门训练可以迅速提高成绩。
* “一次性代码” ：商业软件巨头Intuit的首席工程师亚历克斯·沃登倡导“一次性代码”理念：每个组件由AI独立生成，无需遵循特定设计模式或惯例，然后通过API连接。这样，每个组件的内部运作不依赖于代码库的其他部分，可以单独替换而不产生广泛影响。“业界仍在担心人类维护AI生成的代码，”他说，“但我质疑人类还会查看或关心代码多久。”

人才隐忧与职业反思

AI工具最有害的副作用之一，可能是能够理解和维护代码的人才池正在缩小。早期证据表明，对AI摧毁工作岗位的担忧可能并非空穴来风。斯坦福大学近期一项研究发现，2022年至2025年间，22至25岁软件开发者的就业率下降了近20%，这与AI编码工具的兴起时间吻合。

经验丰富的开发者也可能面临困难。视频游戏基础设施开发商Companion Group的工程师卢西亚诺·努伊詹在工作中大量使用免费提供的AI工具。但当他在一个无法使用这些工具的副项目上工作时，他发现自己对曾经得心应手的任务感到挣扎。“我感觉自己很蠢，因为曾经是本能的东西变得需要手动操作，有时甚至很繁琐。”他认为，要保持编码的本能，唯一方法是定期练习基础工作，这也是他基本放弃AI工具的原因之一。

努伊詹和其他受访开发者抵制AI工具的部分原因，是一种职业空心化的感觉。“我从事软件工程是因为我喜欢与计算机打交道，喜欢让机器做我想做的事，”他说，“坐在那里让工作替我完成，一点意思都没有。”

—

延伸思考

1. 技能悖论：当AI能够高效完成大部分基础编码任务时，未来软件工程师的核心竞争力将如何定义？是转向更高层次的系统架构、问题定义和AI管理能力，还是说深入理解代码底层逻辑的“工匠精神”会变得更加珍贵？

2. 经济模型转变：如果“一次性代码”和快速原型生成成为主流，软件开发的成本结构、项目评估方式以及知识产权（是保护代码还是保护API与架构设计）会发生怎样的根本性变化？这是否会催生全新的软件行业商业模式？

阅读 Technology Review 的原文，点击链接。

AI编程如今无处不在，但并非所有人都信服。

巨头的豪赌与开发者的现实

生产力神话遭遇现实检验

AI编程的“两面性”：效率与陷阱

擅长领域（“高光时刻”）

显著局限与风险

前沿探索与范式转变

组织挑战与未来展望

技术演进与可能出路

人才隐忧与职业反思

延伸思考

由 Simon

您错过了

信用合作社、金融科技与金融服务的人工智能拐点

摩根大通将人工智能支出视为核心基础设施

The Download：美国数字权利打击行动与人工智能伴侣

超越试点项目：迈向可组合与主权人工智能

Recent Post

AI编程如今无处不在，但并非所有人都信服。

巨头的豪赌与开发者的现实

生产力神话遭遇现实检验

AI编程的“两面性”：效率与陷阱

擅长领域（“高光时刻”）

显著局限与风险

前沿探索与范式转变

组织挑战与未来展望

技术演进与可能出路

人才隐忧与职业反思

延伸思考

由 Simon

相关文章

The Download：美国数字权利打击行动与人工智能伴侣

超越试点项目：迈向可组合与主权人工智能

因打击网络仇恨而被美国禁止入境是什么感受

您错过了

信用合作社、金融科技与金融服务的人工智能拐点

摩根大通将人工智能支出视为核心基础设施

The Download：美国数字权利打击行动与人工智能伴侣

超越试点项目：迈向可组合与主权人工智能