美国红杉独家专访Open AI Codex团队:从代码自动补全到异步自主代理,编程正在被彻底重新定义

美国红杉独家专访Open AI Codex团队:从代码自动补全到异步自主代理,编程正在被彻底重新定义

4.8
0热度

你有没有想过,编程这件事情可能彻底变了?开发者正在从单纯使用AI工具,转向将AI视为构建软件的全新基础。这不是什么小调整,而是一场彻底的范式转变。想想看,那些我们一直习以为常的核心概念——版本控制、代码审查、甚至"开发者"的定义——都在因为AI agent驱动的工作流而被重新定义。OpenAI 的 Codex 团队最近分享了一个让我深感震撼的观察:他们发现现在的工程师已经不愿意在没有WiFi的飞

美国红杉独家专访Open AI Codex团队:从代码自动补全到异步自主代理,编程正在被彻底重新定义


你有没有想过,编程这件事情可能彻底变了?开发者正在从单纯使用AI工具,转向将AI视为构建软件的全新基础。这不是什么小调整,而是一场彻底的范式转变。想想看,那些我们一直习以为常的核心概念——版本控制、代码审查、甚至"开发者"的定义——都在因为AI agent驱动的工作流而被重新定义。


OpenAI 的 Codex 团队最近分享了一个让我深感震撼的观察:他们发现现在的工程师已经不愿意在没有WiFi的飞机上写代码了。为什么?因为没有AI助手,编程变得太低效了。这种变化发生得如此之快,以至于连他们自己都感到惊讶。Hansen Wang 回忆说:"有趣的是,我之前创业的一个想法就是在没有WiFi的飞机上写代码时想到的,但现在我再也不会这么做了,因为市场已经完全改变了。"这种转变正在重新定义什么叫做"生产力编程",而 Codex 正是这场变革的先锋。


从 Hansen Wang 和 Alexander Embiricos 的分享中,我看到了一个更深层的变化:我们正从"配对编程"转向"委托编程"。以前,AI更像是一个聪明的自动补全工具,现在它已经进化成了一个可以独立完成整个任务的智能助手。这种转变的意义远比表面看起来的要深远,它正在改变软件开发的基本逻辑。


从自动补全到独立工作:AI编程的进化之路


我一直在思考一个问题:什么是真正的编程革命?当我了解了 OpenAI Codex 的演进历程后,我意识到我们正在经历的不仅仅是工具的升级,而是整个开发范式的重构。2021年的第一代 Codex 主要做代码自动补全,那时候它就像一个非常聪明的代码提示器,能够根据你的输入预测下一行代码。但现在的 Codex 已经完全不同了——它有自己的容器、自己的终端环境,可以在云端独立完成整个开发任务,从理解需求到写代码、测试、提交PR,整个流程都能自主完成。


这种转变让我想起了计算机历史上的另一个重要节点:从批处理到交互式计算的转变。以前程序员需要提交打孔卡片,等待几个小时才能看到结果;后来有了终端,可以实时交互。而现在,我们又迎来了一个新的转折点:从人类主导的交互式编程,转向AI主导的自主编程。在这种模式下,开发者不再需要逐行编写代码,而是描述想要实现的功能,然后让AI agent自己去思考、实现和验证。


Alexander 提到了一个非常有意思的对比:传统的推理模型就像一个刚毕业的计算机专业学生,在编程竞赛中表现出色,但缺乏专业软件工程师的实际经验。而 Codex 则经过了大量的强化学习训练,学会了如何写出符合企业级标准的代码——包括适当的代码风格、规范的PR描述、完善的测试等等。这就像是给那个优秀的毕业生提供了几年的职场经验,让它理解了什么是真正的"专业代码"。


这种进化的关键在于训练数据和方法的改变。不再只是让AI学习如何解决算法题,而是让它学习真实世界中软件工程师的工作模式:如何阅读现有代码库的风格并保持一致,如何写出清晰的注释和文档,如何进行充分的测试验证,甚至如何撰写让团队成员容易理解的提交信息。我觉得这种训练方式的转变,正是AI从"会写代码"到"会做软件工程"的关键跃迁。


最让我印象深刻的是 Codex 团队提出的"委托编程"概念。传统的AI编程工具更像是一个贴身助手,你写一行它补全一行,你们紧密配合完成任务。但 Codex 提出了一种完全不同的协作模式:你将整个任务委托给它,然后它在自己的环境中独立工作,最后给你一个完整的解决方案。这种模式的改变不仅仅是技术层面的,更是心理层面的。


Hansen 分享了一个很有启发性的观察:他们发现很多用户刚开始使用 Codex 时并没有找到太大价值,因为他们还在用配对编程的心态去使用这个工具。但那些真正发挥出 Codex 价值的用户,都采用了一种"丰富心态"——不是谨慎地尝试一两个任务,而是大胆地同时启动很多任务,看看哪些能成功。他们发现,一个用户如果在一天或一小时内运行了20个任务,那他基本上就理解了如何正确使用这个工具。


这种心态转变让我想到了云计算刚兴起时的情况。最初,很多公司把云服务器当作传统物理服务器来使用,没有发挥出云计算的真正优势。只有当人们开始拥抱"按需扩展"、"失败快速恢复"等云原生思维时,才真正释放了云计算的潜力。同样,委托编程也需要一种新的思维方式:不是期望每个任务都完美成功,而是通过大量并行尝试来找到最佳解决方案。


更有趣的是,这种新的协作模式正在改变代码审查的本质。以前代码审查主要关注代码质量和逻辑正确性,现在则更多地变成了对AI产出结果的验证和选择。Alexander 特别强调了 Codex 在这方面的创新:它不仅会展示代码变更,还会详细记录执行过程,包括运行了哪些终端命令、得到了什么输出、测试结果如何等等。这种透明度让人类审查者能够更好地理解和验证AI的工作过程。


我认为这种转变预示着软件开发角色的重新定义。开发者的工作重心将从"写代码"转向"设计方案"和"验证结果"。就像 Alexander 说的,开发者的时间分配可能会发生根本性改变:从35%的时间写代码,转向更多时间用于需求分析、架构设计、代码审查和系统维护。这不是说开发者变得不重要了,而是说他们的价值将更多体现在战略思考和质量把控上。


真实案例:当AI在凌晨1点拯救产品发布


让我印象最深的是 Hansen 分享的一个真实故事,这个故事完美诠释了 Codex 的实际价值。在产品发布前的凌晨1点,团队遇到了一个棘手的动画bug。这种情况下,要么砍掉这个功能直接发布,要么继续熬夜调试。但工程师决定尝试一种新的解决方式:把bug描述输入给 Codex,并让它尝试4次不同的解决方案。结果,前3次尝试都失败了,但第4次给出了完美的解决方案,团队立即部署了代码,最终动画功能成功包含在产品发布中。


这个故事让我思考了很多。首先,它展示了AI编程的一个重要特征:批量尝试的价值。在传统编程中,开发者通常会花很多时间思考"正确"的解决方案,然后实施。但在AI编程时代,更有效的策略可能是让AI快速尝试多种方案,然后从中选择最佳的。这种"试错优化"的方法在人类编程中成本很高,但对AI来说几乎没有额外成本。


其次,这个案例也说明了AI编程特别擅长的场景:bug修复。Codex 不仅能写新代码,还能独立地重现问题、分析原因、验证解决方案。这种端到端的问题解决能力,正是传统自动补全工具所缺乏的。它能够像人类工程师一样进行调试:运行代码、查看输出、分析错误、修改代码、再次测试,直到问题解决。


最重要的是,这个故事展现了AI编程的时效性价值。在时间紧迫的情况下,让AI并行尝试多种解决方案,比人类花时间思考单一方案更有效。这种能力在快节奏的软件开发环境中显得尤为珍贵,特别是在需要快速迭代和及时修复的场景下。


我还注意到团队内部如何使用 Codex 的模式:很多工程师早上来到办公室后,第一件事就是启动几个 Codex 任务,然后去喝咖啡吃早餐,回来后查看生成的PR并在IDE中进行最后的调整。这种异步工作模式正在成为新的开发节奏,开发者不再需要从零开始写代码,而是从80%完成的代码开始进行精细调整和优化。


软件开发的未来:从界面操作到意图表达


Hansen 和 Alexander 对软件开发未来的展望让我重新思考了整个行业的发展方向。他们认为,未来大部分代码将由AI agent在自己的环境中编写,而不是在开发者的本地环境中。这种转变将彻底改变我们对"编程"这个概念的理解:从直接操作代码转向表达编程意图,从逐行编写转向任务委托。


我特别认同他们对软件数量爆发式增长的预测。Hansen 提到了一个很有意思的观察:如果你打开手机看看里面的应用,大部分都是为了数百万用户而构建的通用应用,很少有专门为你个人或小团队定制的软件。但随着编程成本的大幅降低,我们将看到更多定制化、个性化的软件出现。这让我想到了早期的计算机时代,那时候每个程序都是为特定需求量身定制的,现在我们可能会回到那种模式,但规模会大得多。


更有趣的是他们对开发工具演进的思考。IDE不会消失,但它们的重心将从"写代码"转向"审查代码"、"规划项目"和"验证结果"。开发者的一天可能会是这样开始的:早上来到办公室,启动几个AI编程任务,然后去喝咖啡,回来后在IDE中审查和完善AI生成的代码。这种异步协作模式正在重新定义什么是高效的软件开发。


他们还提到了一个我觉得很前瞻的想法:未来的项目管理界面可能会像TikTok一样。想象一下,AI agent会主动发现问题并提出解决方案,以视频形式展示给你,你可以向右滑动表示同意实施,向左滑动表示需要讨论,长按提供具体的修改建议。虽然这听起来像个玩笑,但它揭示了一个重要趋势:当AI能够自主工作时,人类的角色更多地转向策略决策和质量把控。


我认为这种转变对整个软件行业的影响将是深远的。首先,软件开发的门槛将大大降低,更多非技术背景的人能够通过自然语言描述来创建软件。其次,专业开发者的价值将更多体现在架构设计、需求分析和系统集成上。最后,我们可能会看到软件行业的重新洗牌,那些能够有效利用AI编程能力的团队将获得巨大的竞争优势。


从技术角度看,让AI agent能够在真实的软件开发环境中可靠工作,面临着许多我们可能没有想到的挑战。Hansen 分享了一个让我印象深刻的细节:他们在设计训练环境时发现,真实世界的代码库非常复杂和混乱。比如,Alexander 展示了他们收购的一个初创公司的代码库,Hansen 的第一个反应是:"单元测试在哪里?"因为AI agent依赖单元测试来验证代码正确性,但很多真实项目根本没有完善的测试。


这个观察揭示了一个重要问题:AI编程工具的效果很大程度上取决于现有代码库的质量。为了让AI能够更好地理解和操作代码,开发团队需要重新审视他们的代码组织方式。Hansen 提到了几个实用的建议:使用强类型语言、编写更小更好测试的模块、添加完善的文档等。这些本来就是好的编程实践,但在AI时代变得更加重要。


我特别注意到他们在项目命名上的巧思。Codex 项目的内部代号是"WHAM",他们选择这个名字是因为在代码库中很容易搜索,不会和其他常见词汇混淆。如果他们用"code"或"agent"这样的通用词汇,AI在搜索相关代码时就会遇到困难。这种为AI优化的编程实践,可能会成为未来软件开发的新标准。


另一个技术挑战是如何处理长时间运行的任务。Codex 可以运行30分钟甚至更长时间来完成复杂任务,这对模型的稳定性和专注度提出了很高要求。Hansen 提到他们的模型已经在"保持专注"方面有了很大改进,但仍然会遇到AI"失去耐心"的情况,就像实习生一样会说:"抱歉,我觉得这个任务太复杂了,我没有足够时间完成。"这种拟人化的行为既有趣又说明了当前技术的局限性。


我认为这些技术挑战和解决方案给我们提供了重要启示:AI编程的普及不仅需要AI技术的进步,也需要整个软件开发生态系统的适应和改进。代码库需要变得更加结构化和可理解,开发实践需要更加规范,工具链需要更好地支持AI agent的工作模式。这是一个系统性的变革,而不仅仅是工具的升级。


市场竞争与差异化:OpenAI的独特优势


在AI编程工具的竞争中,我注意到Hansen和Alexander对市场前景的看法很有意思。他们认为市场会出现各种不同的解决方案:有些工具在用户的本地环境中工作,有些像Codex一样在云端独立工作。但他们相信,未来大部分代码将由拥有独立计算环境的AI agent编写,这种模式将成为主流。


OpenAI的独特优势在于他们不仅有强大的AI模型,还有ChatGPT这个被广泛使用的AI助手平台。Alexander提到了一个很重要的愿景:未来用户不需要在不同的专业agent之间切换,比如编程agent、购物agent、出行agent等,而是有一个统一的助手可以处理所有类型的任务。这个助手就是ChatGPT,它会根据任务类型自动调用相应的专业能力。


我觉得这种统一平台的策略很有前瞻性。想象一下,你可以在同一个对话中让AI帮你分析数据、写代码、订餐厅、安排会议,而不需要打开不同的应用或学习不同的界面。这种无缝的多任务处理能力,可能是OpenAI相对于专门编程工具的核心优势。同时,对于专业用户,他们仍然可以在专门的工具环境中使用针对性优化的界面和功能。


Hansen强调了他们在模型训练方面的优势:Codex使用了与训练环境完全相同的生产环境,避免了"在我的机器上能工作"的经典问题。用户使用的容器环境就是AI训练时使用的环境,这种一致性保证了更好的性能和更少的意外情况。这种训练和部署环境的统一,可能是其他竞争对手难以复制的技术护城河。


从长期来看,我认为AI编程工具的竞争将不仅仅是技术层面的,更多是生态系统的竞争。谁能够更好地整合不同类型的AI能力,谁能够提供更流畅的跨任务体验,谁就更有可能在这个快速发展的市场中胜出。OpenAI在这方面的确有着独特的优势,但关键是如何将这些优势转化为用户价值和市场份额。


开发者角色的演进:从编码者到架构师


在这次访谈中,我最受启发的部分是他们对开发者角色未来演进的思考。Alexander提到,目前工程师只有大约35%的时间在实际编写代码,其余时间用于需求讨论、设计规划、代码审查、测试验证和系统维护等工作。随着AI承担越来越多的编码工作,开发者的时间分配将进一步向策略性工作倾斜。


这种转变让我想到了建筑行业的演进。现代建筑师很少亲自搬砖砌墙,但他们的价值并没有因此降低,反而更多地体现在设计理念、空间规划、材料选择和工程协调上。同样,未来的软件开发者可能更像是"软件架构师",专注于系统设计、技术选型、质量把控和团队协调,而把具体的代码实现委托给AI agent。


我特别认同他们提到的一个观点:编程工具越容易使用,软件的需求就会越多。现在我们手机里的应用大部分都是为数百万用户设计的通用软件,个性化定制软件很少。但随着AI大大降低了软件开发成本,我们可能会看到更多为特定团队或个人需求定制的软件。这将创造出大量新的开发需求,而不是简单地替代现有开发者。


Hansen的预测让我印象深刻:他认为专业软件开发者的数量会大幅增加,而不是减少。这听起来可能有些反直觉,但仔细想想是有道理的。当创建软件变得更容易时,就会有更多的软件被创建,从而需要更多的人来设计、管理和维护这些软件。就像电子表格软件的普及没有减少会计师的数量,而是让更多人能够进行财务分析一样。


我认为这种角色演进对当前的开发者来说既是机会也是挑战。机会在于,他们可以从重复性的编码工作中解放出来,专注于更有创造性和战略性的工作。挑战在于,他们需要提升自己在系统架构、产品设计、团队管理等方面的能力。那些能够适应这种转变的开发者,将在AI时代获得更大的价值和影响力。


我对AI编程未来的深度思考


从这次访谈中,我看到了软件开发行业正在经历的深刻变革,这种变革的影响可能比我们想象的更加深远。我认为我们正站在一个历史性的转折点上:从人力密集的软件开发,转向智能化辅助的软件创造。这不仅仅是工具的升级,而是整个行业DNA的重新编程。


最让我兴奋的是AI编程可能带来的创造力爆发。当编程的技术门槛大大降低后,更多有想法但缺乏编程技能的人将能够创造出真正有用的软件。这就像是给每个人都配备了一个专业的开发团队,让创意和实现之间的距离大大缩短。我预期我们将看到更多小众但精准的软件产品,更多个性化的解决方案,以及更多跨领域的创新应用。


但我也看到了一些需要深入思考的挑战。首先是代码质量和可维护性的问题。当AI能够快速生成大量代码时,如何确保这些代码的长期可维护性?如何建立有效的质量控制机制?其次是技能传承的问题。如果新一代开发者主要通过与AI协作来学习编程,他们是否还能掌握深层的计算机科学原理?这种技能结构的变化会对软件行业的长期发展产生什么影响?


我还思考了AI编程对软件安全性的影响。AI生成的代码可能包含难以察觉的安全漏洞,特别是在复杂的系统集成场景中。我们需要开发新的安全审查方法和工具,来应对这种新的风险模式。同时,随着软件创建变得更容易,我们可能会看到更多的恶意软件和安全威胁,这需要整个行业重新审视安全策略。


从商业角度看,AI编程将重新定义软件公司的竞争优势。传统上,拥有大型开发团队是软件公司的核心竞争力之一。但在AI编程时代,小团队可能能够创造出与大团队相当的产品,这将让竞争变得更加激烈,也让创新变得更加民主化。那些能够有效利用AI编程能力,并在产品设计、用户体验、商业模式等方面建立差异化的公司,将在新的竞争格局中胜出。


我相信,我们正在见证软件开发历史上最重要的变革之一。就像从汇编语言到高级语言,从单机软件到网络应用,从桌面程序到移动应用一样,AI编程代表着另一个重要的发展阶段。这个阶段的特征是:更高的抽象层次、更低的创建门槛、更快的迭代速度,以及更广泛的参与者。我对这个变革充满期待,也对其中蕴含的机遇和挑战保持警觉。未来几年,我们将见证这场变革如何重塑整个科技行业,以及人类与计算机协作的全新模式。


结尾


美国红杉独家专访Open AI Codex团队:从代码自动补全到异步自主代理,编程正在被彻底重新定义


文章来自于微信公众号“深思圈”。


美国红杉独家专访Open AI Codex团队:从代码自动补全到异步自主代理,编程正在被彻底重新定义


首页 发现
看过 我的