AI热点 5 months ago 161 Views 11 Comments

OpenAI组织内部,到底是如何运作的?

AI中国
AI中国

Published 11569 Articles

作为这一波大模型浪潮中最成功的创业公司,OpenAI 一直备受关注,数亿人使用 ChatGPT,但是这家公司内部是如何运作的,一直保持神秘

近日,一位刚刚从 OpenAI 离职三周的工程师,写下了他过去一年在这家全球最受关注 AI 公司的所见所感。

他叫 Calvin,2024 年 5 月加入 OpenAI,今年 6 月底离职。Calvin 的离职,并不是因为任何纠纷或理念不合。他在文中坦言,自己更适合构建从 0 到 1 的系统,而不是在 3000 名员工中做一个螺丝钉。

在这篇名为《Reflections on OpenAI(在 OpenAI 的所思所感)》的文章中,他并不打算揭露什么惊天内幕,而是以一种近似私人备忘录的方式,记录了他作为技术人、产品人、创业者和父亲的交叠视角下,他在 OpenAI 的一线观察。

用他自己的话说:「这里没有任何商业机密,只有我对历史上最迷人的组织之一,在当下飞速迭代时期的所思所感。」

从这篇文章中,我们能一窥 OpenAI 内部的运作规律。 

01 OpenAI 的文化:既混乱又高效,既集中又分散

在 OpenAI 工作的一年里,Calvin 对这个组织的文化有了非常立体的理解。他加入的时候公司大约有 1000 人,一年之后员工已经增长到超过 3000。在这短短的时间内,他已经算得上「老员工」了。

OpenAI 的极速扩张也带来了典型的大公司问题:组织结构剧烈变化、沟通成本上升、团队间协作方式多样化。

Calvin 观察到,不同的团队文化之间差异巨大,有的像创业公司一样日夜冲刺,有的则像传统企业那样遵循流程推进。Calvin 本人所在的 Codex 团队更偏前者:节奏极快,方向灵活,什么事情都是「先做再说」。

而令所有人都意想不到的是,OpenAI 整个公司所有的事项,都放在了 Slack 上。包括且不限于内部交流,包括项目协调、技术问题讨论、领导层的实时对话……Calvin 入职一年多,工作邮件不超过 10 封。

协作软件 Slack|图源:Slack

Calvin 还观察到一个非常鲜明的特征:OpenAI 非常依赖工程师和研究者「从下到上」推动项目

「好主意可以来自任何地方,进展不是规划的,而是迭代的。」Calvin 写道。

得益于这种自下而上的文化,OpenAI 也非常任人唯贤。从公司发展史上看,OpenAI 领导班子的晋升主要就基于谁有「能提出好主意」的能力,并且能把想法落地。

「最好的想法在 OpenAI 确实会获胜。」

OpenAI 的公司文化还鲜明地「偏爱行动(action-bias)」:你可以直接行动让想法落地,不必等上层批准。

Codex 负责人 Andrey 就曾告诉 Calvin,OpenAI 的研究员应该被看作「自己的小执行官(mini-executive)」,大家各做各的方向,看看最后跑出来什么成果。

OpenAI 的另一个显著特征,是「根据新信息及时调整策略」的理念,Calvin 指出,哪怕公司规模已非常庞大,依然保留了这种快速转向的能力。

一旦 OpenAI 决定要推进某个方向,通常就是全力投入、毫不含糊。他还轻轻拉踩了 Google,认为相比 OpenAI,Google 显得迟缓许多。

Calvin 评价 OpenAI 是他见过最「雄心勃勃」的公司之一。哪怕已经拥有全球最成功的消费级 AI 应用,它依然在同时推进十几个方向:API、基础研究、硬件、代码智能体、图像生成,还有一些尚未公开的项目

不同团队之间的协作也非常灵活。Codex 推出前,他们急需几位经验丰富的 ChatGPT 工程师支援,和对方团队聊了一次,第二天就有两位高手直接加入,没有层层审批,也不等季度规划,人才来了「即插即用」。

OpenAI 领导层也出奇活跃,高层几乎每天都在 Slack 上露面,直接参与群聊讨论,不是那种「遥不可及」的管理者。

这种内部开放,对应的则是对外的保守

刚入职最让 Calvin 震惊的是,OpenAI 所处的「聚光灯中心」。当时的 OpenAI 是媒体报道、政策讨论、公众争议的中心,很多新闻他在公司内部都还没听说,就已经被媒体抢先爆出来。

因此,为了避免信息外泄,公司内部的保密机制异常严格。Calvin 在任职期间,几乎无法跟外人谈论自己具体在做什么。公司的 Slack 上有多个权限分级的分组,不同级别的员工能看到的信息差别很大。像是公司的财务数据、收入、GPU 成本等核心数字,都受到严密保护。

尽管外界经常用「神秘」「封闭」形容 OpenAI,但 Calvin 更愿意将这种状态理解为一种对责任的回应。

这种回应塑造了 OpenAI 内部严肃和紧绷的气息:一方面,团队在追求 AGI,最终目标可能会影响全人类;另一方面,产品已经被数亿用户用来获取医学建议、心理支持、甚至学习和工作协助。

与此同时,OpenAI 还在当下最火热的行业里,与 Google、Meta、Anthropic 等大公司竞争。作为行业领头羊,OpenAI 还要面对媒体的审视,还要小心翼翼地把握人类对 AI 开发和掌握的边界。

对此等压力,Calvin 表示自己在公司内部遇到的每一个人,都在尽力做「对的事情」。但大众也别把 OpenAI 想象成一个统一的意志体。

他认为 OpenAI 更像是从「洛斯阿拉莫斯实验室」(Los Alamos,美国研究出原子弹的实验室)的现代版本

原本一群科学家和工程师在边缘地带探索前沿技术,结果一不小心孵化出了史上最火的消费级应用 ChatGPT。此后,公司又逐渐拓展为一个同时面向政府、企业和消费者的庞然大物,并且大众尚不可知研究成果时好时坏。

去年上映的电影《奥本海默》中呈现的 Los Alamos 实验室|图源:奥本海默

在 AI 安全问题上,Calvin 的观察是:OpenAI 比许多人想象中更认真。

他看到有不少团队专门负责构建安全系统,聚焦的也多是现实风险,比如仇恨言论、滥用内容、政治操控、生物武器设计等等。遗憾的是,多数成果未对外发表,Calvin 觉得 OpenAI 在这方面可以更透明一些。

「不统一的意志体」还体现在不同部门和员工对 OpenAI 的理解也完全不同。有些人仍然把它当作一个「为公益而设立的研究实验室」,而另一些人则更多地从商业、产品或政策角度出发。

但无论如何,Calvin 最欣赏的一点,是公司在「AI 红利的分配」上说到做到。最先进的模型从不会只留给企业级大客户,任何普通用户都能免费使用 ChatGPT。大多数模型的 API 也对开发者开放。

在 Calvin 看来,OpenAI 的文化是一种奇特的混合体:既高度去中心化、强调个人驱动,又在某些关键问题上异常克制和谨慎;既像一家科研机构,鼓励想法和理论思考,又像创业公司,保持着惊人的速度和执行力。

这种文化,塑造了 OpenAI 的产品形态,也决定了它的代码长什么样。 

02 技术的细节

在技术架构层面,Calvin 透露 OpenAI 的核心代码托管在一个巨大的 monorepo 中,主要以 Python 为主。近年来,Rust 服务的比重逐渐增加,此外也有一些 Golang 项目,通常用于处理诸如网络代理这类系统级任务。

这个庞杂的代码库带来一个直观的感受就是:风格极不统一。在这里你既会看到由 Google 十年老兵写出的、面向大规模系统设计的库,也会碰到刚刚入职的博士生丢进来的临时 Jupyter 笔记本。

基础设施方面,OpenAI 的一切都跑在 Azure 上,此外,OpenAI 很少依赖 Azure 的自动伸缩服务或 IAM 权限系统。

相反,公司对自研系统的偏好非常强烈。能自己写的,尽量自己写

人员背景方面,Calvin 观察到一个显著趋势:工程团队中有不少成员来自 Meta,尤其是 Meta 和 Instagram 的基础架构部门。

这也让 OpenAI 在某种程度上,有点像早期的 Meta:一款现象级的消费级应用、配套基础设施还在建设中、团队渴望快速迭代。

OpenAI 在今年 5 月推出的 AI 编程工具 Codex|图片来源:OpenAI

另一个非常核心的架构特征是:「Chat 架构深入骨髓」。

自从 ChatGPT 爆红以来,大量代码围绕「聊天消息」与「对话」这两个概念进行组织,这些设计已经成为不可忽视的原语(primitives,不能分解为更小语言单位的基本编程元素)。Calvin 提醒说:如果在开发中忽视这些设计,后果可能很麻烦。

决策架构的过程也体现了 OpenAI 一贯的「行动偏好」:谁做,谁决定架构。这里没有架构委员会,也不太讲「自上而下」的计划,多数技术方案是哪个团队想做、就直接开干。

结果代码库里常常会出现多个「重复造轮子」的场景,光是排队系统、Agent 运行框架,Calvin 至少看到了五六种不同的方法造出类似的结果。

这种快速增长也不是没有代价。有些系统因此变得混乱,所以就算是最顶级的 AI 公司,在快速扩张时也会踩到最常见的工程坑。

在技术架构的框架之上,Calvin 最重要的项目,是参与 Codex 的落地与发布。在他离职前的最后三个月里,Codex 的冲刺毫无疑问成了他职业生涯的一大高光。

时间回到 2024 年 11 月,那时 OpenAI 正式定下了一个 2025 年的产品目标:推出一款 coding agent。到 2025 年 2 月,内部已经出现了一些使用模型进行编程任务的工具,效果相当不错。

但与此同时,越来越多的 agent 工具问世后,OpenAI 内部感受到了外部压力,团队进入一种几近狂奔的节奏。从第一行代码写下到产品上线,只用了 7 周时间

这是 Calvin 回忆,那段时间几乎每天都加班到深夜十一二点,凌晨五点半被刚出生的孩子叫醒,七点又准时出现在办公室,周末也不例外。

整个团队拼尽全力,Calvin 说得直接:「这家公司,还有那股冲劲儿。」

而在七周时间里,他们 8 位资深工程师,4 位研究员,2 位设计师,2 位市场与销售成员,以及 1 位产品经理,共同打造出了一个可发布,可上线,可直接使用的 AI 编程 Agent。

Codex 核心团队|图源:@calvinfo

发布前夜,五个人熬到凌晨四点部署主服务,紧接着清晨八点又准时回到办公室,准备直播和公告上线。当时功能开关一打开,流量瞬间涌入。

Calvin 说,他从没见过一个产品仅仅是出现在 ChatGPT 左侧边栏,就能瞬间引发如此大量的用量,他称「这就是 ChatGPT 的力量。」

03 从怀疑到收获

在回顾这一年时,Calvin 承认,最初加入 OpenAI 时他其实是犹豫的。他不确定自己是否适合进入这样一家 AI 巨头,甚至为了预留退路,他在刚加入时对外保持了相当低调。

但他也为自己设下了三个在 OpenAI 想完成的目标:一是建立对模型训练与能力边界的直觉;二是和一群优秀的人共事并从中学习;三是发布一个真正打动人的产品。

现在回看,这一年无疑是他职业生涯中最重要的一段经历之一。他说,很难想象还有哪里能学到这么多。

本文作者 Calvin French-Owen|图片来源:X

这段经历也刷新了他对「大品牌」的理解。在参与 Codex 时他意识到,OpenAI 所有的产品设计几乎都是围绕「Pro 用户」展开的,哪怕是面向开发者的 Codex,也主要以个人用户为导向,而非团队

这对来自 B2B 世界的他来说完全是另一种思维方式:ToC 的开关一旦打开,流量立刻涌入,不像 ToB 的传统企业产品,还需要漫长的客户开发周期。

他也第一次站在一线,了解大模型是如何训练的。实验不只是算法问题,调数据、盯指标、调边缘案例,样样都得自己动手。而到了大规模训练时,每一次都像一场不可预知的系统挑战。

对其他创业者来说,他也给出两点建议:如果你感到自己创业的项目停滞不前,不妨认真考虑两个方向:要么更激进地出击、增加试错次数;要么加入顶级实验室,去亲眼见证未来是怎么被构建的。

在他看来,通向 AGI 的竞赛已经进入三国演义:OpenAI、Anthropic 和 Google 各自代表着不同的技术与文化路径:消费产品、企业服务、工程硬核

Calvin 相信,进入其中任何一家,都会是一段眼界大开的经历,正如过去一年他的亲身经历。

*头图来源:OpenAI 

本文来自微信公众号 “极客公园”(ID:geekpark),作者:Moonshot,36氪经授权发布。

AI中国

AI中国

11569 Articles 2144100 Views 950300 Fans

Comment (11)

User avatar

OpenAI内部运作还是有点神秘,挺让人好奇的!

User avatar

感觉他们可能在用AI统治世界,我有点担心!

User avatar

这种神秘感,也挺可爱的,喜欢!

User avatar

感觉他们是人工智能的秘密实验室,有点吓人!

User avatar

这种不透明度,是科技进步的缩影啊!

User avatar

搞得我跟着好奇,是不是要搞个秘密基地?

User avatar

感觉他们是隐形的,谁也看不见,太酷了!

User avatar

这种神秘感,简直是绝了,我爱看!

User avatar

真的好奇他们到底在搞什么鬼,感觉比我买彩票还让人兴奋!

User avatar

感觉他们是外星人,在地球上搞实验!

睡觉动画