趋势洞察 1 months ago 86 Views 0 Comments

挖人上瘾的Meta又被员工吐嘈:不帮忙宣传项目,开源只会越来越糟

机器之心Pro

全球人工智能信息服务 Published 302 Articles

机器之心报道

机器之心编辑部

申请转发项目推文近一年才批准?

近日,Meta CEO 马克・扎克伯格的一篇《个人超级智能》公开信赚尽了眼球,其中不仅提到他们已经看到了「AI 系统自我改进的迹象」,还表示他们将会「谨慎选择开源内容」。

上下滑动查看

一时之间,相关的讨论和争议达到了又一轮小高潮。而与此同时,Meta 内部风波暗涌。一方面为追赶 AI 顶级研究阵地,Meta 砸下逾 140 亿美元重注 Scale AI,并组成 Meta Superintelligence Labs (MSL),广揽来自 OpenAI、DeepMind 等顶级团队的 AI 人才,提供百万乃至上亿美元签约金;另一方面,Meta 内部却又被屡屡爆出存在五花八门的关于资源、人力、内部管控等的纷争,甚至还有一位名为 Tijmen Blankevoort 的研究科学家曾发长文控诉 Meta 内部文化和组织失调的惨淡景象。

更多详情可参阅我们之前的一篇报道《是的,LeCun 要向 28 岁的 Alexandr Wang 汇报!这是 Meta 新 AI 团队的一些独家内部消息》。

现在,又有更多有关 Meta 内部混乱和低效的细节浮出水面。

就在扎克伯格《个人超级智能》公开信发布几小时后,Meta FAIR 研究科学家朱泽园在一篇回复推文中无奈地表示:让 AI at Meta(@AIatMeta)这个 X 账号转发一下他的研究非常困难 ——「我花了近一年时间才让他们批准转推我的项目」;但「转推带来的触达量还不到他自己推文的 10%。」

朱泽园表示:「根本不值得这么费力。」

他还表示:「话虽如此,我理解。我的工作在 Meta 内部并不被看重,所以他们自然有更重要的事情需要社交媒体推广。」不过有趣的是,他还提到 Meta 以外的公司对他的工作更感兴趣,不知道这是否暗示着我们将会看到他有新的工作动向?

关于这条推文,机器之心向他进行了求证。

朱泽园回应称,他首先非常感谢社区和粉丝一直以来帮忙推广自己的项目。他解释道,Meta 关注的是如何盈利,以及大模型之间的竞赛。他的 Physics of Language Models 项目(更多介绍请参阅文末扩展阅读)从一开始就几乎没有获得 Meta 层面的支持与关注。

他表示,近期收到了大量同行的来信,不少 AI 从业者都对行业动荡感到焦虑。「我想提醒大家,面对行业变化,更应该变被动为主动,把握机会,不要等着公司裁员。其实现在正是跳槽的好时机。」

至于个人是否跳槽,朱泽园表示,自己终归会离开 Meta,只是目前更看重手头项目,需要节省时间,而跳槽时还要花时间考虑是否要带一个团队、带哪些人一起走,所以现在暂时不会做这件事,金钱反而不是最重要的。他强调,无论身处何处,都会继续做 Physics of Language Models,因为这是 AI 领域最基础的工作。

针对 Meta 内部的管理问题,朱泽园坦言,前员工 Tijmen Blankevoort 此前公开的内部文化批评「基本属实」,而他其实还有很多补充,比如甚至遇到过现实版「农夫与蛇」的经历,不过这些故事只能等离职后才能说出来。

至于这条推文提到的「对照实验」,则要从朱泽园上周末发布的开源项目说起。

朱泽园在 7 月 27 日发布了 Physics of Language Models 项目的第一阶段代码,其中包含了「在 42k GPU 小时内预训练强大 8B 基础模型所需的全部内容」,包括数据、训练代码和模型权重,可以说是真正的开源。并且「可以用不超过 10% 的训练资源打败 Llama3-8B」

项目地址:https://github.com/facebookresearch/PhysicsLM4

然而,该项目开源发布一段时间,朱泽园却疑惑地发现项目关注度不高。这让他不禁发出了痛心一问:「完全开源的研究真有必要吗?」他还问道:「我是否应该选择闭源以节省时间并专注于纯粹的研究?」

而这条推文的关注热度就高多了,也有很多业内人士参与讨论互动。

比如 Hugging Face CEO Clement Delangue 表示开源是推动 AI 领域发展的正确做法,可以使其更加开放、协作和安全!

斯坦福大学应用物理学副教授 Surya Ganguli 更是表示「不开源就不能称之为研究」。

当然,也有人表示某些开源确实浪费时间,比如前段时间被 Meta 挖走的前 OpenAI 和 DeepMind 研究者 Lucas Beyer 表示 bigco 项目的开源就浪费了很多时间,不过他也指出了值得开源的三种情况。

当然,除了开源以及对 X 推荐机制的讨论,朱泽园的这条推文也引出了更多关于 Meta 的讨论。

比如网友 @papers_anon 表示「FAIR 在传播其团队的有趣研究方面做得很差」——FAIR 似乎完全仰赖研究者使用自己的个人 X 帐号来宣传,而同时 FAIR 又不直接为每位研究者购买 X Premium+ 来推广研究成果,也没有一个真正专注于研究成果展示的 X 账户来发布内容。他总结说:「FAIR 似乎受到了太多内部政策的束缚,甚至无法以无痛的方式促进开放研究。」

另外,朱泽园自己也指出了关注度可能与研究资源挂钩的现实,而这就不得不迫使研究者在 X 上场搞宣传,而他也正需要为这项研究的第二、三阶段争取到 GPU。

他也吐嘈了 Meta 内部的审核批准流程:仅仅是获得公共数据集的使用批准并发布权重就需要浪费两个多月的时间(这还不包括科研本身),「而且情况只会越来越糟。如果一个数据条目未获得批准,你的整个模型都可能被推翻重新训练。而哪里有这么多资源呢?」

他还提到,光是为了让 Physics of Language Models 这个项目以 Apache 2.0 协议开源,他就与 Meta 的法务部门沟通了超过一周。如果发布的模型过于强大,还会出更多问题。

当被问到为什么 Meta 说不开源了,同时还允许该项目发布时(另外这两天还开源了 MetaCLIP2 和 VGGT),朱泽园风趣地说:「这两者可能都是真的。如今,不确定性极大,一切都可能在一夜之间发生改变,也许我们在进行最后一轮开源。」

参考链接

https://x.com/papers_anon/status/1950672022134247579

https://x.com/ZeyuanAllenZhu/status/1950718378353811730

机器之心Pro

机器之心Pro

全球人工智能信息服务

302 Articles 43317 Views 0 Fans

Comment (0)

睡觉动画