所有AI的馈赠,早已在暗中标好了价格|北大最新论文解读
内容创作,内容创作工具,内容创作策略 图文教程

所有AI的馈赠,早已在暗中标好了价格|北大最新论文解读

AI中国 AI中国 12小时前 178 阅读
4.8 (1280 教程评分)
15,328 人已学习


生成式AI不仅在重塑千行百业,也从根本上改变着人类写作、认知与思考的方式。在ChatGPT3.5发布后,一种乐观的预期广为流传:AI将带来“工作平权”。

2023年,两位麻省理工学院的经济学博士,在《Science》期刊上发表实证研究,为此论调提供了佐证:即生成式AI能显著提升低绩效员工的表现,有望弥补其与高绩效员工的差距,从而减少不平等。

Science期刊的编辑对此总结道,“技能较弱的参与者从ChatGPT中获益最多,这一点对于未来旨在通过AI来减少生产力不平等的政策具有重要启示。”

然而,两年过去,现实似乎并未完全遵循这一理想路径。

2025年,两位哈佛大学的经济学博士,通过分析2015至2025年间覆盖超6200万员工、超1.5亿次的招聘就业数据,揭示了一个冷酷的真相:生成式AI正以一种“资历偏向”的方式重塑劳动力市场。

数据显示,2015到2022年间,初级和高级岗位的就业增长曲线基本保持一致,但从2023年开始,两者开始出现分叉:高级岗位继续向上增长,初级岗位则开始掉头向下。

对于深度拥抱AI的企业,其初级岗位数量在六个季度内相对下降了7.7%,而高级岗位则基本不受影响,甚至略有增长。这一现象的主因是招聘大幅减少,而非大规模裁员。

AI非但没有带来普惠的平权,反而让“强者更强”的马太效应愈发凸显。携程CEO梁建章对此论文评价道“AI会取代初级的智力劳动,加剧年轻人在教育、结婚生育和职业初期等阶段所遭遇的困境。”

劳动力市场的结构变化只是冰山一角。一个更深层次的问题随之浮现:当AI大规模融入我们的工作流,它对人类的创造力本身,正在产生何种影响?AI带来的效率提升,是否真的是个人能力的内化?它是否正在以一种我们尚未察觉的方式,塑造甚至“统一”我们的思想?当个体过度依赖AI之后,他们独立的、原创的思考能力是增强了,还是在不知不觉中被削弱了?

近期,北京大学李圭泉课题组在社会学顶刊Technology in Society发表的论文,正是对这一系列关键问题的正面回应。

研究的核心由两部分构成。研究一是一项大规模的自然实验,通过分析ChatGPT3.5发布前后,横跨全部21个学科门类的超41万篇学术论文,剖析AI对全球知识生产的真实影响;研究二则是一场持续追踪数月的纵向行为实验,在实验室环境中,探究AI对个人认知能力的长期因果效应。

研究团队结合断点回归设计与机器学习等技术,为我们揭示了生成式AI对个人创造力与群体同质性的长期且真实的影响。

该期刊为JCR一区top,影响因子12.5,在socialscience,Interdisciplinary分类下271本期刊中排名第2

01

41万篇论文的“集体无意识”


最可怕的不是噪音,而是众声一词。


研究一是一项大规模的自然实验。

研究团队从权威的Web of Science核心数据库中,抽取了横跨物理科学、生命科学与生物医药、应用科学、社会科学、艺术与人文等全部21个学科门类的学术产出。通过对超过17,000名学者的随机抽样,团队最终汇集了这些学者在ChatGPT-3.5发布前后的全部419344篇论文,构建了一个庞大的数据集,以此剖析AI对全球知识生产的真实影响。

生成式AI发布前后学术界论文同质性创造力结果示意


如上图所示,在2022年前,全球学术产出的创造力(红/蓝线)与同质性(灰线)均在平稳增长。但在ChatGPT3.5发布之后,两条曲线的斜率均出现了急剧的拉升。

即GPT3.5发布后,学术界显著加速知识产出(创造力)的同时,也以更快的速度加剧了其内容的同质化,清晰地展示了生成式AI对知识生产的“双刃剑”效应。


为了证明观察到的变化是由AI引起的,而非巧合,研究团队采用了一种名为“断点回归设计”(RDD)的因果推断方法。


如何做


他们将2022年12月ChatGPT-3.5的发布作为一个天然的“时间断点”。一篇论文发表在该日期之前还是之后,对于单个学者而言,存在着诸多其无法控制的偶然因素(如审稿周期),这就近似构成了一个随机分配的“实验组”(有机会使用AI)和“对照组”(无法使用AI)。


为何可靠


这种“准随机”的特性,使得研究者可以有效剥离其他长期因素的干扰,精准识别出AI带来的因果效应。为确保该方法的严谨性,团队还进行了一系列专门的统计检验,证实学者们并未在“断点”前后进行大规模的“憋稿”或“抢发”等策略性行为,从而保证研究结果的可靠性。


如何量化“创造力”与“同质性”指标?


在确认了因果关系之后,研究团队从“创造力”和“同质性”两个维度对这40多万篇论文进行了量化分析。


 创造力由论文发表的“数量”和发表期刊的“质量”(JCR分区)进行评估


  • 数量:学者发表论文的总数。


  • 质量:论文发表期刊的JCR分区(JournalCitationReportsQuartiles)。这是一个权威的期刊评级体系,Q1代表该领域影响力排名前25%的顶级期刊,Q4则为末位的25%。


 同质性通过内容相似度语言风格相似度进行评估


  • 内容相似度:采用SBERT深度学习模型,将论文摘要的语义转化为数字“向量”,再通过计算向量间的“余弦相似度”,来判断其在核心意思上的相似程度。

  • 语言风格相似度:通过字符级匹配算法,扫描并计算论文摘要之间重复出现的短语和句式,以此衡量写作风格的相似性。

冰冷的双刃剑:更高效,也更单调

如图所示,分析结果清晰地揭示了一个“双刃剑”效应。

一方面,AI的出现确实成为了学术产出的强大“加速器”:学者的人均年发表量增加了0.9篇,发表期刊的质量平均提升了6%,这一效应在技术和物理科学等领域尤为突出。

但另一方面,效率的提升正以思想和表达的多样性为代价。数据显示,论文的语言风格相似度平均每年惊人地增加了79%,同时论文的内容主题也出现了显著的趋同,其中物理科学、艺术与人文学科的同质化现象最为严重。

断点回归结果图


北大研究团队的这项大规模自然实验,为我们提供了真实世界的宏观证据:生成式AI确实是学术产出的强大“加速器”,它帮助学者更快地产出、并发表在更好的期刊上。然而,这种效率的提升,正以思想和表达的多样性为代价。

全球的知识生产,似乎正在这场“大交换”中,变得更高效,也更“单调”。

与此同时,研究一也留下了一个更深层次的问题:这种宏观趋势,对每一个身处其中的个体,究竟意味着什么?AI带来的创造力提升是真实的个人能力成长吗?

为了回答这个问题,研究团队在研究二中进行了一场持续追踪数月的纵向行为实验,在可控的实验室环境中探究AI对个人认知能力的长期因果效应。


02

AI留下创造力伤痕


思想一旦屈从于习惯,便失去了创造的可能。

事实上,已经有不少实验室小样本实证研究从不同角度印证了宏观数据所揭示的趋势。例如,康奈尔大学的研究发现,AI写作助手会牺牲文化独特性使用户的表达趋向“西方范式”;圣塔克拉拉大学的研究也表明,使用ChatGPT的个体,其创意在语义上更为雷同。


尤其值得一提的是,麻省理工学院研究团队通过脑电图(EEG)技术直接观测了个体的大脑,发现使用ChatGPT的学生组,其大脑活动水平远低于仅靠自己思考或使用搜索引擎的小组。

这些研究共同指向一个结论:AI正以降低认知投入和牺牲多样性为代价来提升效率。

EEG实验过程中的参与者示意图


然而,大部分研究都聚焦于使用AI的即时影响,鲜有探究当AI“离场”后,其效果能否持续,以及其长期负面影响是否会消退。

北大的这项研究在此方面做出了新的尝试


它不仅在为期七天的实验中观察AI的即时作用,更通过实验结束后的第30天和第60天两次独立的追踪测试系统性地检验了AI依赖所带来的长期后果。这使得我们能够真正看清,AI带来的究竟是可迁移的“能力”,还是一种短暂的、无法内化的“幻觉”。


具体而言北大研究团队研究二将61名大学生随机分为两组:“AI实验组”(可使用ChatGPT-4)与“纯脑力对照组”。


实验设计分为三个关键阶段:首先,所有参与者在第一天均不使用AI,完成创造力基线测试;随后,在第二至第六天,“AI实验组”在AI辅助下完成每日的创造任务脑力对照组没有辅助的条件下完成任务最后,也是最关键的,在第七天、第三十天和第六十天,所有参与者都必须在无AI辅助的情况下,完成最终的追踪测试。

实验设计示意图


为了全面地评估“创造力”,研究采用了复合的任务模式,涵盖了多个维度。这些任务包括:


  • 发散思维测试:经典的“替代用途任务”(AUT),要求参与者为日常物品(如“一支钢笔)想出尽可能多的新颖用途。


  • 创意问题解决:更贴近真实世界的商业场景题,例如要求参与者为一款“智能单车”设计创新功能。


  • 聚合思维测试:在追踪阶段加入的“远距联想测验”(RAT),要求参与者找到一个能同时连接三个不相关词语的关联词。


  • 洞察力问题:经典的“蜡烛问题”,要求参与者用一盒图钉、一根蜡烛和一盒火柴,将蜡烛固定在墙上,并且不能让蜡滴到桌上。


为确保评估的科学性,研究采用了该领域的“黄金标准”——专家共识评估法(CAT)多位专家评委在对分组情况和研究目的毫不知情的“双盲”条件下,独立地对数千份创意产出(包括发散性思维任务和复杂问题解决方案)的新颖性、实用性、灵活性等多个维度进行打分。极高的数据一致性(评分者信度ICCs>0.90)确保了评估结果的科学与公正。


研究二中同质性的测量方法,采用了与研究一完全相同的技术方法,确保了两个研究之间评估标准的一致性。

创造力ChatGPT对AUT和解决问题两类创新任务的影响

同质性ChatGPT对AUT的内容同质性和语言风格同质性的影响


实验结果清晰地揭示了一个残酷的不对称性:


  • 创造力的提升是短暂、不可持续的:在使用AI的阶段(第2-6天),“AI实验组”的各项创造力指标确实远超“纯脑力组”。然而,一旦AI被撤走,这种优势便瞬间消失。从第7天开始直到第60天,两组的创造力表现再无显著差异。更令人警醒的是,在第60天的聚合思维测试中,实验组的参与者表现甚至显著差于从未用过AI的对照组,AI带来的,并非可迁移的“能力”,更像是一种无法内化的“幻觉”。


  • 思想的同质化却是长期的,会留下“创造性伤痕”:与稍纵即逝的创造力提升相反,思想的同质化却表现出了惊人的“粘性”。即便在停止使用AI两个月后,“AI实验组”的产出内容,无论在语义上还是语言风格上,依然比对照组表现出显著更高的相似度。


这项纵向追踪研究用直接的因果证据,证实了AI对个人创造力的长期影响AI带来的可能只是一种无法内化的“创造力幻觉”,而它留下的思想趋同,却可能成为一道难以消除的“创意伤痕”,长期存在于我们的认知与表达习惯之中。

03

如果世界没有新创意


这是最好的时代,也是最坏的时代。

北大这项研究的结论,并非是让我们因噎废食,在AI时代里彻底放弃AI。恰恰相反,它旨在提醒我们,必须有意识地去理解和应对长期依赖AI对个体思维与认知习惯的深远影响。


研究中揭示的“同质化”趋势,其背后有着深刻的认知科学原理AI的输出很容易对使用者产生强大的“锚定效应”。当AI迅速生成一个“看起来还不错”的答案或框架时,我们的思维就会被这个初始方案“锚定”,后续的思考和创造便很难再大幅偏离,从而在群体层面导致了思想的收敛。


今年7黄仁勋在接受CNN的专访时,抛出了一个冷静的判断:“如果世界没有了新创意,那么AI带来的生产力提升就会转化为失业。”

当生成式AI被不断使用,互联网的信息、人类的知识库正以前所未有的速度变得更加同质。北大的研究用冰冷的数据证实,这种趋势真实存在社会能够不断涌现新的创意,AI会转化为更多元的就业机会;若只重复旧任务,AI在几秒内即可完成


AI放大创意,也加速“思路枯竭”者出局

04

在AI时代,如何保持思考的锋利


AI减轻了我们的工作负担,但我们需要建立一个能深度思考的思维体系,能和AI进行交互,描述想要让AI解决的问题,也要对问题进行推理,同时判断AI是否正确回答了问题,我们要有辨证思维。—黄仁勋

作为身处AI时代的个体,我们该如何自处?如何在享受AI便利的同时,避免陷创造力荒漠?结合研究的启示,以下是一些具体的行动建议:

  • 把AI当“思想陪练”把它当成一个不知疲倦、能提供无限视角的“思想陪练”。用它来进行头脑风暴,生成多种可能性,挑战你的固有假设。但最终的筛选、深化、决策和对结果负责的,必须是你自己。

  • 刻意练习“认知摩擦”对抗“锚定效应”最有效的方法,就是主动制造“认知摩擦”。不要轻易接受AI给出的第一个答案。刻意地去反驳它、寻找它的逻辑漏洞、质疑它未考虑到的方面这种批判性思维的练习,正是保持我们独立思考能力的关键。

  • 设置“无AI时间正如我们需要定期锻炼身体以防肌肉萎缩,我们也需要定期让大脑进行无AI辅助的锻炼。每周定期划定出一段“无AI时间”,用最原始的纸笔或空白文档进行思考、规划和创作。这种刻意的“认知断舍离”,能确保我们大脑的核心创造与推理能力不会在安逸中退化

教程评分

4.8 (1280 教程评分)

评论 (0)

睡觉动画