AI热点 3小时前 199 浏览次数 0 评论

AI 问诊真能救命?微博CEO亲自试了试

AI中国
AI中国

发布了 8411 文章

无聊的时候用 AI 聊聊天、要改文章风格的时候用 AI 偷下懒、需要配图的时候让 AI 画一个…

但如果我说 AI 能救命,阁下又该如何应对呢?

8 月 2 日,微博 CEO @来去之间发微博昨天睡前突然感觉到强烈的头晕目眩,直接晕到走不动道,甚至都“站不起来”了。他家里人帮他量了血压,发现高压还不到 90,妥妥的低血压。

低血压这件事可大可小,如果发展到极端情况,会陷入休克,甚至会引发脑梗和心梗,是会死人的。不过能干上微博 CEO 的还是艺高人胆大,他没有第一时间打车去医院,反而选择了先问 AI。

他在把症状夸大之后,又把自己晚上吃喝过的东西通通发给 AI,最终“诊断结果”是因为喝了隔夜的 VC泡腾水,得了「反射性低血压」

最终,在 AI 的建议下,他就喝了点可乐、蒙脱石散和补液盐,一小时后还真好了。

这事一出,立马刷新了很多人的对 AI 的认知,原来 AI 除了帮我们偷懒和娱乐外,还能用来“问诊”。

但从网友们的反应来看,更多人的态度还是“不买账”。不仅来去之间的评论区里有不少人批评这个例子会误导网友在紧急时不去找医生找 AI,耽误最佳治疗时间,还有一些网友认为来去之间这个行为,是面对生命健康的儿戏。

网友们的质疑完全可以理解。如果是一个月前的我,肯定也会和大多数网友一样骂一声来去之间“不知死活”。

但恰好在两周前,我女朋友正是用 AI 解决了一个困扰她二十多年的疑难杂症,再加上来去之间这次的案例,让我更加相信“AI问诊” 这件事,可能远比大家想的靠谱。

赛博神医

都说年纪大机器坏,随着年龄越来越大,大家肯定多多少少都有一些存在很多年,虽不致命但又没法完全根治的病症。

比如我女朋友,她自七岁起就有一个怪病,发病时会先伴随强烈的眼花、目眩,就像套上了万花筒一样,过了半小时之后就开始头晕,一晕就得四五个小时。

这个怪病发作的时候视线模糊得什么都看不了,头晕之后又只能躺在床上休息,二十多年都是这样过来的。虽然说不会危及生命,但对日常的生活工作有非常大的影响。

更令人心烦的是,这二十多年里看过了无数三甲医院、诊所、偏方,有说是急性肠胃炎的、耳源性眩晕的,去看了中医又说是肩颈部供血不足…诊断结果五花八门,但始终没有一个医生、一种药能解决这个问题,甚至缓解发作的症状。

所以,正当我们束手无策的时候,抱着死马当活马医的心态,不如问一下 ChatGPT 4o吧,或许它会知道一些什么。

不得不说,真是不试不知道,一试吓一跳:我们输入女朋友的过往的疾病史、生活史、过往诊断、用药及效果之后,ChatGPT 给出了一个完全意料之外的诊断结果:前驱性偏头痛

对于这个诊断结果,它是这样解释的:“视觉异常 + 随后头晕恶心呕吐 + 睡眠缓解 + 发作性 + 月经周期相关的症状,高度符合偏头痛伴先兆(Migraine with aura)的临床表现。

而且 ChatGPT 好像猜到了我们会对“偏头痛”这个结果感到意外,特地解释了一番:“许多偏头痛患者并不以“头痛”为主,而可能以眩晕为主症状”,同时解释了之前医生会误判的可能因素。

ChatGPT 在整理出答案之后,还会给我们推荐挂号的医院科室,强调了要找眩晕相关的医生;并且在回答的最后,主动询问我们需不需要准备病情的自述提纲,或者生成病症判断的逻辑文档

可以看到,ChatGPT 的整个诊断流程里,分析有理有据、引经据典,并且回答的情商非常高,不仅有对患者的安慰、对过去医生的找补,还能积极引导我们为看病做好准备。

只是,这个诊断结果是不是真的正确呢?除了 GPT,我们也用同样的提示词问了谷歌 Gemini 2.5 Pro,来交叉验证一下。

对于这个病症,Gemini 给出了类似的答案。虽然它称之为“前庭性偏头痛(Vestibular Migraine)”,但结合后续回答对症状、病史的分析,说的的确是同一个病。

基本可以确定,这个怪病是“偏头痛”了。

另外在体验两款 AI 工具的时候我们也发现,Gemini 的回答会显得更加简洁高效,整个文本的排版看起来更有重点更加舒服,只用来查询病症的话显然用 Gemini 更加方便。

但如果想更加深入了解具体情况, ChatGPT 的拟人化程度真的很高,交互起来就更加友好。比起 Gemini 在回答结尾的“打鸡血”,好像答完这个问题就下班了,还是 GPT 的循循善诱,甚至主动提议帮你准备一些能用得上的材料,更加温暖贴心。

最后,为了验证两个 AI 的诊断结果是不是准确的,我们拿着 GPT 生成的看病材料到了广州某个三甲医院的神经内科,并根据它的推荐找了眩晕相关的医生。

令我们十分意外的是,门诊的医生,无论是对 GPT 的诊断还是它制作的就诊信息汇总表都高度肯定,他说 GPT 的诊断结果基本是准确的。

不过因为女朋友症状发作的时候从来没有出现过明显的头痛,医生也认为这是一个罕见病,同时的确也很容易误诊。

最终医生给出的诊断是“基底型偏头痛”,是对偏头痛病症的一种细分类型。

然而,更绝的还在后面。针对这个罕见病,医生给女朋友开了一个还在临床试验的特效药,而这个特效药是真的有用

在后面女朋友这个病再次发作的时候,把这个特效药吃下去之后,平时需要几个小时才能缓解的眼花、头晕,不到半个小时就能大幅度缓解,已经不影响正常的生活工作了。

所以,在这次亲身经历里,无论是前期的 AI 辅助诊断,还是后期医生的对症下药,都对找到这罕见病的治疗方法发挥了巨大作用。

我们不禁会想:如果早几年就能用上现在这个版本的 ChatGPT 4o,会不会更早几年就能免受这个罕见病带来的痛苦?

而且 GPT在 AI 问诊的过程中,还可以协同帮助我们梳理发病经过、组织描述病历的语言大纲;在我们不确定该怎么描述一些症状时,AI 还可以引导我们去准确地描述出来,甚至还可以帮我们自动生成一些类似自测量表的文书工具。

从靠谱程度来说,比“百度搜病症”不知道有用到哪里去了。

另外,经过这次事件之后,我也是查了资料才知道,原来 AI 在医疗领域回答的靠谱程度,原来是远高于其他领域的。

“神医”的底气

一向都喜欢胡编乱造的 AI,怎么在问诊这件事上突然就靠谱起来了?

从宏观层面来说,医疗信息的高度结构化、知识密度大且更新速度快,恰好正是大模型擅长处理的内容。

响应迅速的大模型可以 7x24小时处理大规模医学知识、精准匹配用户问题,并可以通过数据训练在任意时间不断学习和更新,还可以像上面提到的在咨询、问诊的过程中辅助医生决策与诊断。

所以,能力越强的大模型,越适合用来回答医疗相关的问题。除了上面提到的 ChatGPT 4o 和谷歌 Gemini 2.5 Pro,国内一些能力出色的大模型在医疗领域的表现也很不错。

就在今年6月,斯坦福大学发布了一项有关临床医疗 AI 模型的全面评测,显示DeepSeek R1以66% 的胜率和0.75的宏观平均分,在九个前沿大模型中脱颖而出,成为全球冠军。

另外,阿里旗下的 AI 产品最近也在高调地进军医疗市场。除了最近广告打得飞起的夸克高调宣布“已经将健康大模型集成在 AI 搜索框中”外,同门兄弟的“蚂蚁AQ”也是一款专注 C 端健康管家的软件。

但强大的模型能力只是一切的基础。对医疗领域的回答来说,训练数据是不是足够准确、可靠,重要性远超其他领域。所以,使用高质量、结构化的医学数据进行训练是必须的。

在这方面,ChatGPT 说他们微调数据来自临床指南、UpToDate、PubMed 的数据,并且会专门过滤非结构化网络信息,避免患者论坛误导性内容,保证医疗回答的信息可靠、专业。

另外,Gemini 这边的数据依托Google Health 的真实病例与结构化 EHR (Electronic Health Record,电子健康档案)数据,并且会有医生团队筛选训练语料,避免 AI 胡编乱造。

无论是哪家的大模型,医疗相关的数据来源必须是经过层层筛选,可不是什么“随便网上找来的”就能用来喂给大模型的。

有了高质量数据之后,要怎么用?这时就会用上训练大模型过程中的“知识增强(Retrieval-Augmented Generation, RAG),在模型生成回答前,先进行知识检索,再由模型生成答案,确保输出内容与权威资料一致。

不同模型的具体做法可能会不太相同,比如 ChatGPT 会在联网模式中,借助 Bing + 医学数据库内容实时增强;Gemini 会动态连接 Google Search 医疗知识面板,引用临床试验、指南等摘要内容等等。

除此之外,大模型还会内置“医疗事实校验模块”(Fact Consistency Checker),在回答生成后,会反向再判断一次输出是否与数据库一致。

例如,输出回答后,会抽取模型回答中的关键实体(如疾病名、药品名),看这些东西是不是知识库里存在的;又例如,会对输出进行“自动三段论”逻辑审查,检查“疾病类型→感染类型→药物适应症”这三者之间是否合理配套。

因为这一步能够显著减少因错误推理链导致的医学性幻觉,无论是通用大模型,比如ChatGPT、Gemini、Anthropic Claude,还是医疗垂直大模型,比如夸克医疗大模型、讯飞星火医疗大模型和平安医疗认知大模型,都已标配。

最后部分大模型输出的结果,还会通过专业医生反馈标注,并在多轮标注之后用于强化学习,并设计一套完善的准确性奖励机制等等…

简而言之,AI 医疗问答场景下的回答,需要经过一系列“防幻觉系统工程”的处理,相比传统的问答流程更加复杂、严谨和专业,所以医疗场景下的 AI 回答才会比其他情况更有可信度。

“吃错药会死人”的道理大家都懂,在这种严肃领域,AI 大模型厂商更怕出事担责。

黎明前夜

财经故事荟提供了一组数据,在美国顶级医疗机构中,高达87%的科室已实现AI工具的常态化使用(每周>50次),其中放射科、病理科的采纳率更是达到了95%

另外,美国、英国、法国、瑞士等国家都有在试点,将 AI 工具引进医生的日常工作流中,为患者解答问题、分析医学影像和自动生成临床文书等,为探索 AI 工具在临床医学流程的实际运用提供了宝贵数据。

AI 医疗的确是一个非常有想象力的领域,看病难、医疗资源不均衡的问题全世界都存在,但 AI 的出现,对普通人来说意味着多了一份可以随身携带专业的医疗知识宝典,对医生来说也是一个非常强大的减负工具。

虽然现在谁也不敢拍胸口保证 AI 问诊的结果是百分百准确,但也不妨试试使用 ChatGPT、Gemini 等工具帮你总结一下病情发展的经过、描述一下症状和病情,并帮你将这些信息整理到表格里,至少能帮你提高看病时和医生沟通的效率,还不怕担心遗漏重要信息点。

这不比用 AI 来算命有价值多了?

本文来自微信公众号“蓝字计划”,作者:Hayward,36氪经授权发布。

AI中国

AI中国

8411 文章 1345717 浏览次数 950300 粉丝

评论 (0)

睡觉动画