抑郁症状平均减轻51%,首个AI心理治疗机器人临床试验报告出炉,疗效堪比人类治疗师

内容摘要来源:DeepTech深科技(来源:MIT Technology Review)抑郁症是一种严重的精神疾病,也是导致残疾和自杀的主要原因之一。据世界卫生组织(WHO)统计,全球有超过 3.5 亿抑郁症患者,并且这一数字正随着发病率的快速上升

来源:DeepTech深科技

(来源:MIT Technology Review)

抑郁症是一种严重的精神疾病,也是导致残疾和自杀的主要原因之一。

据世界卫生组织(WHO)统计,全球有超过 3.5 亿抑郁症患者,并且这一数字正随着发病率的快速上升而不断增加,就国内而言,抑郁症患者已超 9500 万。

另据中国精神卫生调查显示,中国成人抑郁障碍终生患病率为 6.8%,其中抑郁症为 3.4%,在每年约 28 万的自杀人群中有近一半患有抑郁症。这意味着抑郁症不仅仅是一个公共卫生问题,更是一个需要全社会共同关注的重要议题。

尽管抑郁症的发病率较高,但真正接受治疗的患者比例却非常低。抑郁症的难治性源于其复杂的多维度病因与治疗挑战,包括社会偏见、医疗资源有限以及高昂的治疗费用等因素,导致许多患者难以获得及时有效的治疗。

随着 AI 已经渗透到人们生活的方方面面,AI 心理治疗机器人应运而生,相较于人类心理治疗师,它更容易获取从而具有较好的依从性,治疗成本也更为低廉,并且与 AI 聊天也能在很大程度上避免社会偏见所带来的羞耻感,这些优势或为抑郁症患者的治疗带来了新希望。

近期,由达特茅斯学院盖泽尔医学院的精神病学研究人员和心理学家团队共同开发的名为“Therabot”的 AI 心理治疗机器人,在首次针对心理健康问题的临床试验中展现出了较好的疗效,对于患有抑郁、焦虑或有患饮食障碍风险的参与者而言,其治疗效果可以比肩人类治疗师。目前,这篇研究论文已经发表在 New England Journal of Medicine 上。

(来源:New England Journal of Medicine)

如今,不少科技公司正在开发专门用于心理治疗的 AI 工具,旨在让人们能够更频繁地与这些聊天机器人互动,而非依赖于训练有素的人类治疗师。毕竟,这种替代方案不仅成本更低,而且更容易被广大用户所接触和使用。

不少心理学家及精神病学专家都对这一愿景表示支持。他们强调,当前仅有不到一半的精神疾病患者寻求了专业的治疗帮助。而在那些确实接受了治疗的患者中,每周可能只有大约45分钟的时间能与治疗师面对面交流。

实际上,在过去研究人员也曾尝试利用 AI 技术来扩大精神疾病患者的治疗覆盖面,但遭遇了两个主要障碍:

一方面,如果 AI 心理治疗机器人给出了不合适甚至是有害的建议,可能会给患者带来实质性的伤害。

为了避免这种情况的发生,很多研究团队选择通过“显式编程”的方式来构建这些机器人,使其从一个经过严格筛选的、有限的回复库中挑选答案进行回应(这与 20 世纪 60 年代开发的一款名为 Eliza 的心理治疗模拟计算机程序非常相似)。然而,这种方式导致了治疗对话显得异常单调乏味,使得患者很容易失去兴趣,依从性也较差。

另一方面,建立良好的治疗关系是心理治疗成功的关键之一,包括共同设定目标以及双方之间的协作等要素,而这些都是很难通过计算机软件完全复现出来的。要知道,在人与人之间的互动中,情感共鸣、直觉判断以及即时反馈都是不可或缺的部分,显然,这些方面是 AI 难以完全实现的。

2019 年,随着诸如 OpenAI 的 GPT 这样的早期大语言模型逐渐成熟,引起了达特茅斯学院研究人员的注意,在他们看来:生成式 AI 或许能帮助克服先前的种种障碍。

于是,研究团队开始着手构建一个新的 AI 模型。首先,他们在互联网论坛上收集了大量通用的心理健康对话数据作为初步素材;随后,他们深入分析了数千小时由心理治疗专家参与的真实对话记录,以便更准确地捕捉专业治疗过程中的细微差别和复杂性。

“我们发现了很多诸如‘嗯嗯’、‘继续说’以及‘你的问题源自你与母亲的关系’等等这样的陈词滥调。”这篇研究论文的第一作者、达特茅斯学院和达特茅斯健康中心的精神病学家 Michael Heinz 说道,“这些都是心理治疗的老套说法,这不是我们真正想要的东西。”

意识到这一点后,研究团队决定不再依赖那些表面化的数据,而是转向构建一个基于循证实践的定制化数据集,并将其整合到模型中去。

相比之下,市面上的一些 AI 治疗机器人往往只是在互联网对话基础上进行了简单调整的基础模型(例如 meta 的 Llama),这导致它们在处理诸如饮食紊乱等话题时可能存在严重不足。

“举个例子,比如你说你计划减肥。”Michael Heinz 说道,“它们会轻易地鼓励和支持你这么去做,即便你的体重已经低于正常范围。” 要知道,一名称职的人类治疗师不会轻易给出这么荒唐的建议。

通过这些细致入微的方法,研究人员旨在构建出一个既能够提供个性化支持又能避免潜在风险的 AI 治疗机器人。

为了验证 Therabot 的有效性,研究人员开展了一项为期 8 周的临床对照试验,招募了 210 名表现出抑郁症状、广泛性焦虑障碍或处于高风险饮食障碍的试验者参与测试。

在这项临床研究中,大约一半的试验者能够使用 Therabot 进行治疗,而另一半作为对照组则没有接入该 AI 工具的支持。这样的设计有利于直观比较 Therabot 与传统治疗方法之间的差异。

在治疗期间,试验者通过回应来自 Therabot 的提示以及主动发起对话的方式与之互动,平均每天发送约 10 条消息。这种频繁且灵活的交流方式使得患者能够在日常生活中随时随地获得心理支持和指导,提高了治疗的可及性和连续性。

经过 8 周的治疗后,抑郁症患者的症状显著减轻了 51%,这是所有测量指标中的最佳结果;同时,焦虑症患者的症状也减轻了 31%。而对于那些有饮食障碍风险的试验者来说,他们对身体形象和体重的关注度降低了 19%。这些积极的变化表明,Therabot 不仅在缓解抑郁和焦虑方面表现优异,在改善饮食障碍相关的负面认知上也有一定效果。

需要注意的是,这些数据结果是通过问卷调查报告得出的。尽管这种方法存在一定的局限性,例如可能受到参与者主观态度的影响,但它依然是目前评估心理健康状况和治疗成效的重要手段之一。此外,问卷调查可以大规模地收集数据,并为后续深入分析提供基础资料。

Michael Heinz 指出,Therabot 的试验结果与传统心理治疗随机对照临床试验(人类治疗师提供大约 16 小时心理治疗)所取得的效果相当,相较之下,Therabot 试验仅用了大约一半的时间就达成了同样的效果。

“我在数字疗法领域工作了很长时间,从未见过如此长时间保持且持续的参与度。”他说道。这意味着 AI 治疗机器人在提高患者依从性和治疗效率方面具有潜力。

西蒙弗雷泽大学健康伦理学助理教授 Jean-Christophe Bélisle-Pipon(未参与这项研究)曾撰写过关于 AI 治疗机器人的论文。在他看来,这些研究结果非常引人注目,但同时他也指出,正如其他临床试验一样,试验结果不一定能直接转化为现实世界的疗效。

“我们距离‘全面推广’还有很长的路要走。”他在一封邮件中提到,并强调“将研究成果应用于实际医疗环境时面临的挑战和需要克服的问题,比如更大规模临床应用所需的严格监管。”

因此,尽管 Therabot 的临床试验结果令人鼓舞,但是这并不意味着市面上数十家公司可以无视监管,在“灰色地带”大肆宣传类似 AI 技术的有效性和安全性。

Michael Heinz 进一步解释说,“在临床试验初期,他亲自监控并审阅了所有来自试验者发送的消息(在得到试验者同意的前提下),以防止 AI 治疗机器人可能做出不恰当的回应。如果未来 AI 机器人仍然需要这种程度的监督(人类强把关),那么它们就难以实现大规模应用,惠及更多有需求的人群。”

从另外一个角度来看看,这些临床试验结果是否验证了正在蓬勃发展的 AI 治疗网站产业?

“事实上恰恰相反。”Michael Heinz 指出,并警告称,“大多数公司似乎并未基于像认知行为疗法这样的循证实践来训练其模型,也未必会雇佣一支专业医疗研究团队来监督互动过程。我对这个行业的快速发展以及缺乏充分评估的做法感到担忧。”他补充道。

他还指出,当一些 AI 网站宣传其能够在合法、临床环境中提供治疗服务时,这意味着它们将受到美国食品药品监督管理局(FDA)的监管。然而到目前为止,FDA 尚未对众多此类平台进行详细审查。他推测,“若真正开始实施监管,可能几乎没有一家能够证明其宣称的治疗效果。”

对此,Jean-Christophe Bélisle-Pipon 认为,除非这些数字疗法获得批准,并被纳入医疗保健或保险系统,否则其覆盖面将极其有限。那些本可以从这类治疗中受益的患者可能会转向并非为此目的设计的 AI 寻求治疗。

要知道,OpenAI 近期的一项新研究表明,与其 AI 模型的互动对情绪健康确实存在影响。

因此,随着人们对便捷、低成本心理健康支持的需求不断增加,如何确保这些新兴技术的安全性、有效性和可访问性成为了一个亟待解决的重要议题。

“一种可能是,许多人将继续依赖更便宜的非治疗类 AI 聊天机器人(比如 ChatGPT 或 Character.AI)来满足日常需求,从生成食谱、创意,到管理他们的心理健康。”他说道。

参考链接:

2025/03/28/1114001/the-first-trial-of-generative-ai-therapy-shows-it-might-help-with-depression/

 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
浙ICP备19001410号-1