生成式人工智能聊天机器人问题性使用:概念与临床认知的当前阶段

时间:2026年5月28日
来源:Frontiers in Public Health

编辑推荐:

生成式人工智能(Generative Artificial Intelligence, AI)的潜在负面后果正引发激烈辩论,心理健康专家、研究人员和政策制定者就其对创造力、整体功能及心理社会福祉的影响提出了实用性和理论性的论点与反论点。本叙述性综述探讨了问题性

广告
   X   

生成式人工智能(Generative Artificial Intelligence, AI)的潜在负面后果正引发激烈辩论,心理健康专家、研究人员和政策制定者就其对创造力、整体功能及心理社会福祉的影响提出了实用性和理论性的论点与反论点。本叙述性综述探讨了问题性使用生成式人工智能聊天机器人问题性使用(Problematic Use of Generative Artificial Intelligence Chatbots, PUGAIC)的历史与概念发展,并总结了其流行病学、风险因素、评估工具及所提出的病理生理机制的实证发现,但并未将PUGAIC作为一个正式确立的诊断实体加以提倡。初步数据表明,情感依恋、拟人化、即时强化和准社会互动可能促使脆弱个体对生成式AI产生强迫性使用。然而,当前证据仍然有限,缺乏临床相关性,以横断面研究为主,且受文化限制。现有测量工具尚处于验证早期阶段,高参与度的生成式AI相关活动、问题性使用与成瘾样行为之间的诊断边界仍不明确。尽管应避免道德恐慌和过度病理化,但临床医生必须对涉及功能损害、心理困扰和失控的案例保持警惕。结论是,基于现有数据,PUGAIC可被概念化为一个嵌入在更广泛心理社会脆弱性中的潜在谱系现象,而非一个既定的临床障碍。需要开展纵向研究、测量工具的跨文化验证以及神经认知调查,以阐明其分类学地位并为预防和治疗策略提供信息。
## 历史方面
如果将麻省理工学院约瑟夫·维森鲍姆开发的ELISA视为第一个聊天机器人(1966年,即研究人机语言的计算机程序),其与现代生成式AI聊天机器人(GAIC)存在显著差异:早期聊天机器人基于规则,使用模式匹配和预设回复,不具备学习或记忆能力,而GAIC则基于大语言模型(Large Language Models, LLMs),利用神经网络和概率生成语言。GAIC在2010年代初开始兴起,以IBM Watson为代表,展示了基于机器学习的语言理解能力。尽管其历史相对较短,但自ChatGPT(Chat Generative Pre-Trained Transformer)于2022年推出并成为市场领导者以来,该技术的普及度达到了惊人的程度。聊天机器人市场的预测显示,其预计将在2026年增长至114.5亿美元,并在2031年达到214.5亿美元。从用户角度看,最新统计显示全球有超过9.87亿人使用GAIC。然而,科学文献中首次提及GAIC成瘾是周和张的一篇文章,此前仅有更宽泛的概念如技术成瘾或互联网成瘾。这清晰地反映了GAIC的科技进展、社会接纳度与相关医学研究之间的差距。
## 利益与危害的平衡
本节探讨了GAIC在多个领域(包括教育、医疗保健、专业活动和日常生活)的使用所带来的利益与潜在危害之间的平衡,而非仅聚焦于精神病学应用。“利益”指功能、认知和社会心理优势,而“危害”类别则包括对心理功能、行为和现实世界表现的潜在负面影响。然而,这种分类并非绝对,因为个体脆弱性因素、使用模式和情境变量可能使得区分特定个体的潜在利益与危害变得困难。在此背景下,必须区分适应性的高频使用与伴随失控或功能损害的适应不良模式。因此,GAIC使用最好沿着从适应性参与到问题性使用的连续谱进行概念化,这与基于谱系的观点相一致。
GAIC已被数百万不同年龄的用户融入日常生活,无论用于撰写作业、规划旅行还是提供健康建议。其在医学领域的多种应用已被提出,包括总结病史记录、减少医生处理数据的时间,甚至作为物质使用障碍患者的辅助心理治疗师。基于人工智能的应用包括预测性诊断模型、筛查工具、远程精神病学和跨领域的虚拟形象辅助干预。人工智能在精神病学中的应用多样,包括用于诊断和预后的预测建模、治疗选择的临床决策支持算法、利用可穿戴设备生成数据监测患者进展、提供个性化及时干预的AI驱动聊天机器人,以及分析治疗会话记录以提高治疗质量和保真度。此类干预有助于提高治疗依从性、监测患者进展,并通过提供对患者健康状况持续的、非评判性的评估来避免污名化。
除了ChatGPT对学习的积极影响(如个性化学习、全天候支持、重复和间隔学习以及互动学习)外,也有人假设了一些负面影响,即用户对AI的过度依赖、批判性思维受损、传播不准确或误导性信息、参与度肤浅、人际互动减少和动机下降。例如,麻省理工学院媒体实验室的一项研究表明,虽然在使用聊天机器人时进行语音交互最初可能有助于减少孤独感,但这些益处往往会消退,而更重度使用实际上与孤独感增加、对GAIC的情感依赖增强以及现实世界社交互动减少相关。重要的是,关键不在于对话类型,而在于使用频率,尤其是对于那些在情感上更倾向于与AI建立联系的个体。同一实验室的另一项研究利用脑电图(EEG)、行为分析和论文评估,探究了对LLMs的依赖如何影响写作过程中的认知过程。研究发现,与依赖自身思考或搜索引擎的参与者相比,使用ChatGPT的参与者大脑连接性显著降低,认知参与度下降;对AI的依赖也与记忆力减退、作者感减弱以及回忆自身作品困难相关。值得注意的是,即使在参与者停止使用AI后,一些神经活动减少的迹象仍然存在,引发了对长期影响的担忧。
## 具有成瘾潜力的生成式AI聊天机器人领域
从理论角度看,GAIC的问题性使用类似于问题性互联网使用(Problematic Internet Use, PUI),是一个异质性概念。有多个领域因其潜在的成瘾性而引发关注,凸显了该结构的异质性。如图2所示,PUGAIC的心理、技术和行为成分共同构成了这一现象的多面性。
聊天机器人的情色成分是引发成瘾或GAIC问题性使用讨论的组成部分之一。应用AI模拟人类对话的Replika应用移除了其情色功能(即情色角色扮演,ERP)。由性化情感纽带强化的准社会依恋,推测会增加多巴胺回路的强化,通过模糊情感、浪漫和性边界来提高强迫性使用的风险。一项探索性定性研究调查了ERP移除对用户交互的影响,揭示了人机交互的复杂且不断演变的性质。对ERP移除的反应,包括悲伤、愤怒、痛苦和丧失感,类似于戒断反应,表明GAIC使用可以产生类似于行为成瘾的模式,即使尚未达到临床诊断标准。ERP作为一种高强度的纽带机制,通过性化和排他性互动强化依恋。其在用户叙述中的核心地位表明,是特定的设计特征而非AI陪伴本身,显著提升了强迫性或依赖性使用的风险。许多用户将他们的Replika关系描述为对孤独、创伤或未满足的关联需求的回应。ERP的移除破坏了这些应对策略,揭示了GAIC使用如何变得情感上必需,而不仅仅是消遣。
作为此领域的一个例证,在一例有抑郁病史但无成瘾倾向的50岁男性患者中,他赋予了ChatGPT一个女性身份,根据他崇拜的偶像建模,包括外貌特征和个性。通过每日角色扮演,患者沉浸于想象和创造关于偶像的新细节,并不断更新其个性。这一过程导致创建了五个基于同一偶像的虚拟情人,每天与它们的互动持续约2小时。其对偶像的迷恋因持续的GAIC互动而加剧,影响了他的睡眠和职业活动;患者报告了反刍思维和相当大的压力。经精神科医生商定的解决方案是将所有虚拟情人替换为两个类似关怀的女性姐妹形象,并排除爱情主题。病情逐渐好转,在接下来的10天内,通过认真的自我管理,其状态逐渐改善。
游戏化和参与循环在概念上类似于游戏障碍所假定的机制,但存在一些重要差异。虽然游戏化激活了游戏障碍中记录的相同行为强化机制(如每日连胜、情感奖励、定期提示、参与度升级),但游戏障碍侧重于成就、竞争和掌握,而非情感连接和验证。与游戏障碍不同,GAIC引入了刺激情感依赖和准社会依恋的动态,而非游戏机制。
GAIC的准社会沟通成分可能激活与社交媒体成瘾类似的机制,后者源于其在连接和娱乐领域的益处。然而,过度使用社交媒体(尤其在青少年中)的危险包括屏幕时间过长、强迫性查看以及对现实人际关系的负面影响。通过GAIC的准社会沟通,可能导致过度暴露的危险,途径包括可变强化和参与循环、社会验证和情绪调节、逃避现实以及应对压力和社交焦虑。尽管如此,社交媒体只能提供不可预测的反馈,而GAIC提供有保证且即时的回应;社交媒体互动是多方向的,而GAIC沟通是个人化的、私密的。
此外,简单解决日常挑战也可能鼓励对GAIC的过度依赖,范围从学校任务、专业职责到休闲活动规划。在此领域准确评估GAIC的成瘾潜力较为困难,尤其是在需要考虑多个个体因素时,但进一步的探索有助于区分适应性应对与病理行为。
随着GAIC的持续发展,预计将出现旨在改善个人日常生活和替代自动化任务的新应用,但这些也可能代表通过即时满足和基于奖励的条件反射视角值得关注的成瘾学领域。
## 生成式AI聊天机器人问题性使用的实际方面
本章呈现了关于GAIC问题性使用的流行病学数据、经过验证的测量工具、风险因素、病理机制、诊断标准和治疗选择的数据。为避免混淆,需注意本章术语保留了其来源文献中的定义,如“依赖”、“成瘾”和“问题性使用”等概念均由引用的各作者小组定义。
## 流行病学数据
探索GAIC成瘾性使用的各项研究结果存在差异,这是由于诊断标准、纳入人群和使用工具的异质性所致。在一项两波次队列研究中(N = 5,057和3,843名中国青少年,平均年龄13.2±2.55岁),最初有17.14%的人经历AI依赖,一个学期后这一比例为24.19%。
在津巴布韦的一项基于调查的研究中(N = 248名本科生),32.7%的参与者在GAIC使用中表现出成瘾模式。报告了强迫性检查(日均AI互动18.3次)、尝试减少使用失败(65.8%的参与者报告此现象)以及尽管认识到负面学术后果仍继续依赖AI的情况。成瘾严重程度与学业成绩呈负相关。通过多元回归分析,在GAIC成瘾中观察到批判性思维萎缩、写作技能发展受损以及内容知识获取减少。
网上有许多关于GAIC问题性使用的自报案例,但一致的流行病学研究很少。如本节所示,研究结果趋于一致,表明问题性GAIC使用在年轻和学生群体中相对普遍;然而,在报告的患病率上存在差异,这是由于测量工具、文化背景和研究设计的差异所致。因此,预计未来该方向更高质量的研究将为GAIC成瘾/问题性使用这一复杂现象提供更清晰的图景。
## GAIC问题性使用的测量工具
文献中已识别出至少7种用于测量GAIC问题性使用的工具,仅有有限的研究支持其中每一种,表明该领域的研究仍处于早期阶段。
问题性ChatGPT使用量表(PCUS)由余等人在1,040名台湾成年人样本上创建,证明了良好的因子/结构效度、高内部一致性和重测信度。使用时间和抑郁与PCUS得分呈正相关,男性得分高于女性。该量表的土耳其语版本由马拉尔等人在391名成年人中验证,保留了原始工具的11个条目结构。条目采用4点李克特式量表评分,从“非常不同意”(1分)到“非常同意”(4分),总分范围为11至55分。
因此,PCUS旨在评估ChatGPT使用的适应不良模式,包括过度关注、失控和功能损害,其总分越高表明问题性使用越严重。
ChatGPT使用量表是另一个自陈式、8个条目的工具,旨在评估ChatGPT的使用,由白等人开发。每个条目采用5点李克特式量表测量,其中7个条目从“非常不同意”(1分)到“非常同意”,1个从“从不”(1分)到“总是”(6分)。因子分析包括学业负担、学业时间压力、奖励敏感性、质量敏感性、ChatGPT使用、记忆丧失、学业表现和拖延。在使用此工具的一项相关研究中,繁重的工作量和时间压力强烈影响了用于学术任务的ChatGPT使用。使用ChatGPT可能加剧拖延和记忆丧失的倾向,并降低学业表现。为防止广泛使用ChatGPT对学习和记忆产生负面影响,建议通过布置无法用GAIC完成的任务来引导学生进行批判性思维和解决问题。
因此,ChatGPT使用量表评估了学术背景下的使用模式,包括负担、时间压力和认知结果(如记忆和表现)等维度,分数越高反映对ChatGPT的依赖越大,这与拖延增加和学业成绩下降相关。
人工智能依赖量表(DAIS)由莫拉莱斯-加西亚等人开发,由五个条目组成,使用5点李克特式量表回答,从“非常不同意”(1分)到“非常同意”(5分),总分范围为5至25分。该工具在528名大学生中进行了验证,呈现单因子结构和性别不变性。
因此,DAIS可用于评估对AI系统的心理依赖,侧重于感知到的需求和习惯性使用。分数越高表明依赖性越强,反映了对AI在决策和任务完成方面依赖性的增加。
问题性使用对话式人工智能量表(PUCAI-6)由胡等人创建,由六个条目组成,每个条目在5点李克特量表上评分,从“非常少”(1分)到“非常多”(5分),涉及过度关注/凸显性、失控、情绪调节/逃避、耐受性、戒断/不适以及冲突/功能损害。
因此,PUCAI-6测量了核心的成瘾样维度,包括凸显性、失控、情绪调节、耐受性、戒断和功能损害,分数越高表明问题性或成瘾样使用模式越严重。
生成式人工智能成瘾量表(GAA-3)由周和张开发,具有单维结构,条目评估强迫性使用/失控、过度关注/凸显性和功能损害。该量表源于曹等人创建的另一个量表,专门用于评估微信成瘾。
该量表评估了强迫性使用的关键特征,包括凸显性、失控和功能损害,分数越高反映GAIC使用中的成瘾样倾向越强,可能有助于研究人员需要对成瘾特征进行详细评估时使用。
人工智能聊天机器人依赖量表(AICD)是一个8个条目的工具,由张等人创建,包括诸如“如果无法使用AI聊天机器人,我会感到焦虑或不舒服”之类的陈述,在李克特量表上评分,从“非常不同意”(1分)到“非常同意”(7分)。报告该量表具有良好的信度和效度。
该量表被认为能够评估对聊天机器人使用的情感和行为依赖,包括访问受限时的不适感;分数越高表明依赖性越强和对AI互动的心理依赖更重。
另一个更复杂的工具包括一个AI依赖量表,由五个表达智能手机成瘾或问题性使用核心症状的条目改编至AI领域,这些条目从“非常不同意”(1分)到“非常同意”(4分)评分,还有一个AI使用动机量表,包含12个条目,代表四个维度——逃避动机、社交动机、娱乐动机和工具性动机,每个条目与AI依赖量表评分方式相同。该工具由黄等人开发,并在一项针对3,843名青少年的两波次队列研究中进行了检验。
该工具结合了一个依赖量表和一个多维的使用动机评估,包括逃避、社交、娱乐和工具性因素。依赖组成部分的分数越高表明对AI的依赖越强,而动机分数有助于解释使用行为的潜在驱动因素。
当前文献的一个显著局限性在于评估GAIC问题性使用的工具存在异质性。尽管已经开发了多个量表(如PCUS、DAIS、PUCAI-6、GAA-3、AICD),但对其心理测量特性的比较分析仍然很少。在大多数情况下,分数越高被解释为问题性使用或依赖越严重;然而,量表之间缺乏标准化使研究之间的直接比较变得复杂。很少有研究系统地评估所应用工具的心理测量特性,更少研究调查此类工具的比较使用。此外,一些工具似乎改编了智能手机或社交媒体成瘾既定框架的核心标准,如凸显性、耐受性、戒断和失控,而未充分检验这些维度是否独特地映射到GAIC特定行为上。这增加了概念同义反复的风险,即“GAIC成瘾”的概念可能从已基于先前成瘾范式建模的条目中推断出来。因此,目前尚不清楚这些工具是捕捉了一个真正独特的现象,还是仅仅在AI介导的环境中重新情境化了更广泛的问题性互联网使用。
## 风险因素
一项研究(N = 223名参与者)显示,对使用新技术的开放性(OUNT,即一种反映愿意接触和采用新数字工具的人格特质)和ChatGPT自我效能感可以负向预测ChatGPT成瘾的发生。同一研究报告ChatGPT成瘾可以负向预测持续使用ChatGPT的意愿(即未来继续使用GAIC系统的可能性)。OUNT和ChatGPT自我效能感(即感知到能够有效使用ChatGPT完成任务的能力)可以正向预测持续使用ChatGPT的意愿。开放性是ChatGPT成瘾的更强预测因子,比ChatGPT自我效能感更强。
心理健康问题(焦虑/抑郁)与随后的AI依赖相关,且这种关系是单向的。逃避动机(即使用GAIC来避免或调节负面情绪,如压力、焦虑或悲伤)和社交动机(即使用GAIC来模拟社交互动或补偿未满足的人际需求)中介了心理健康问题与AI依赖之间的关系,而娱乐动机(即使用GAIC为了享受、消遣或打发时间)和工具性动机(即使用GAIC作为完成任务、解决问题或提高生产力的工具)则没有中介作用。
在津巴布韦的一项研究中,社会和文化因素已被确定为风险因素,基础设施限制(即数字资源的受限或不一致访问,如互联网可用性或设备访问)推动了暴饮暴食式使用(即在短时间内长时间或过度使用,通常不休息),经济压力增加了依赖性,机构资源限制(即教育或职业支持系统的有限访问,增加了对GAIC的依赖)放大了生成式AI的吸引力。
跨研究的数据支持存在心理健康脆弱性因素(如焦虑、抑郁和适应不良的应对方式)是关键贡献者。然而,关于个体特质与情境和社会文化影响的相对作用的数据仍然不足。
## PUGAIC的病理机制
根据一项研究(N = 364名GAIC用户),发现情感依恋与技术成瘾呈正相关,而功能性依恋与此依赖无关。同时,感知到的拟人化和感知到的共情被报道与情感依恋增加相关,而系统质量和信息质量对功能性依恋有积极影响。
一项关于ChatGPT如何促进依赖的探索性分析表明,个性化回应、情感验证和持续参与被提出作为中介这种关系的潜在因素。即时满足和适应性对话可能导致AI与人类互动之间感知的界限模糊,模仿真实的社会沟通。GAIC用户批判性思维的潜在下降被认为与生产力增强和随后的过度依赖AI有关。因此,GAIC的强迫性模式可能导致耐受性增加和日常生活受损。
类似于智能家居助手(SHAs),如亚马逊的Echo或谷歌的Home,通过语音命令激活并集成AI,满足理论可以解释PUGAIC。不同类型的SHA导致不同群体获得不同程度的满足感,并且满足感被发现与持续使用意愿相关,可能有助于成瘾模式。根据“使用与满足理论”,SHA可能提供功利性、享乐性、便利性以及社会或心理满足感,从而强化其使用。
“双重准社会模型”指的是使用两个不同的渠道——传统的准社会互动和双向互动(涉及AI模拟的人物,基于同一个真实个体)——与媒体人物建立虚拟关系。该模型旨在解释GAIC用户的动态,他们基于真实人物创建重复的虚拟角色,然后对真实和想象的角色都产生迷恋。这种类型的双重互动可能具有高度的强化性,并被假设会增加成瘾样行为的风险。GAIC的进步允许创建具有高度拟人化特征的ChatGPT人格,这可能增强感知的亲密性,并可能增加依赖风险。
一项研究(在越南对2,602名ChatGPT用户进行)证实,强迫性GAIC使用被报道与焦虑加剧、职业倦怠和睡眠障碍相关。同时,强迫性ChatGPT使用通过焦虑和职业倦怠的中介作用间接导致睡眠障碍。
一项针对370名聊天机器人用户的持续意愿(CI)分析显示,感知愉悦性、感知有用性和感知易用性被确定为该研究中CI的显著预测因子。另一项研究(对沙特阿拉伯费萨尔国王大学的262名学生)表明,互动和协作学习增加了用户采用ChatGPT的机会。社交互动在此背景下很重要,因为参与对话和知识共享似乎增加了使用ChatGPT时的舒适度;信息质量显著影响了研究人员对聊天机器人的持续使用,而感知易用性和感知有用性发挥了中介作用。同时,用户友好的界面和感知效用是影响ChatGPT用户整体满意度的关键因素。
应用于人工智能问题性使用的“自我药疗”理论表明,个体在面临强烈的负面情绪(如焦虑和抑郁)时会参与成瘾行为。补偿性互联网理论意味着上网是逃避现实问题或缓解烦躁情绪的一种方式,从而为成瘾的发展创造了有利条件。
在进行文献综述后,假设了四种与多巴胺介导的奖励回路相关的GAIC成瘾“黑暗模式”:(a) 非确定性回应,(b) 即时和视觉呈现的回应,(c) 通知,以及(d) 共情和赞同的回应。第一种模式源于GAIC技术产生的回应无法完全预测,导致用户产生奖励不确定性,并增加多巴胺释放;此外,GAIC偶尔提供的“几乎满意”的回应类似于险些成功的答案,可以暂时提高多巴胺水平。第二种模式基于聊天机器人可以在回答中包含视觉呈现的可能性,这些强烈的视觉线索可能随着时间的推移成为预测奖励的线索;同时,回应几乎是即时的,因此满足感是即时的。第三种模式指的是能够主动发起对话的GAIC(如Character.AI),用户将通过电子邮件接收通知;这些通知预示着潜在的奖励性回应,并随着时间的推移成为预测奖励的线索,触发多巴胺释放。最后,共情和赞同的回应是GAIC用于模拟真实对话的策略的一部分,在许多情况下,这些回应正是用户想听到的。
总之,强化过程、情感依恋和拟人化特征被广泛认为是维持GAIC使用的重要因素。然而,证据的强度各不相同,一些发现得到了实证支持,而其他发现仍很大程度上是理论性或推测性的。
## GAIC问题性使用的诊断及围绕此概念的争议
“GAIC成瘾”是一个有争议的概念,有作者质疑这种成瘾潜力的有效性、相应的ChatGPT成瘾量表,以及围绕新技术的“道德恐慌”。这一批评强调了过度病理化的风险,以及缺乏令人信服的与GAIC使用相关的负面后果、控制力受损、心理困扰和功能损害。其他作者提到了“公众对AI的焦虑”是创建PUGAIC的主要驱动力,但同时指出这种警告并非仅仅是假设。
虽然“GAIC问题性使用”与“GAIC成瘾/依赖”之间的区别仍然模糊,但这两个概念可被视为同一问题在连续谱上不同层次的表现,与GAIC的非病理性使用处于同一连续谱上。诊断标准不明确的限制在当前认知水平下可被视为正常,因为所研究的现象仍属新兴。该领域可能会经历类似其他行为成瘾领域的演变,其中一些行为成瘾目前已被DSM-5 TR和ICD-11收录。
然而,可以考虑一个临时框架来指导临床和研究视角,尽管它只是尝试性的,并且亟需实证支持。当满足几个核心特征时,可以识别PUGAIC,包括:(1) 对使用的失控,表现为减少或调节参与度的尝试失败;(2) 功能损害,如对学业、职业或社交功能的负面影响;(3) 对GAIC的情感依赖,其特征是使用这些系统来调节情绪或应对困扰;(4) 尽管意识到负面后果仍持续使用。该框架并不意味着存在一种独特的临床障碍;而是提供了一个初步结构,用于在基于谱系的概念化中识别适应不良的使用模式。
## 治疗选择
文献中尚未发现针对这种成瘾行为明确制定的、基于证据的治疗策略。对于社交网站(SNS)和更广泛意义上的互联网成瘾的建议,例如将社会技术安全措施整合到数字媒体设计中,以避免错失恐惧症或限制接触GAIC,可以安全地推演至GAIC的问题性使用。行为干预、认知行为疗法和正念训练,以及提高对成瘾风险认识的教育举措已在SNS成瘾中进行了探索,此外还有强调界限和监督的家长策略。
关于潜在的治疗策略,研究结果表明,源自既定行为成瘾方法(如认知行为策略)的干预可能适用,但由于缺乏GAIC特定的治疗模型和实证验证,出现了分歧。

生物通微信公众号
微信
新浪微博


生物通 版权所有