中国大学生人工智能依赖量表(AIDep-22)的编制与验证及初步应用研究

时间:2026年1月19日
来源:Frontiers in Psychology

编辑推荐:

本综述系统介绍了AI Dependence Scale (AIDep-22)的编制与验证过程,该量表基于行为成瘾理论、技术接受模型(TAM)和认知卸载理论,构建了包含情感依赖、功能依赖、认知依赖和失控感四个维度的多维结构。研究通过探索性因子分析(EFA)和验证性因子分析(CFA)证实了量表的良好信效度(Cronbach‘s α = 0.87),并初步揭示了男大学生、高年级学生、应用专业学生及高频使用者为AI依赖的高危人群,为高等教育中AI过度使用的识别与干预提供了可靠工具。

广告
   X   

开发与验证中国大学生人工智能依赖量表及初步探索
引言
随着生成式人工智能在高等教育中的普及,学生的过度依赖已成为日益严重的问题,可能削弱批判性思维和自主学习能力。为弥补综合性测量工具的缺失,本研究开发并验证了人工智能依赖量表(AIDep-22),该工具旨在评估四个假设维度上的依赖现象:情感依赖、功能依赖、认知依赖和失控感。
研究方法
量表的构建遵循严格的两阶段流程,始于通过专家评审和认知访谈进行项目生成和细化,随后对两个独立的中国大学生样本(每个N = 400)进行心理测量学评估。
研究结果
探索性因子分析支持了四因子结构,随后在第二个样本上通过验证性因子分析得到确认。最终的22项量表表现出优异的内部一致性(Cronbach‘s α = 0.87)、强大的收敛效度和区分效度,以及稳健的效标关联效度。初步分析还识别了关键的人口统计学风险因素,揭示男大学生、高年级学生、应用专业学生以及更频繁的AI使用者报告了显著更高的依赖水平。
讨论
本研究贡献了一个可靠有效的诊断工具,使教育工作者和研究人员能够识别和支持处于风险中的学生,并设计有针对性的干预措施,以促进高等教育中更平衡的人机关系。
1 引言
人工智能在高等教育中的扩散带来了深远的机遇和重大挑战。随着大学生越来越多地利用ChatGPT等工具来简化作业和解决问题,效率提升的同时,对过度依赖的担忧也与日俱增。这种过度依赖表现为对AI生成输出的不加批判的依赖,可能外包高阶认知过程和反思性判断。实证证据将持续依赖AI聊天机器人与其批判性思维和解决问题能力的减弱联系起来;具体而言,长期使用AI与独立分析能力的可测量下降相关。最近的一项系统综述强化了这一观点,表明虽然AI通过快速生成内容提高了生产力,但过度依赖会侵蚀原创性和独立思考,最终通过培养被动性阻碍长期智力发展。这些发现共同表明了一种转变,即AI工具从认知支持退化为削弱自我调节和自主性的捷径。这种模式反映了早期互联网和智能手机依赖的轨迹,即长期使用改变了认知习惯并降低了内在动机。
关于技术依赖的更广泛研究为这一现象提供了概念基础。具体而言,关于社交媒体成瘾的研究将依赖定义为一个包含情感、认知和行为领域的多维结构。例如,卑尔根Facebook成瘾量表通过显著性、情绪调节、耐受性、戒断症状、冲突和复发等成分来操作化依赖。该模型强调受损的控制和负面后果,而非仅仅使用频率,为评估数字行为成瘾提供了稳健框架。类似地,媒体和技术使用与态度量表强调了情绪反应性,以及行为失调,强调了情感反应如何维持依赖循环。这些量表表明,技术依赖不是一种静态状态,而是心理因素的动态相互作用,其中最初的自愿参与升级为具有不良后果的非自愿甚至强迫性使用。
关于智能手机成瘾的研究将这些见解扩展到无处不在的设备上,为学术环境中的AI整合建立了类似参照。具体而言,调查发现先占观念和脱离困难是大学生问题使用的核心特征。这些行为与跨越认知和身体领域的功能成本相关,表现为由受损任务切换证明的认知灵活性降低,以及长时间静态设备使用导致的一般身体不适。综合这些发现,高等教育中的技术依赖并非单一成瘾指标,而是工具性依赖和心理依恋的复杂相互作用,反映了社交媒体成瘾研究中观察到的结构复杂性。这一累积证据为分析AI依赖提供了关键信息,表明普遍存在的技术通过类似重复和强化的互动侵蚀自主性。
基于此背景,本研究将AI依赖定义为一种持续的、为学术目的过度依赖AI工具的模式,其中情绪调节、工具性学术功能、高阶认知和行为自我控制日益依赖于AI系统。这一概念化整合了三个理论流。首先,行为成瘾理论强调受损的控制和尽管存在负面后果仍继续使用,解释了最初的实验如何演变成习惯模式,优先考虑短期缓解而非技能发展。其次,技术接受模型表明,虽然感知有用性驱动采纳,但当学生内化了一种没有AI支持的不胜任感时,它可能无意中助长过度依赖,产生一个反馈循环,使系统被视为不可或缺。第三,认知卸载研究假设,将要求高的认知任务委托给外部工具,虽然暂时高效,但当它系统地取代内部处理和记忆巩固时,就会变得适应不良,最终导致技能萎缩。
与这些观点一致,本研究将AI依赖概念化为一个包含四个相互关联维度的多维结构:情感依赖涉及使用AI进行情绪调节,并在AI不可用时体验负面情绪;功能依赖反映了对AI执行任务和提高生产力的过度依赖;认知依赖涉及将高阶思维和决策委托给AI;失控感表示尽管有意图和感知成本,仍难以调节AI使用。这些维度分别映射到情感调节、工具性依赖、认知委托和行为自我调节,从而确保了一个解决高等教育中AI依赖多面性问题的整体框架。
虽然与其他数字技术存在概念上的相似之处,但AI系统具有独特的可供性,如实时个性化和自适应学习,这限制了对现有量表的直接推断。早期工具,如AI依赖量表,提供了初步见解,但采用了单维结构和有限的项目池,难以区分高分是源于情感舒适、功能便利还是控制受损。类似地,对话式AI依赖量表解决了基于聊天机器人的问题解决,但镜像了通用智能手机成瘾模板,缺乏针对学术认知需求的概念细微差别。其他测量方法,如有问题的ChatGPT使用量表,强调成瘾样症状,如渴望和干扰,但主要将AI依赖视为单一潜在构念,很少验证细微的多维模型。尽管行为导向的测量方法已识别出不同的使用模式,但它们通常避免将其框架为心理依赖,从而忽略了潜在的情感脆弱性或认知惯性机制。
这些贡献强调了AI依赖是一个关键问题,但巨大的差距仍然存在。概念上,大多数量表移植了其他技术的成瘾标记,而没有将技术接受、认知卸载和自我调节理论系统地整合到一个统一的框架中。心理测量学上,单维模型的主导地位限制了区分问题使用主要是情感性、功能性、认知性还是调节性的能力。这种维度清晰度的缺乏使针对性干预的设计复杂化,因为情感安抚策略与解决认知惯性或自我控制失败的策略根本不同。
因此,迫切需要一种理论 grounded、操作化这些方面的多维量表。为弥补这一差距,本研究为大学生开发并验证了AI依赖量表(AIDep-22),其基础是行为成瘾理论、技术接受研究和认知卸载模型。该工具将学生的AI依赖概念化为通过情感依赖、功能依赖、认知依赖和失控感表现出来的过度学术依赖。以下小节详细说明每个维度。
1.1 情感依赖
情感依赖捕捉了学生在多大程度上求助于AI,不仅是为了获取信息,而且是作为情感调节的主要来源。虽然先前的讨论建立了技术与情绪调节之间的联系,但AI依赖引入了一种不同于社交媒体的独特心理动态。与在社交媒体上寻求人际验证不同,对AI的依恋源于其在学术脆弱时刻提供即时、非评判性安慰的能力。这创造了一种“安全空间”机制,工具减轻了学习过程中固有的焦虑,如不确定性和自我怀疑。因此,AI的缺失会引发特定的负面情感反应,包括焦虑、挫败感和不安全感,这反映了更深层的情感脆弱性,而非简单的操作不便。
这种现象加深了对技术介导的依恋的理解。虽然一般构念,如无手机恐惧症描述了断开连接产生的焦虑,但AI情感依赖表明了对工具感知“全知”以管理学业压力的更有针对性的依赖。关于错失恐惧症的纵向证据表明,未满足的心理需求和FoMO驱动的社交媒体使用可以强化情感脆弱和强迫性检查的循环,为了解AI为基础的安慰如何类似地巩固对学术不适的回避提供了一个有用的类比。媒体和技术使用与态度量表等工具强调了对不使用的情绪反应性,但当前的AI研究常常忽视这种反应性如何具体侵蚀学术韧性。关键的危险在于从使用技术促进学习转变为将其用作逃避智力挑战中固有情感不适的“心理拐杖”。
在AIDep-22的开发中,该维度聚焦于情感和效用的适应不良交叉点。项目旨在测量没有AI访问权限时所经历的不安或紧张强度,以及从人机互动中获得的心理舒适度。这种操作方法与行为成瘾的戒断成分一致,但特别将其置于高等教育的情感背景中,其中AI作为学术自尊的外部调节器。
1.2 功能依赖
功能依赖描述了AI从实用的支持工具转变为强迫性需求的机制,使得学生在其缺席时无法独立完成任务。虽然接受相关模型将有用性视为采纳的驱动因素,但批判性分析揭示了高等教育中的不同轨迹:与效率是最终指标的职场工具不同,学术学习需要“合意困难”来培养能力。当AI的效率收益(如快速起草或综合)诱发一种感知无能状态,即学生感觉在没有帮助的情况下无法执行这些任务时,功能依赖就产生了。这反映了从自愿采纳到强迫性依赖的转变,其中工具不再是能力的延伸,而是其替代品。
该维度批判性地重新解释了AI工具的高频使用。虽然系统使用研究通常将广泛参与解释为积极整合,但在AI背景下,此类指标可能掩盖潜在的技能退化。最近的研究表明,虽然AI减少了认知负荷,但不受监管的工具性依赖会创造一个依赖陷阱。学生可能通过将信息收集和组织的过程步骤外包给系统来 specifically 维持高生产力。因此,有效利用和功能依赖之间的界限不在于使用频率,而在于自我效能的心理侵蚀,即一旦工具被撤回,用户感知到无法独立执行任务。
AIDep-22通过针对学生没有AI时的自我效能感来操作化该维度。项目捕捉了当AI协助被移除时,任务瘫痪或不足感的具体感觉,而非仅仅量化使用频率。
1.3 认知依赖
认知依赖考察了在持久AI支架影响下思维过程的结构性转变。扩展先前介绍的认知卸载框架,该维度突出了“认知惯性”的风险,即人类保存心智努力的倾向被AI的可用性放大。虽然卸载可以战略性地释放资源用于复杂任务,但认知依赖涉及习惯性地将高阶过程(包括分析、论证和批判性判断)委托出去。核心问题不是使用AI寻求帮助,而是在使用过程中系统性地绕过了深度学习和记忆巩固所需的建构性摩擦。
对AI文献的批判性回顾表明,这种依赖培养了一种能力错觉。学生可能用AI产生高质量的输出,并错误地将此表现归因于自身能力,从而掩盖了实际批判性思维技能的下降。这与认知心理学的警告一致,即当外部代理持续产生想法或结构时,用户用于这些任务的内部图式会因废弃而削弱。危险在于智力自主权的逐渐丧失,学生更喜欢AI的算法判断而非自己的推理。
AIDep-22通过聚焦认知努力的替代来区分该维度。项目评估了诸如未经事先反思就索取答案、偏好AI生成的逻辑而非个人批判,以及感知到的独立解决问题能力下降等行为。这种操作化将认知萎缩的理论担忧直接与可测量的学生行为联系起来,并强调智力代理的丧失,而不仅仅是使用工具的行为。
1.4 失控感
失控感代表了巩固从重度使用到问题依赖转变的调节失败。虽然前几个维度解释了依赖的动机,包括情感舒适、功能需求或认知轻松,但该维度捕捉了控制AI使用参与度的无能。关键的是,该维度将“高参与度”与“成瘾”分开。学生可能为特定项目密集使用AI而并非依赖。然而,失控感的特点是意志抑制的崩溃,使用持续存在,尽管与其他学术职责冲突或认识到收益递减。
现有测量方法常常将高使用频率与失控感混为一谈,但关于数字成瘾的研究表明,定义特征是自我调节策略的失败。在高等教育AI使用的背景下,这表现为强迫性的“提示工程”或即使边际收益可忽略不计也无法停止优化输出。新兴的AI量表报告了如渴望和强迫性检查等症状,但常常未能将这种调节缺陷与简单的功能依赖分开。通过将失控感视为一个独特的维度,该方法阐明了病理在于学生对其与系统互动的能动性减弱。
在AIDep-22中,失控感通过反映减少使用的不成功尝试、AI互动主导其他基本活动,以及主观感觉无法限制参与度的项目来操作化。这种特定的焦点确保量表识别那些已失去战略部署工具能力,反而表现出行为成瘾特征的强迫性使用模式的学生。
2 方法
AIDep-22的开发和验证遵循了经典的量表构建范式。研究分为两个主要阶段。初始阶段包括三个基础阶段:项目生成、内容效度验证和预测试。随后是第二阶段,进行大样本心理测量学评估,旨在通过探索性和验证性因子分析确定量表的因子结构,评估其内部一致性,并确认其收敛效度和区分效度。此外,通过评估其与学业自我效能感和AI使用行为的关联来检验量表的效标效度。最后,工具的初步应用涉及对不同学生人口统计学群体的AI依赖水平进行探索性分析。
2.1 项目生成
在提出的四维框架指导下,生成了包含26个自陈项目的初始池,用于测量AI依赖。这些项目的制定基于测量技术依赖和接受的已确立工具。具体而言,情感依赖和失控感维度的项目改编自现有的手机成瘾量表,针对诸如非使用期间的焦虑和调节使用困难等概念。功能依赖维度的项目修改自技术接受模型问卷;例如,最初测量感知有用性的项目被重新框架以捕捉对AI完成任务和效率的依赖。最后,认知依赖维度的项目是基于认知卸载概念开发的,旨在测量将思维任务委托给AI。
所有项目都构建为学术背景下的第一人称陈述。回答采用李克特五点量表捕获,从1(非常不同意)到5(非常同意),分数越高表示依赖程度越高。为便于解释,平均分在1.00至2.49之间被归类为低依赖,2.50至3.49之间为中等依赖,3.50及以上为高依赖。该初始池包含情感依赖6项、功能依赖7项、认知依赖6项和失控感7项。项目内容有意设计得清晰且与学生常见经历相关,避免过度技术性的语言。为减轻默认同意偏差,项目池混合了反映依赖症状的负面表述项目和表明依赖的正面表述项目。
2.2 内容效度的专家评审
为确立内容效度,AIDep-22的初始26项草案提交给专家小组进行评估。小组由五名具有相关专业知识的成员组成:两名教育技术教授、一名教育测量与评估教授,以及两名专攻技术成瘾的副教授。所有专家均隶属于中国西南地区的公立大学,并在量表开发或高等教育中技术相关行为的实证研究方面拥有丰富经验。每位专家独立就三个核心标准对所有项目进行评分:清晰度、相关性和必要性。采用四点评分量表,从1(完全不)到4(非常)。基于相关性评分,计算项目水平的内容效度指数,即评分在3分或4分的专家比例。然后,计算所有I-CVI值的平均值作为量表水平CVI。根据常见建议,I-CVI值低于0.8的项目被标记为修订或删除的候选项。必要性评分还用于计算内容效度比,以确定项目是否被大多数专家认为是必要的,进一步为项目保留决策提供信息。
综合专家反馈后,进行了严格的修订过程,导致删除4个项目并修改了另外5个。项目删除主要基于两个条件:平均相关性评分低于3.0,或低CVI值加上明显的语义冗余。例如,一个关于难以有效完成作业的项目被认为与另一个关于没有AI无法管理复杂任务的项目重复,因此保留了后者因其概念广度。类似地,一个描述感到“不安”的项目因与一个关于感到“不安或不安全”的更清晰陈述重叠而被删除。项目措辞也为精确性进行了细化,例如将关于“独立分析能力”下降的陈述修订为更全面的“独立分析和解决问题的能力”。这一迭代评审过程最终形成了一个修订后的22项量表。
2.3 预测试与认知访谈
在进行大规模数据收集和分析之前,进行了一项涉及30名本科生的预研究,以评估22项AI依赖量表的可理解性和初步心理测量学特性。这一混合方法阶段整合了定量和定性评估。
定量部分包括初步的信度分析。结果显示内部一致性很强,总量表的Cronbach‘s α为0.91,各分量表的α在0.85到0.89之间。此外,所有项目都表现出校正后的项目-总分相关远超过0.40的阈值,为其保留提供了强有力的初步证据。定性部分,与参与者进行了简短的认知访谈。他们被提示阐述对每个项目的理解,并识别任何模糊或令人困惑的措辞。这些访谈证实了项目解释与预期构念一致,且量表总体清晰。经过这些微小的措辞调整后,该工具最终确定为AIDep-22,用于后续的验证和分析。
2.4 参与者与数据收集
最终确定的AIDep-22被施测于两个独立的大学生样本,以便进行顺序的EFA和CFA。两个样本均招募自中国西南地区的一所综合性大学。采用基于学术专业的分层抽样策略,以确保两个样本中学科的代表性多样且可比。具体而言,该大学的所有本科专业被分为四个主要类别:自然科学、社会科学、艺术和教育,作为抽样层。在每个层内,随机选择完整班级,并按各专业类别总入学人数的比例设定邀请配额。数据通过在线问卷平台匿名收集。链接随后由课程讲师分发,并在学习管理系统内的群组中共享两周。
第一个样本(N = 400),指定用于EFA,由281名女性(70.2%)和119名男性(29.8%)组成。参与者年龄范围从18到24岁(M = 21.19,SD = 1.48)。该样本包括所有4个学年的学生,其中最大的群体是大四学生(28.7%)和大三学生(28.5%)。在每周AI使用频率方面,大多数学生(74.0%)报告每周使用AI工具一到四次,而15.0%报告使用更频繁(每周五次或更多)。
第二个样本(N = 400),保留用于CFA和后续验证,在一个月后从同一所大学的不同学生群体中收集,并使用相同的招募渠道以保持程序一致性。该样本由259名女性(64.8%)和141名男性(35.2%)组成,年龄分布与第一个样本高度可比,范围从18到24岁(M = 21.17,SD = 1.51)。学术专业的分布与样本1相似,反映了分层抽样设计。各学年的代表性也大致相似,大二学生(30.0%)和大一学生(26.8%)是最大的群体。观察到类似的AI使用模式,大多数学生(74.0%)每周使用AI一到四次,15.0%报告使用五次或更多。
研究方案获得了研究人员所在大学的机构审查委员会的批准。所有参与者在参与前都获得了详细的信息表并给予了书面知情同意。数据收集过程是自愿和匿名的。参与者被充分告知研究目的、其数据仅用于研究,以及他们有权在任何时候无 penalty 退出。所有程序均按照《赫尔辛基宣言》规定的伦理标准进行。
3 数据分析
本节详细介绍了AIDep-22的综合心理测量学评估。主要目标是通过顺序、多阶段的分析方法确立量表的结构效度、信度和效标效度。所有统计分析均使用IBM SPSS 27.0进行EFA和信度检验,而AMOS 27.0用于CFA。
3.1 探索性因子分析
对样本1的数据进行EFA,以确定AIDep-22的潜在因子结构。在提取之前,确认了数据适合进行因子分析。Kaiser-Meyer-Olkin抽样充分性测度为0.893,远高于推荐值0.60,Bartlett球形检验显著,χ²(231) = 3876.32,p < 0.001,表明相关矩阵适合因子化。所有项目也表现出令人满意的公度方差,范围从0.57到0.71,表明每个项目方差的大部分由提取的因子解释。碎石图显示在第四个因子后有一个明显的拐点,进一步支持保留四因子解决方案。
然后采用主成分分析配合Varimax正交旋转进行因子提取,使用Kaiser准则保留特征值大于1的因子。选择Varimax旋转而非斜交旋转是因为四个维度被概念化为不同的一阶构念,并且在探索阶段的主要目标是获得清晰可解释的简单结构,而因子间的相关性在随后的CFA中进行了更严格的检验。该程序产生了一个四因子解决方案,与提出的理论模型一致。 collectively,这四个因子解释了总方差的62.78%,超过了令人满意的解释力常规阈值60%。应用了标准的保留标准:主要因子载荷≥0.50,无交叉载荷超过0.35,每个因子至少三项。所有22项均符合这些标准,无需进一步删除。每个项目都强烈地加载到单个预期因子上,在其他因子上的载荷可忽略不计,支持了一个清晰且定义明确的因子结构。各因子解释的方差如下:因子2(17.36%)、因子4(16.41%)、因子3(14.65%)和因子1(14.36%)。
EFA结果证实AIDep-22捕捉了AI依赖的四个不同维度,直接对应于研究的理论构念。出现的因子清晰可解释,并与其各自的项目内容在主题上一致

生物通微信公众号
微信
新浪微博


生物通 版权所有