情感状态的精确测量需满足参数统计假设,以保障跨数据比较的信度与效度。20项正性负性情绪量表(Positive and Negative Affect Schedule, PANAS)的心理测量学性质虽属满意,但其提供的顺序量表(ordinal scale)分数可能不适用于参数统计分析。本研究采用Rasch模型评估PANAS的心理测量学指标,并利用来自四个国家的社区样本提升量表的测量精度。随机抽取1000名受试者(每国250人)进行分析,该样本来源于德国(475人)、加纳(523人)、印度(411人)及新西兰(413人)共计1822人的总样本。分析结果表明,在应用题组(testlet)构建方法后,正性情感(Positive Affect, PA)与负性情感(Negative Affect, NA)两个子量表均呈现出满意的模型拟合度。各子量表反映了清晰、单一的基础构念,具有优良的信度与结构效度。两个量表在不同人口学群体间功能等价,表明无论受试者的社会人口学背景如何,项目均能一致地测量情感状态。量表还表现出较强的聚合效度(convergent validity)与区分效度(discriminant validity)。本研究开发了一种将顺序分数转换为等距数据(interval data)的算法,从而提升了参数分析中的测量精度与效度。
情感状态对整体健康与幸福感具有显著影响,可广义划分为正性情感(如愉悦、幸福)与负性情感如悲伤),进而塑造情绪反应与行为模式。情感状态特指持续较长时间的心境状态,而非短暂的情绪反应。正性情感尤其重要,因其与更佳的健康结局及健康行为密切相关;负性情感则持续被发现与不良健康结局相关联。值得关注的是,在COVID-19大流行时代,情感的影响更为凸显。跨文化研究已证实情感与文化互动对健康的重要作用,因而对情感的有效测量进行跨文化评估具有重要意义。
正性负性情绪量表(Positive and Negative Affect Schedule, PANAS)作为 internationally 广泛应用的情感评估工具,其20项自评版本虽在不同文化中表现出可接受的信效度,但基于经典测量理论(Classical Test Theory, CTT)的验证性因子分析(Confirmatory Factor Analysis, CFA)存在根本性局限:其顺序量表分数精度较低、易产生误导性相关,且不适用于参数统计分析。Rasch模型根植于项目反应理论(Item Response Theory, IRT),可将原始顺序数据转换为线性测度(即logit量表),使潜在特质在连续量表上得以表征,从而满足参数统计检验的要求。尽管Rasch分析在转换顺序数据、确保项目水平不变性方面具有优势,但题组(testlet)的使用若不当可能引入解释模糊性与人为的多维性。既往基于Rasch模型的PANAS研究有限,且多集中于瑞士临床样本及巴西、新西兰特定人群,跨文化比较不足;仅有一项研究提供了顺序数据向等距数据转换的表格。这些局限影响了PANAS的推广性与稳健性,凸显了采用多样本进行全面研究的必要性。
本研究旨在运用Rasch模型,以加纳、德国、印度和新西兰的社区样本评估20项PANAS的心理测量学指标,关注信度、结构效度、聚合效度与区分效度,并探索测量不变性(measurement invariance)。研究预期PA分数与对他人的共情、乐观及自我关怀呈显著正相关,NA分数与心理困扰呈正相关,以建立聚合效度;同时预期PA与心理困扰、NA与共情/乐观/自我关怀之间呈弱至零相关,以支持区分效度。
本研究采用的关键技术方法如下。样本来源于1822名来自德国、加纳、印度、新西兰的社区受试者,经随机抽取形成每国250人的分析样本。数据采集采用线上横断面设计,加纳与印度通过研究者网络及社交媒体采用方便取样与滚雪球法,德国与新西兰则由Qualtrics公司管理并附以小额报酬。测量工具包括:20项PANAS(5点Likert量表)、5项Santa Clara简版共情量表(Santa Clara Brief Compassion Scale, SCBCS)、10项生活定向测验修订版(Life Orientation Test-Revised, LOT-R)、12项自我关怀量表简版(Self-Compassion Scale-Short Form, SCS-SF)及21项抑郁焦虑压力量表(Depression Anxiety Stress Scale-21, DASS-21)。缺失数据经Little's MCAR检验确认为完全随机缺失后,采用期望最大化算法处理。Rasch分析使用RUMM2030软件,采用非限制性部分记分Rasch模型(Partial Credit Rasch Model),通过项目-特质交互作用的χ
2检验、残差值、单维性检验(t检验法)、项目特征曲线(Item Characteristic Curves, ICCs)、题组构建法(残差相关>0.20的项目组合)、个人分离指数(Person Separation Index, PSI)、差异项目功能(Differential Item Functioning, DIF)分析(含ANOVA及Bonferroni校正 pairwise t检验),并开发顺序-等距转换算法。所有变量采用Rasch转换后的等距分数进行参数检验。
研究结果部分,"初始分析与题组构建"显示:PA与NA子量表的初始分析均呈现显著的χ
2值,数据未能拟合Rasch模型;PA子量表未获得单维性证据,NA子量表则具备单维性。通过将局部依赖项目组合为题组后,NA子量表成功实现整体模型拟合满意,并获得单维性证据(置信区间下限2.9%)及改进的信度(PSI=0.87);PA子量表经进一步题组重组后,最终实现良好整体模型拟合(χ
2(18)=19.43, p=0.370),获得严格单维性(置信区间下限1.7%)及优秀信度(PSI=0.91)。所有项目的反应阈值类别均 appropriately 运作。"DIF、个人-项目特质与顺序-等距转换"部分显示:项目在国家来源、性别、是否为 health worker、教育水平等维度均未显示DIF证据;PA(M=0.30, SD=1.51)与NA(M=−0.56, SD=1.05)子量表的个人-项目分布阈值有效靶向样本,无显著天花板或地板效应。研究开发了基于个人测度的顺序-等距转换算法;配对样本t检验显示PA与NA的等距分数均值(PA: M=30.28, SD=5.98; NA: M=25.62, SD=6.86)与顺序分数均值(PA: M=33.13, SD=8.22; NA: M=22.98, SD=8.69)均存在显著差异。
"聚合效度与区分效度"部分呈现:使用顺序分数时,NA与自我关怀、共情、乐观显著负相关,与心理困扰显著正相关;PA与共情、乐观、自我关怀显著正相关,与心理困扰显著负相关;PA与NA无显著关联。采用Rasch转换的等距分数后,模式基本一致,但部分相关系数幅度发生变化,如PA与自我关怀的相关系数从0.38降至0.28,NA与共情的相关系数从−0.16变为非显著的−0.15。
讨论部分,研究人员指出初始模型失拟表明观测反应模式偏离Rasch模型的概率预期,可能源于局部项目依赖、多维性或反应偏差;该问题通过题组构建法得以解决。题组修改策略将内容相近项目组合为更有意义的项目,减少测量误差并 capture 潜在变量的独特方面。所有题组构建均基于统计指标(残差相关>0.20)而非项目内容,因后者可能产生误导。本研究中经重组的题组确保了局部依赖性得到充分建模,从而改善整体模型拟合并保持测量精度。该决策以实证证据为导向,旨在改善整体模型拟合与构念效度。
与既往研究比较,Medvedev等的研究同样利用题组法获得最优模型拟合指标并确认单维性;而Peter等曾报告PA子量表可能未能测量单一潜在变量。本研究中PA与NA子量表的Rasch信度系数满足了个人与群体水平评估的标准。等距分数的使用可增强测量的精度与效度:例如,PA分数从10升至15与从15升至20,在顺序量表中看似相等,但按等距分数分别对应9.27单位与4.3单位的变化,凸显了Rasch等距分数的细微测量优势。等距分数还具有更小的测量误差,可直接通过转换表应用而无需额外验证。
社会人口学因素间的测量不变性证据表明,PANAS的测量特性在不同群体间保持一致可靠,这与既往研究相符。该特性增强了研究的外部效度,源于四个不同国家跨洲样本的使用。聚合效度与区分效度的发现进一步支持了量表的有效性:PA与自我关怀、乐观、共情的正相关,NA与心理困扰的正相关,以及PA与NA之间的弱非显著相关,均与理论预期一致。自我关怀、乐观和共情作为正性情感的保护因素,同时抵御心理困扰;心理困扰则是负性情感的风险因素。
值得注意的是,基于等距分数的相关矩阵与顺序分数相比,呈现出减弱且部分变为非显著的关联模式。这是因为顺序量表中反应选项间的距离并非真正相等,传统Pearson相关将类别视为等距处理可能导致关联被人为增强;Rasch转换则基于反应类别间的实际概率距离进行评分,产生更精确但可能更小的相关系数。此外,Rasch建模将真实潜在特质方差与测量误差及项目偏倚分离,等距分数仅保留"真实"方差,从而减少了可能 inflation 顺序相关性的共享随机噪声。
研究人员承认,PANAS维度性在不同Rasch研究中的差异可能源于性别与跨文化差异。在传统文化中,男性表达负性情绪可能被视为软弱;在个人主义文化中情绪常呈 polarized 体验,而在集体主义文化中情绪被视为相互关联和辩证的。这些社会文化因素使跨文化情感测量的准确性复杂化。当前研究采用不同招募方法虽促进了广泛参与,但也可能引入样本特征的变异性;尽管通过DIF分析进行了处理,招募方法的异质性仍可能限制结果的推广性。未来研究需测试Rasch分数的外部效度,并采用更具代表性的样本及更一致的招募策略。
研究结论部分翻译如下:本研究利用四国社区样本评估了PANAS的心理测量学指标。结果表明,无论个体的社会人口学因素如何,PA与NA子量表均可靠有效,可用于跨文化的正性与负性情感评估。研究人员开发的等距分数可增强两个量表的测量精度。自我关怀、乐观与共情可保护正性情感并减少心理困扰,而心理困扰则是负性情感的风险因素。本研究同时承认社会文化对情感表达的显著影响,倡导对PANAS进行更审慎的翻译以进一步提升其普遍适用性,从而促进健康与幸福感。然而,包括本研究在内的大多数Rasch研究仅展示了内部心理测量学的合理性,尚未测试分数的外部效度;题组若缺乏实证依据则可能掩盖项目依赖性;各国招募方法的差异性可能限制跨文化推广性。将当前发现与Mantel–Haenszel χ
2等替代方法进行三角验证,将进一步强化量表在不同人口学群体间不变性的稳健性。