正性负性情绪量表（PANAS）的Rasch分析与跨文化等距量表构建

时间：2026年6月15日

来源：International Journal of Psychology

编辑推荐：

情感状态的精确测量需满足参数统计假设，以保障跨数据比较的信度与效度。20项正性负性情绪量表（Positive and Negative Affect Schedule, PANAS）的心理测量学性质虽属满意，但其提供的顺序量表（ordinal scale）分数

情感状态的精确测量需满足参数统计假设，以保障跨数据比较的信度与效度。20项正性负性情绪量表（Positive and Negative Affect Schedule, PANAS）的心理测量学性质虽属满意，但其提供的顺序量表（ordinal scale）分数可能不适用于参数统计分析。本研究采用Rasch模型评估PANAS的心理测量学指标，并利用来自四个国家的社区样本提升量表的测量精度。随机抽取1000名受试者（每国250人）进行分析，该样本来源于德国（475人）、加纳（523人）、印度（411人）及新西兰（413人）共计1822人的总样本。分析结果表明，在应用题组（testlet）构建方法后，正性情感（Positive Affect, PA）与负性情感（Negative Affect, NA）两个子量表均呈现出满意的模型拟合度。各子量表反映了清晰、单一的基础构念，具有优良的信度与结构效度。两个量表在不同人口学群体间功能等价，表明无论受试者的社会人口学背景如何，项目均能一致地测量情感状态。量表还表现出较强的聚合效度（convergent validity）与区分效度（discriminant validity）。本研究开发了一种将顺序分数转换为等距数据（interval data）的算法，从而提升了参数分析中的测量精度与效度。

情感状态对整体健康与幸福感具有显著影响，可广义划分为正性情感（如愉悦、幸福）与负性情感如悲伤），进而塑造情绪反应与行为模式。情感状态特指持续较长时间的心境状态，而非短暂的情绪反应。正性情感尤其重要，因其与更佳的健康结局及健康行为密切相关；负性情感则持续被发现与不良健康结局相关联。值得关注的是，在COVID-19大流行时代，情感的影响更为凸显。跨文化研究已证实情感与文化互动对健康的重要作用，因而对情感的有效测量进行跨文化评估具有重要意义。

正性负性情绪量表（Positive and Negative Affect Schedule, PANAS）作为 internationally 广泛应用的情感评估工具，其20项自评版本虽在不同文化中表现出可接受的信效度，但基于经典测量理论（Classical Test Theory, CTT）的验证性因子分析（Confirmatory Factor Analysis, CFA）存在根本性局限：其顺序量表分数精度较低、易产生误导性相关，且不适用于参数统计分析。Rasch模型根植于项目反应理论（Item Response Theory, IRT），可将原始顺序数据转换为线性测度（即logit量表），使潜在特质在连续量表上得以表征，从而满足参数统计检验的要求。尽管Rasch分析在转换顺序数据、确保项目水平不变性方面具有优势，但题组（testlet）的使用若不当可能引入解释模糊性与人为的多维性。既往基于Rasch模型的PANAS研究有限，且多集中于瑞士临床样本及巴西、新西兰特定人群，跨文化比较不足；仅有一项研究提供了顺序数据向等距数据转换的表格。这些局限影响了PANAS的推广性与稳健性，凸显了采用多样本进行全面研究的必要性。

本研究旨在运用Rasch模型，以加纳、德国、印度和新西兰的社区样本评估20项PANAS的心理测量学指标，关注信度、结构效度、聚合效度与区分效度，并探索测量不变性（measurement invariance）。研究预期PA分数与对他人的共情、乐观及自我关怀呈显著正相关，NA分数与心理困扰呈正相关，以建立聚合效度；同时预期PA与心理困扰、NA与共情/乐观/自我关怀之间呈弱至零相关，以支持区分效度。

本研究采用的关键技术方法如下。样本来源于1822名来自德国、加纳、印度、新西兰的社区受试者，经随机抽取形成每国250人的分析样本。数据采集采用线上横断面设计，加纳与印度通过研究者网络及社交媒体采用方便取样与滚雪球法，德国与新西兰则由Qualtrics公司管理并附以小额报酬。测量工具包括：20项PANAS（5点Likert量表）、5项Santa Clara简版共情量表（Santa Clara Brief Compassion Scale, SCBCS）、10项生活定向测验修订版（Life Orientation Test-Revised, LOT-R）、12项自我关怀量表简版（Self-Compassion Scale-Short Form, SCS-SF）及21项抑郁焦虑压力量表（Depression Anxiety Stress Scale-21, DASS-21）。缺失数据经Little's MCAR检验确认为完全随机缺失后，采用期望最大化算法处理。Rasch分析使用RUMM2030软件，采用非限制性部分记分Rasch模型（Partial Credit Rasch Model），通过项目-特质交互作用的χ²检验、残差值、单维性检验（t检验法）、项目特征曲线（Item Characteristic Curves, ICCs）、题组构建法（残差相关>0.20的项目组合）、个人分离指数（Person Separation Index, PSI）、差异项目功能（Differential Item Functioning, DIF）分析（含ANOVA及Bonferroni校正 pairwise t检验），并开发顺序-等距转换算法。所有变量采用Rasch转换后的等距分数进行参数检验。

研究结果部分，"初始分析与题组构建"显示：PA与NA子量表的初始分析均呈现显著的χ²值，数据未能拟合Rasch模型；PA子量表未获得单维性证据，NA子量表则具备单维性。通过将局部依赖项目组合为题组后，NA子量表成功实现整体模型拟合满意，并获得单维性证据（置信区间下限2.9%）及改进的信度（PSI=0.87）；PA子量表经进一步题组重组后，最终实现良好整体模型拟合（χ²(18)=19.43, p=0.370），获得严格单维性（置信区间下限1.7%）及优秀信度（PSI=0.91）。所有项目的反应阈值类别均 appropriately 运作。"DIF、个人-项目特质与顺序-等距转换"部分显示：项目在国家来源、性别、是否为 health worker、教育水平等维度均未显示DIF证据；PA（M=0.30, SD=1.51）与NA（M=−0.56, SD=1.05）子量表的个人-项目分布阈值有效靶向样本，无显著天花板或地板效应。研究开发了基于个人测度的顺序-等距转换算法；配对样本t检验显示PA与NA的等距分数均值（PA: M=30.28, SD=5.98; NA: M=25.62, SD=6.86）与顺序分数均值（PA: M=33.13, SD=8.22; NA: M=22.98, SD=8.69）均存在显著差异。

"聚合效度与区分效度"部分呈现：使用顺序分数时，NA与自我关怀、共情、乐观显著负相关，与心理困扰显著正相关；PA与共情、乐观、自我关怀显著正相关，与心理困扰显著负相关；PA与NA无显著关联。采用Rasch转换的等距分数后，模式基本一致，但部分相关系数幅度发生变化，如PA与自我关怀的相关系数从0.38降至0.28，NA与共情的相关系数从−0.16变为非显著的−0.15。

讨论部分，研究人员指出初始模型失拟表明观测反应模式偏离Rasch模型的概率预期，可能源于局部项目依赖、多维性或反应偏差；该问题通过题组构建法得以解决。题组修改策略将内容相近项目组合为更有意义的项目，减少测量误差并 capture 潜在变量的独特方面。所有题组构建均基于统计指标（残差相关>0.20）而非项目内容，因后者可能产生误导。本研究中经重组的题组确保了局部依赖性得到充分建模，从而改善整体模型拟合并保持测量精度。该决策以实证证据为导向，旨在改善整体模型拟合与构念效度。

与既往研究比较，Medvedev等的研究同样利用题组法获得最优模型拟合指标并确认单维性；而Peter等曾报告PA子量表可能未能测量单一潜在变量。本研究中PA与NA子量表的Rasch信度系数满足了个人与群体水平评估的标准。等距分数的使用可增强测量的精度与效度：例如，PA分数从10升至15与从15升至20，在顺序量表中看似相等，但按等距分数分别对应9.27单位与4.3单位的变化，凸显了Rasch等距分数的细微测量优势。等距分数还具有更小的测量误差，可直接通过转换表应用而无需额外验证。

社会人口学因素间的测量不变性证据表明，PANAS的测量特性在不同群体间保持一致可靠，这与既往研究相符。该特性增强了研究的外部效度，源于四个不同国家跨洲样本的使用。聚合效度与区分效度的发现进一步支持了量表的有效性：PA与自我关怀、乐观、共情的正相关，NA与心理困扰的正相关，以及PA与NA之间的弱非显著相关，均与理论预期一致。自我关怀、乐观和共情作为正性情感的保护因素，同时抵御心理困扰；心理困扰则是负性情感的风险因素。

值得注意的是，基于等距分数的相关矩阵与顺序分数相比，呈现出减弱且部分变为非显著的关联模式。这是因为顺序量表中反应选项间的距离并非真正相等，传统Pearson相关将类别视为等距处理可能导致关联被人为增强；Rasch转换则基于反应类别间的实际概率距离进行评分，产生更精确但可能更小的相关系数。此外，Rasch建模将真实潜在特质方差与测量误差及项目偏倚分离，等距分数仅保留"真实"方差，从而减少了可能 inflation 顺序相关性的共享随机噪声。

研究人员承认，PANAS维度性在不同Rasch研究中的差异可能源于性别与跨文化差异。在传统文化中，男性表达负性情绪可能被视为软弱；在个人主义文化中情绪常呈 polarized 体验，而在集体主义文化中情绪被视为相互关联和辩证的。这些社会文化因素使跨文化情感测量的准确性复杂化。当前研究采用不同招募方法虽促进了广泛参与，但也可能引入样本特征的变异性；尽管通过DIF分析进行了处理，招募方法的异质性仍可能限制结果的推广性。未来研究需测试Rasch分数的外部效度，并采用更具代表性的样本及更一致的招募策略。

研究结论部分翻译如下：本研究利用四国社区样本评估了PANAS的心理测量学指标。结果表明，无论个体的社会人口学因素如何，PA与NA子量表均可靠有效，可用于跨文化的正性与负性情感评估。研究人员开发的等距分数可增强两个量表的测量精度。自我关怀、乐观与共情可保护正性情感并减少心理困扰，而心理困扰则是负性情感的风险因素。本研究同时承认社会文化对情感表达的显著影响，倡导对PANAS进行更审慎的翻译以进一步提升其普遍适用性，从而促进健康与幸福感。然而，包括本研究在内的大多数Rasch研究仅展示了内部心理测量学的合理性，尚未测试分数的外部效度；题组若缺乏实证依据则可能掩盖项目依赖性；各国招募方法的差异性可能限制跨文化推广性。将当前发现与Mantel–Haenszel χ²等替代方法进行三角验证，将进一步强化量表在不同人口学群体间不变性的稳健性。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部