司法语音比对中的情境偏差：暗示的强度和方向对结论扭曲的影响（来自中国的首项实证证据）

时间：2026年3月20日

来源：Forensic Science International

编辑推荐：

上下文偏见对声纹鉴定结论的影响研究，通过两个对照实验发现：强暗示使结论偏差度提升（均值差1.83）且错误率达83.3%，弱暗示偏差较小（均值差0.63，错误率46.7%）。该研究揭示声纹鉴定中存在强度-偏差梯度效应，强调程序规范（如信息屏蔽）对司法公正的重要性。

张凌申|赵一博|徐金峰|王晓斌

中国人民公安大学刑事侦查学院，中国北京市西城区睦西里1号，邮编100038

摘要

法医语音比对涉及听觉-感知判断，其结论容易受到情境偏见的影响。然而，在中国背景下，关于这种偏见影响的实证研究仍然相对较少。本研究提供了来自中国的首个实证证据，探讨了情境偏见的强度和方向如何扭曲法医语音比对的结论。两项对照实验采用了被试间设计。在实验1中（不同说话者对，强烈暗示），90名受过训练的研究生参与者接受了暗示识别或不识别的强烈情境暗示。在实验2中（相同说话者对，弱暗示），相同的参与者被重新随机分配并接受了方向意图相似的弱暗示。所有结论均使用中国的五点结论量表（GA/T 1433-2017）进行报告。主要发现包括：（1）情境暗示显著使结论偏向所暗示的方向，强烈暗示导致的结论分数变化更大（平均差异=1.83，表示参与者在有偏见和无偏见条件下的评分平均变化），而弱暗示导致的平均差异为0.63；（2）当偏见与事实真相冲突时，强烈暗示导致的错误率较高（83.3%），显著高于弱暗示（46.7%）。这些结果表明，越强的暗示会导致更明显的结论扭曲。这些发现强调了程序保障措施（例如，情境信息屏蔽）的必要性，以减少偏见并提高司法实践中法医语音比对的可靠性。

引言

心理学研究表明，个体的感知和判断经常受到背景信息、先验信念和心理预期的影响[1]。在法医学领域，由于接触到与法医任务无关的背景信息（如案件性质、嫌疑人背景或调查假设），检查员在进行分析之前可能会产生偏见，这可能会干扰检查过程。这种外部信息和环境背景对任务的无意识影响被称为“情境偏见”[2]。2009年，美国国家科学院对法医科学家容易受到认知和情境偏见的影响表示担忧[3]。此后，探索法医学中情境偏见的研究显著增加，包括理论研究、实证调查以及官方调查和指南。作为最早关注情境偏见问题的法医科学家之一，米勒指出，执法人员和律师试图在分析前通过诸如“被告已经认罪，我们只需要一份报告”之类的陈述来影响检查员的观点并不罕见[4]、[5]。这种“倒推式”的方法——即分析过程由预期结果驱动而非证据本身——可能导致偏见决策。这种偏见不仅威胁司法公正，还可能引发“雪球效应”，即一个有偏见的结论通过多个证据的积累而被放大，最终误导司法判断[6]、[7]。这种情境偏见在法医学中并不罕见，即使是法医学专家也难以完全免疫其影响。在分析法医证据之前，专家们经常会遇到与任务无关的情境信息，包括嫌疑人的种族、犯罪历史、供词、不在场证明、调查人员的假设、目击者证词、其他法医学学科的证据或其他专家对相同材料的结论。基于这些额外信息，法医专家可能会对嫌疑人的有罪或无罪形成先入为主的观念，或者对分析结果产生预期，从而以一种确认他们先前信念或预期的方式寻找和解释数据或证据，同时对与他们心理预期相矛盾的证据关注较少（即确认偏误）。例如，如果公安法医实验室的专家得知“警方已经确定了主要嫌疑人”或“嫌疑人已经认罪”，检查员可能会受到这些背景信息的影响，从而影响他们的检查过程[8]、[9]、[10]。这种现象在指纹识别和笔迹分析等主观模式匹配领域得到了广泛验证[11]、[12]、[13]。然而，最近的研究发现，即使在依赖仪器分析的客观学科中，如DNA分型和法医毒理学，关键步骤（如法医科学家的操作和结果解释）仍然无法完全免受情境偏见的影响[12]、[14]、[15]。

法医语音比对作为法医语音学的核心技术，主要通过声学特征分析来实现说话者身份验证。尽管现代法医语音比对技术广泛使用数字频谱分析、基频跟踪和共振峰提取等客观方法，但共振峰等声学特征的模糊性和多种解释方式增加了认知偏见的风险[16]。以共振峰为例，它们的频率和带宽受到声道形态、说话速度和情绪状态等多种因素的影响。说话者身份验证过程在很大程度上依赖于检查员对录音的听觉比较和对语音特征的主观解释。结论的形成高度依赖于检查员对复杂声学模式的主观解释，这使得它成为情境偏见的潜在高风险领域。由于接触到与任务无关的情境信息（如案件性质、嫌疑人背景、其他证据的暗示），检查员可能会形成先入为主的预期，从而影响特征提取、相似性评估和结论的可靠性[11]、[12]、[13]。如果检查员事先被告知嫌疑人已被其他证据“识别”，他们可能会无意识地将模糊的声学特征（例如被背景噪音掩盖的语音片段）解释为匹配的证据，而忽略否定数据[17]、[18]、[19]。

目前，在中国背景下关于法医语音比对中情境偏见的实证研究仍然相对较少[13]、[15]。大多数研究集中在自动说话者识别特征和建模方法上，或者讨论技术标准化，如基于深度学习的特征提取和多模态生物特征融合[20]、[21]。此外，随着中国互联网媒体和通信技术的快速发展，语音相关案件（如电话和网络欺诈）的数量急剧增加，导致对法医语音比对的需求显著上升，而合格的法医音频检查员数量相对较少。尽管相关法医设备不断更新，技术团队也在逐步扩大，但处理此类案件的系统和标准化操作程序仍然普遍缺乏。对于检查员决策过程中情境偏见的分析仍然不足，特别是在有效控制情境偏见方面[22]。在中国，绝大多数法医语音比对工作是由公安系统内的内部实验室完成的。检查员与调查人员之间为处理案件而进行的必要密切沟通虽然提高了操作效率，但也增加了检查员接触到非科学信息的风险——例如，在接受任务时，检查员通常会同时了解案件背景、调查进展或嫌疑人陈述等调查细节。这种信息流动模式被认为是中国综合调查-法医系统的结构特征，可能会增加情境影响的可能性[17]、[18]。这种信息可能会无意中干扰检查员的客观判断，潜意识地引导分析过程与调查方向一致，从而损害结论的公正性和科学严谨性[23]、[24]、[25]。这与罗兹等人（2025年）描述的独立或私人法医实验室的情况形成对比[26]。在这种制度背景下，情境偏见的机制迫切需要实证研究。相关研究表明，法医检查过程中情境偏见的影响程度受到三个关键因素的影响：背景信息的强度、方向和检查的难度[27]。因此，为了尽可能彻底地研究情境偏见对法医说话者识别的影响，本研究使用具有模糊声学特征的实验室录制的语音对来控制任务难度，以确保有不同的判断空间。然后通过为音频对设计具有不同暗示强度和方向的“案件背景信息”来引入不同强度和方向的情境偏见，并在每个实验中包含空白对照组。通过这些实验，本研究旨在探讨情境偏见的方向和强度如何影响识别过程和结论。