2. 专家与非专家:实验证据 相关文献在不同领域分散,因此目前尚不存在关于专家语言能力结构的统一认识。最近的研究集中在专家的词汇广度、深度或通过设计来测量语义记忆和联想过程的范式来探讨专家的词汇获取(参见Ballot et al., 2024; Barbero & Amaro, 2024; Kim et al., 2011; Masrai et al., 2021; Vintar & Saksida, 2023)。例如,Kim等人(2011)发现,在涉及专家专业领域的事件书面评估中,专家倾向于使用更广泛的名词(包括普通名词、代词和人称代词),而新手则更多依赖于形容词和动词。此外,专家每句话产生的单词数量也显著更多。Vintar和Saksida(2023)对喀斯特学(研究喀斯特和洞穴景观)领域的专家和非专家进行了词汇关联任务,发现专家在其描述词上更加专业化(例如使用专门术语“karst”而不是更通用的“cave”),表明他们形成了高度紧凑的领域特定知识。
少数心理语言学研究直接比较了专家和非专家如何检索同一组单词。Wiedenbeck(1985)发现,Fortran编程专家在两个不同任务中的反应时间更快、准确性更高:1)需要检测语法错误的任务(例如*IF(X = Y) GO TO 1000 对比 IF (X .EQ. Y) GO TO 1000);2)涉及描述性短语(例如赋值语句)的决策任务,接着是Fortran代码片段(例如F = F + TOT),参与者判断该短语是否正确描述了代码。Postal(2004)发现,熟练的足球运动员和教练在处理含有高程度语境信息的“结构化”句子(例如“对于这场比赛,教练选择了Julien负责防守”)时,阅读广度得分高于非专家(新手和支持者)。Toth等人(2019)测试了三组Counter-Strike玩家(低水平、中级和高级),并将他们与一组非玩家进行了Stroop任务比较。他们发现,高级玩家的响应更快、更准确,所有玩家组(无论等级)都快于非玩家。
还有越来越多的神经生理学证据表明,专家和非专家(或知识水平高者与低者)在处理特定领域语言方面存在差异。Bergum等人(2024)使用EEG(脑电图)结合眼动追踪技术,研究了具有不同自我报告经验的程序员的大脑活动。刺激材料包括Java源代码片段。眼动追踪结果显示,熟练的程序员对较少的代码元素停留时间更短,表明他们更高效地处理了源代码。时间频率分析的EEG数据显示,高效程序员的beta波功率较低,而alpha波和gamma波功率较高,研究者据此认为专家组的认知负荷低于经验较少的程序员。Troyer和Kutas(2020)研究了专家对“哈利·波特知识”(即哈利·波特小说中的叙事世界相关知识)违规的N400电位反应,发现违规程度与个体的领域特定知识水平有关。Kuo和Prat(2024)在他们的研究中还引发了语义上不可信的代码的N400电位反应,他们认为这表明程序员在视觉处理代码时依赖于语境合理性;这一点在所有经验水平的程序员中都存在。Walla等人(2024)发现法律专家和非专家在事件相关电位(ERPs)上存在差异;关键的是,这些差异与被视为标准刺激偏离的项目有关(即与法律相关 vs 与法律无关)。具体而言,他们在刺激后约450毫秒时,在顶叶和前中央区域(以左半球为主)发现了法律无关词汇的负电位增加。
3. 专家与非专家:实验证据 相关文献在不同领域分散,因此目前尚不存在关于专家语言能力结构的统一认识。最近的研究聚焦于专家的词汇广度、深度或通过测量语义记忆和联想过程的范式来探讨词汇的获取(参见Ballot et al., 2024; Barbero & Amaro, 2024; Kim et al., 2011; Masrai et al., 2021; Vintar & Saksida, 2023)。例如,Kim等人(2011)发现,在涉及专家专业领域的事件书面评估中,专家倾向于使用更广泛的名词(包括普通名词、代词和人称代词),而新手则更依赖形容词和动词。此外,专家每句话产生的单词数量也显著更多。Vintar和Saksida(2023)对喀斯特学领域的专家和非专家进行了词汇关联任务,发现专家在描述词上更加专业化(例如使用专门术语“karst”而不是更通用的“cave”),表明他们形成了高度紧凑的领域特定知识。
少数心理语言学研究直接比较了专家和非专家如何检索相同的单词集合。Wiedenbeck(1985)发现,Fortran编程专家在两个不同任务中的反应时间更快、准确性更高:1)需要检测语法错误的任务;2)涉及描述性短语的决策任务(例如赋值语句),随后是Fortran代码片段(例如F = F + TOT),参与者判断该短语是否正确描述了代码。Postal(2004)发现,熟练的足球运动员和教练在处理包含高程度语境信息的“结构化”句子(例如“对于这场比赛,教练选择了Julien负责防守”)时,阅读广度得分高于非专家(新手和支持者)。Toth等人(2019)测试了三组Counter-Strike玩家(低水平、中级和高级),并将他们与一组非玩家进行了Stroop任务比较。他们发现,高级玩家的响应更快、更准确,所有玩家组(无论等级)都快于非玩家。
还有越来越多的神经生理学证据表明,专家和非专家(或知识水平高者与低者)在处理特定领域语言方面存在差异。Bergum等人(2024)使用EEG结合眼动追踪技术,研究了具有不同自我报告经验的程序员的大脑活动。刺激材料包括Java源代码片段。眼动追踪结果显示,熟练的程序员对代码元素的注视时间更短,表明他们更高效地处理了源代码。时间频率分析的EEG数据表明,高效程序员的beta波功率较低,而alpha波和gamma波功率较高,研究者据此认为专家组的认知负荷低于经验较少的程序员。Troyer和Kutas(2020)研究了专家对“哈利·波特知识”违规的N400电位反应,发现违规程度与个体的领域特定知识水平有关。此外,Kuo和Prat(2024)在他们的研究中还引发了语义上不可信的代码的N400电位反应,他们认为程序员在视觉处理代码时通常依赖于语境合理性;这一点在所有经验水平的程序员中都存在。Walla等人(2024)发现法律专家和非专家在事件相关电位(ERPs)上存在差异;关键的是,这些差异与被视为标准刺激偏离的项目有关(即与法律相关 vs 与法律无关)。具体而言,他们在刺激后约450毫秒时,在顶叶和前中央区域(以左半球为主)发现了法律无关词汇的负电位增加。
本研究探讨了专家说话者和听者中专门语言系统与通用语言系统的交互,特别关注这些系统是如何实时访问和协调的。为了解决这一空白,本研究采用了一个专门设计的实验环境,以突出语言处理,并尽量减少概念问题解决、领域特定推理或身体熟练度等非语言因素的干扰。这种方法使得可以直接研究专家在处理指向相同参照对象但专业化程度不同的刺激时如何导航、激活和整合这两种语言系统。哈里斯(Harris,1982)将语言分为不同的类别,这些类别是根据使用这些语言的说话者/听者以及它们所展示的语言特征来划分的。这些语言有专门的使用者社区,他们共享专业知识,并且通常包含反映领域语义的独特词类、有限的词汇量、特殊词汇、独特的词汇类别、受限的句子语法、领域特定的词类、受限的文本语法,以及词出现的统计特征(Kittredge,1982)。航空领域对清晰度和安全性有严格要求,因此形成了专门的子语言——航空英语(Aviation English)。这是一种简化的、专门为航空通信设计的英语子集,旨在支持高效且无歧义的交流(参见ICAO Doc 9835)。航空英语常被称为“无线电通话语言”(Radiotelephony),属于“特定用途英语”(English for Specific Purposes, ESP)的范畴。它是一种高度专业化的语言,仅由受过训练的人员在专用无线电频率上使用。这些人员掌握了通过航空培训获得的专业知识,包括飞行动力学、导航、天气术语、机械系统、机场操作和其他程序技能。
5.2. 结果 由于响应时间过长或技术错误,有13名参与者被排除在外(剩余N=42)。数据清洗过程后又排除了14.5%的数据。反应时间(以毫秒为单位,见表3)被作为匹配程度(匹配 vs. 不匹配)和合法性(合法 vs. 非法)的函数进行了分析。初步的反应时间模型显示匹配程度有显著的主效应,但匹配程度与合法性的交互作用不显著。由于交互作用不显著,因此重建了一个不包括该交互作用的简化模型。在简化模型中,匹配程度仍然是一个显著预测因素,β=87.25,SE=26.51,t=3.29,不匹配的尝试产生的反应时间更长(见表4)。合法性对反应时间没有显著影响,β=-3.66,SE=24.68,t=-0.148。因此,反应时间主要受匹配任务中是否包含与话语相匹配的词汇的影响,而非话语是否为标准或非标准格式。
**表3. 专家的反应时间(毫秒)、标准差和95%置信区间(按匹配程度×合法性分类)**
| 听觉条件 | 例句 | 回忆条件 | 回忆词汇 | 平均RT(毫秒) | SD RT(毫秒) | 95% CI | |--------|--------------|---------|---------|-----------|---------| | Legal | Remain this frequency | REMAIN | 1700 | [1700 ± 51] | [1700 ± 51] | | Legal | Remain this frequency | STAY | 1763 | 985 | [1763 ± 48] | | Illegal | Stay on this frequency | REMAIN | 1688 | 916 | [1688 ± 44] | | Illegal | Stay on this frequency | REMAIN | 1744 | 954 | [1744 ± 46] |
**准确性(通过错误率衡量,见表5)**使用带有随机截距的逻辑混合效应模型3进行分析。匹配程度(χ2(1) = 41.83, p < .001*)和合法性(χ2(1) = 65.83, p < .001*)有显著的主效应,匹配程度与合法性的交互作用(χ2(1) = 20.33, p < .001*)也有显著效应(见表6、表7)。模型预测结果显示,当听觉条件为标准航空英语且回忆词汇匹配时(例如“Remain this frequency”),准确性最高;当话语非标准且回忆词汇匹配时(例如“Stay on this frequency”),准确性最低。模型诊断显示没有违反一致性、分散性或零膨胀的规则。
**表5. 专家的错误率**
| 听觉条件 | 例句 | 回忆条件 | 错误率 | |--------|--------------|---------|-----------| | Legal | Remain this frequency | REMAIN | 6.13 | | Legal | Stay on this frequency | STAY | 9.1 | | Illegal | Stay on this frequency | REMAIN | 15.7 |
该模型使用了group、match和legality作为固定效应,并为参与者设置了随机截距。模型通过glmer软件和bobyqa优化器进行拟合,最大评估次数为2×10^5次。组别、匹配程度和合法性之间存在三-way交互作用(F(1, 10339) = 7.78,p=.005):总体而言,专家在准确率上显示出比非专家更强且更一致的效果(见表15)。对于专家来说,包含标准航空术语的尝试(例如“Stay on this frequency”)的正确响应概率更低。而非专家在法律和非法项目之间的差异较小,匹配效应也相对较弱。
我们的研究结果如下: 1. 专家与非专家的准确性模式存在显著差异。专家对合法性和词汇匹配度都非常敏感,在不同条件下表现出较大的准确性差异。对于专家来说,标准航空术语提高了表现:两种类型的回忆项目在标准术语条件下的准确率都很高。相反,当专家听到非标准术语时,错误率增加,尤其是在他们听到并看到非标准术语的情况下(例如“Stay on this frequency”)。 2. 在组内分析中,非专家在匹配尝试中的错误率高于不匹配尝试,表明他们在准确识别听觉输入方面有困难。虽然专家对航空术语有较高的期望,但非专家没有这种预期:“Remain this frequency”对这些听者来说没有特殊含义。尽管“Stay on this frequency”不违反非专家心理词典中的特定条目,但由于专家语言的独特性,合法和非法项目对他们来说都同样陌生。这表明,没有航空特定框架,非专家形成的信息表示不够准确,使得基于匹配的决策比简单的排斥决策更困难。 3. 专长带来了显著的性能优势,尤其是在处理非法(非标准)项目时。专家在涉及标准术语的对比中始终表现出色,正确响应的概率是其他条件的2到3倍。这些效应在专家中普遍且显著,而非专家中则不明显。 4. 专家在反应时间上表现出强烈的匹配效应;非专家则没有。专家在匹配尝试中的反应速度明显快于不匹配尝试,表明他们有效地利用了线索与响应之间的对应关系。非专家没有显示出可靠的RT差异,表明他们没有从匹配关系中受益。