研究基于视觉的前馈机制,以扩展注视界面中的选择范围

时间:2026年5月29日
来源:Proceedings of the ACM on Human-Computer Interaction

编辑推荐:

摘要:在运动空间中扩展物体的区域(选择区域)使用Voronoi镶嵌技术可以便于在基于注视的界面中选择小目标。虽然视觉前馈(例如可视化选择区域)已被证明可以提高基于手操作的界面的选择性能,但其对基于注视的界面的影响仍不清楚。为了解决这个问题,我们进行了两项用户研究,以探讨当目标中心

广告
   X   

摘要:在运动空间中扩展物体的区域(选择区域)使用Voronoi镶嵌技术可以便于在基于注视的界面中选择小目标。虽然视觉前馈(例如可视化选择区域)已被证明可以提高基于手操作的界面的选择性能,但其对基于注视的界面的影响仍不清楚。为了解决这个问题,我们进行了两项用户研究,以探讨当目标中心及其选择区域不同时,视觉前馈如何影响注视行为和选择性能。研究结果表明,可视化选择区域或其中心都能有效地引导用户的注视朝向选择区域的中心,从而提高选择准确性。此外,显示注视光标可以通过让用户调整注视位置来减少错误,即使它并不直接引导注视朝向选择区域的中心。

1 引言
随着眼动追踪器越来越多地集成到商用头戴式显示器(HMD)中,基于注视的界面在虚拟现实(VR)和混合现实(MR)环境中的使用变得越来越普遍[Cournia等人2003;Tanriverdi和Jacob 2000]。在仅基于注视的界面中,用户通过将注视固定在目标的选择区域内指定时间来选择目标(停留时间选择)。我们使用“选择区域”一词来表示运动空间中的激活区域,即注视停留会触发选择的区域。选择区域可能与目标的视觉区域不同;换句话说,其在运动空间中的大小可能与视觉空间中的大小不同。为了便于在基于注视的界面中选择小对象,研究人员提出了使用空间划分技术(如Voronoi镶嵌[Fortune 1987])预先扩展对象大小的方法。这些方法通过将周围空间分配给最近的对象来扩大对象的选择区域。这种方法非常适合现实世界中的对象选择场景,因为物理对象不能像虚拟对象那样被系统任意重新定位[Deng等人2017;Wang和Kopper 2021]。由于选择现实世界对象需要动态分配选择区域[Fashimpaur等人2025;Lee等人2024;Toyama等人2012],基于Voronoi的扩展提供了一种同时分配和扩大选择区域的实用方法。在这项研究中,我们调查了在基于注视的界面中使用Voronoi镶嵌技术扩展选择区域时合适的视觉前馈形式。以往的研究主要考察了可视化选择区域的选择性能[Wang等人2024;Zhang 2024],但没有比较不同类型视觉前馈的性能。为了解决这一差距,我们比较了以下几种视觉前馈类型的选择性能:可视化选择区域、可视化选择区域中心以及显示注视光标。我们特别关注目标在视觉空间中的重心(CoG)与在运动空间中的重心不同的情况。这种不对齐在密集排列的环境中经常发生[Baudisch等人2008]。在这种情况下,当选择区域不可见时,用户可能会注视目标的CoG,因为人类倾向于注视对象的视觉空间CoG[Melcher和Kowler 1999]。然而,在密集排列的布局中,注视数据往往会延伸到相邻的选择区域,即使选择区域已经足够扩大,也会降低选择准确性。我们假设适当的视觉前馈可以通过改变目标的视觉空间CoG来引导用户的注视朝向选择区域的CoG,从而提高选择准确性。基于这一假设,我们在本研究中探讨了以下研究问题:[RQ1] 可以通过改变目标的视觉空间CoG的视觉前馈将注视从目标的CoG引导到其选择区域的中心吗?[RQ2] 哪种形式的视觉前馈最有效地提高基于注视的界面的选择准确性?为了解决这些问题,我们进行了用户研究,以考察在不同视觉前馈条件下的选择性能和注视行为。结果表明,可视化选择区域或其中心都能有效地引导用户的注视从目标的CoG朝向选择区域的CoG,从而提高选择准确性。相比之下,注视光标在不引起这种注视转移的情况下提高了选择准确性。在后续研究中,无论在何种条件下添加注视光标都能通过让用户调整注视位置进一步提高选择准确性。本研究有三个贡献:(1) 评估当目标中心与选择区域中心不对齐时视觉前馈对选择准确性的影响。(2) 证明可视化选择区域或其中心都能有效地引导用户的注视朝向选择区域的中心,从而提高选择准确性。(3) 显示这些视觉前馈与显示的注视光标结合使用可以进一步提高选择准确性。

2 相关工作
2.1 扩展选择区域
为了便于选择小对象,已经提出了几种方法,这些方法仅在运动空间中预先扩展对象大小[Choi等人2020;Miniotas等人2004;Niu等人2024]。最简单的方法是通过显示放大的窗口在视觉和运动空间中扩大对象[Lankford 2000;Sato等人2025;Skovsgaard等人2010]。然而,这会增加选择时间,因为需要额外的操作来调用放大窗口。相比之下,预先扩展对象大小可以减少扩大所需的时间,而仅在运动空间中扩展可以避免视觉缩放时发生的周围信息遮挡[Choi等人2020;Miniotas等人2004]。这种方法可以防止选择区域之间的重叠,从而有效地便于在鼠标[Findlater等人2010;Grossman和Balakrishnan 2005;Mott和Wobbrock 2014]、控制器[Baloup等人2019;Vanacken等人2007]和基于注视的界面[Choi等人2020;Sidenmark等人2024]中选择小对象。当使用Voronoi镶嵌技术扩展选择区域时,除非对象完全对齐,否则选择区域的CoG与对象的CoG不会重合[Du等人1999]。此外,随着对象密度的增加,不对齐的程度也可能变大。这种情况在实际应用中很常见,包括在地图上选择标记[Baudisch等人2008]、从商店展示中选择商品[Lee等人2024;Mayer等人2020]或从紧密排列的货架上选择衣服[Lee等人2024]。以往的研究主要集中在高密度情况下选择区域扩展不足的问题[Choi等人2020;Findlater等人2010;Mott和Wobbrock 2014],而这种不对齐对选择性能的影响尚未得到研究。
2.2 扩展选择区域的视觉前馈
在基于手的界面中,视觉前馈已被证明会影响具有扩展选择区域的目标的选择性能[Baloup等人2019;Gillon等人2014;2015;Su等人2014]。以往的研究报告称,可视化选择区域和突出显示悬停的对象是有效的[Baloup等人2019;Gillon等人2014;2015;Su等人2014]。相比之下,动态调整光标大小以包含对象的气泡光标[Grossman和Balakrishnan 2005]被发现会降低性能[Baloup等人2019;Gillon等人2015]。在基于注视的界面中,视觉前馈对对象选择性能的影响很少被研究[Wang等人2024;Zhang 2024]。这些研究仅考察了视觉和运动空间中不同目标大小组合的选择性能。Zhang等人[Zhang 2024]报告称,使用停留时间选择方法对不可见选择区域的选择时间明显快于可见选择区域。相比之下,没有比较研究探讨了不同类型视觉前馈下基于注视的界面的性能。与鼠标界面不同,基于注视的界面通常省略了光标,因为显示注视位置对于交互来说不是必需的[Jacob 1995]。因此,注视光标可以被视为一种视觉前馈形式。在停留时间选择中,两项研究没有发现注视光标对性能有显著影响[Alonso等人2013;Zhang等人2011],而另一项研究则报告称它显著减少了选择时间[Wei等人2025]。后者认为注视光标作为用户当前注视位置的提示,从而提高了性能。然而,在扩展选择区域的背景下,注视光标对选择性能的影响尚未被探索。
2.3 人类注视行为
朝向对象的扫视通常落在其CoG附近[Melcher和Kowler 1999],注视也显示出类似的模式[Melcher和Kowler 1999;Richards和Kaufman 1969]。最初的注视通常指向2D[Melcher和Kowler 1999;Richards和Kaufman 1969]和3D对象[Brouwer等人2009;Schuetz和Fiehler 2024;Vishwanath和Kowler 2004]的CoG。在最初的扫视之后,注视通常会转移到功能区域(例如茶壶的嘴部[Roberts和Humphreys 2010;van der Linden等人2015])。在基于注视的菜单界面中,用户也倾向于注视圆形或方形菜单项的CoG,这与最佳注视位置一致。注视这个点有助于将注视分散保持在选择区域内,而靠近边缘的注视会增加注视偏离目标的可能性。为了最小化注视向周围区域的偏移,Apple建议使用圆形元素并将文本或符号放置在中心。然而,当目标的视觉CoG与选择区域的CoG不同时,用户的注视位置不再与最佳注视位置对齐。在这种情况下,即使最佳注视点位于选择区域的中心,用户也倾向于注视目标的CoG。因此,建立一种前馈设计策略来引导用户的注视朝向选择区域的中心是很重要的。

3 研究1
为了回答RQ1和RQ2,我们进行了一项研究,以探讨视觉前馈是否可以引导用户的注视朝向选择区域的中心,从而提高选择性能。该研究在MR环境中进行。此外,该研究得到了我们研究所伦理审查委员会的批准(编号2024R859)。从当地实验室招募了18名参与者(2名女性,16名男性;平均年龄=22.9岁,标准差=1.1,ID:1-18)。所有参与者都具有正常的色觉。其中9人视力正常,3人戴眼镜,6人使用隐形眼镜。此外,9人有使用基于注视的界面的经验。每位参与者获得了12美元的参与报酬,每次会话持续大约60分钟。

3.1 选择区域设计和对象布局
3.1.1 选择区域的扩展算法
我们使用Voronoi镶嵌技术扩展每个对象的选择区域,然后使用固定半径的圆形区域裁剪这些区域(截止半径[Choi等人2020])。在停留时间选择方法中,不建议使用整个视野作为选择区域[Choi等人2020],因为停留时间可能在任何感兴趣的点累积,并可能在整个空间中触发不必要的激活[Jacob 1990]。因此,对每个选择区域进行了裁剪,以将其限制在适当的大小。
3.1.2 选择区域中心的定义
我们将选择区域的中心定义为最佳注视点,该点代表了最能解释注视分散的位置。换句话说,中心对应于选择区域内最大的内切圆的圆心,即距离其边界最远的点。此外,选择区域的中心可能与其CoG不同,例如在圆形扇区的情况下。
3.1.3 目标和干扰物的布局
我们设计了四种布局,每种布局包含一个目标和多个干扰物,其中目标和其选择区域的中心在空间上不对齐。这些布局由两种布局类型(Cross和Radial)和两种中心偏移级别(Medium和High)的组合定义(图1)。
图1. 每种布局和中心偏移组合的对象布局和目标选择区域。红色球体代表目标,白色球体代表干扰物。实线黑色线条围成的区域表示目标的选择区域,而黑色方块(▪)标记选择区域的中心。
布局指的是对象的空间排列。在Cross布局中,目标被上方、下方、左侧和右侧的干扰物包围(图1a和1b)。这种配置在目标扩展技术的研究中广泛使用[Chapuis等人2009;Choi等人2020;Grossman和Balakrishnan 2005;Su等人2014];由此产生的选择区域形成一个正方形。相比之下,Radial布局将干扰物均匀地分布在目标的八个基本方向和中间方向上;这形成了一个圆形配置[Shi等人2023;Waugh等人2025](图1c和1d)。在这种情况下,目标的选择区域呈圆形扇形。选择“十字形”和“放射形”布局有两个主要原因:(1)它们的几何结构在先前的研究中已经被研究过[Chapuis等人2009年;Choi等人2020年;Grossman和Balakrishnan 2005年;Shi等人2023年;Su等人2014年;Waugh等人2025年];(2)它们允许系统地调整中心偏移量。此外,这两种布局在选择区域的特性上也有所不同:“十字形”布局产生一个有限的目标Voronoi区域,而“放射形”布局产生一个被截止半径裁剪的无界区域。中心偏移量指的是目标中心与其选择区域中心之间的空间偏移量。“高中心偏移量”表示目标与其选择区域的边缘直接接触的最大偏移量(见图1b和1d)。“中等中心偏移量”表示目标中心与其选择区域中心距离的0.75倍(见图1a和1c)。我们将截止半径设置为25°,这个大小通常被认为足以用于基于注视的选择[Choi等人2022年;Feit等人2017年]。然而,目标密度和对象数量在构建上仍然有所不同。在“十字形”布局中,两种中心偏移量下的截止半径都设置为6.80°。在“放射形”布局中,当中心偏移量为中等时,截止半径设置为5.65°;当中心偏移量为高时,截止半径设置为6.80°。因此,目标中心与选择区域中心之间的距离分别为:十字形×中等为1.5°,十字形×高为2.0°,放射形×中等为3.4°,放射形×高为4.5°。

3.2 比较的前馈条件
我们设计了五种类型的视觉前馈:气泡、轮廓、单元格、标签和图标(见图2)。这些前馈类型借鉴了之前的研究[Baloup等人2019年;Choi等人2020年;Grossman和Balakrishnan 2005年;Guillon等人2014年;2015年;Huo等人2018年;Mayer等人2020年;Schenkluhn等人2024年;Su等人2014年]。比较了六种视觉前馈条件,包括没有任何视觉前馈的条件(无)。在所有条件下,当前注视对象的轮廓都会用蓝色高亮显示,以指示用户的注视焦点。可视化参数(例如颜色、透明度、轮廓宽度、图标大小和标签文本大小)是通过作者的迭代优化确定的。选择颜色、透明度和轮廓宽度是为了减少视觉杂乱,而标签和图标大小则设置为确保清晰可见,同时保持足够小以避免与邻近对象重叠。这些视觉前馈的详细信息如下:
图2. 本研究设计的五种视觉前馈类型。在所有面板中,用户都在目标的选择区域内注视。
(1)“无”是基线条件,即不显示任何视觉前馈[Baloup等人2019年;Guillon等人2015年;Su等人2014年]。
(2)“气泡”显示一个2D半透明的蓝色气泡光标,作为注视光标[Choi等人2020年;Grossman和Balakrishnan 2005年;Guillon等人2015年]。当用户的注视落在对象的选择区域内时,光标的半径会动态调整以完全包围该对象。
(3)“轮廓”可视化每个对象选择区域的边界[Guillon等人2014年;2015年]。轮廓为蓝色,宽度为0.006米。当用户的注视落在选择区域上时,其轮廓会变粗至0.02米。
(4)“单元格”可视化每个对象的选择区域[Guillon等人2014年;2015年]。每个选择区域用半透明的灰色填充,并用0.006米宽的蓝色轮廓勾勒。当用户的注视落在选择区域上时,填充区域会变为半透明的蓝色。
(5)“标签”在每个对象选择区域的中心显示一个灰色的文本标签“对象”[Mayer等人2020年]。每个文本标签通过一条灰线与其对应的对象连接。文本标签的大小为0.24米×0.07米(约5.4°×1.4°)。当用户的注视落在选择区域上时,文本标签和线条会用蓝色高亮显示。如果文本标签与对象重叠,它会重新定位以避免重叠。
(6)“图标”在每个对象选择区域的中心显示一个带有白色勾号的灰色圆形图标[Huo等人2018年;Schenkluhn等人2024年]。每个图标通过一条灰线与其对应的对象连接。图标的直径为3.0度。当注视落在选择区域上时,图标和线条会用蓝色高亮显示。

为了回答研究问题1(RQ1),我们主要采用了改变目标重心(CoG)的视觉前馈条件(轮廓、单元格、标签和图标)。此外,为了检验重心变化的效果,我们还包括了保持重心不变的“气泡”前馈。尽管存在其他视觉前馈方法,但我们选择这五种条件的原因如下:(1)可以实施的条件数量有限;(2)目的是包括多种涉及重心变化的前馈方法;(3)优先考虑已被证明对基于注视的界面有效的“气泡”方法[Choi等人2020年]。

3.3 研究设置
3.3.1 设备
我们使用了HTC Vive XR Elite头戴式显示器(HMD)和VIVE全脸追踪器。HMD的眼动追踪器的精度在0.5°到1.1°之间,视野为110°,HMD和眼动追踪器的刷新率为90Hz。HMD以独立模式使用,利用其穿透功能。研究中使用的应用程序是用Unity 2022开发的。

3.3.2.3 设计
我们采用了参与者内设计。如前所述,有三个自变量:(1)前馈:无、气泡、轮廓、单元格、标签和图标;(2)布局:十字形和放射形;(3)中心偏移量:中等和高。前馈条件的顺序使用拉丁方设计进行了平衡。每位参与者每种条件完成两次会话,每次会话包含32次试验(2种布局×2种中心偏移量×8个目标位置)。八个目标位置对应于十字形布局中目标选择区域的中心方向和放射形布局中所有对象的中心方向。每次会话内的32次试验顺序是随机的。每位参与者收集了384次有效试验(6种前馈×2次会话×32次试验),从而在所有18位参与者中总共获得了6,912次试验。

3.3.3 任务
研究任务是使用停留时间选择方法来选择一个目标。在每次试验开始时,根据布局和中心偏移量条件生成可选对象。每个对象是一个角直径为1.0°的球体,目标为红色,所有干扰物为白色。目标位于参与者前方3.0米处,其余对象排列在垂直于参与者头部方向的平面上。视觉前馈与其对应的对象处于相同的深度显示。当参与者的注视在其选择区域内停留0.7秒时,即选择了一个对象。为了防止对象生成后立即由于非自愿注视而导致的意外选择,忽略了对象生成后前0.3秒内的停留时间。注视数据使用saccade检测[Feit等人2017年]和三角形核滤波器[Jimenez等人2008年]进行处理。选择后或超时5.0秒后,对象会重新生成。新目标会在距离上一个目标恰好15°的随机角度方向生成,同时保持在以参与者前方方向为中心的20°半径范围内。这个序列构成了一次试验。

3.3.4 程序
参与者到达当地大学指定的房间后,被要求坐在距离墙壁4.0米的位置,并阅读并签署知情同意书。之后,他们完成了一份收集个人信息的问卷,包括姓名和性别等。随后,向参与者介绍了研究概要以及选择区域扩展算法和视觉前馈特性的详细解释。佩戴眼镜的参与者被要求在戴上HMD之前取下眼镜。然后调整了HMD的屈光度和瞳距,并为每位参与者适配了设备。接着使用HMD内置软件进行了五点眼动追踪校准。在主要任务之前,所有参与者都完成了一次不同参数的练习会话,以熟悉程序。每位参与者每次会话完成32次试验,并进行两次连续的会话。这个程序对每种前馈条件都重复进行。完成所有试验后,对参与者进行了访谈,并询问他们偏好的前馈条件。

3.4 统计量
我们分析了以下指标:
错误率(ER):被分类为错误的试验比例。如果选择了干扰物(错误选择)或在试验开始后5.0秒内没有选择,则认为试验错误。
选择时间(ST):从试验开始到成功选择目标的时间。最小ST为1.0秒,这反映了为防止对象生成后立即出现意外选择而忽略的0.3秒停留时间和选择所需的0.7秒停留时间。
注视偏移量(GO):在转换后的2D坐标系中的注视x坐标,其中目标位于原点,选择区域中心位于+x轴上。GO转换为视觉角度,并仅对非超时试验进行分析。对于每次试验,注视定义为在0.7秒停留期间记录的注视点的平均值。接近零的值表示注视位置更靠近目标,而接近目标与选择区域中心距离的值表示注视位置更靠近选择区域中心。

3.5 结果
在所有试验中,有12.5%的试验出现了目标选择失败(6,912次中的861次)。在这些错误试验中,超时占了9.1%(861次中的78次)。此外,有三次试验没有记录注视数据,这些数据被排除在ER、ST和GO的分析之外。最终的有效数据点数量分别为ER为6,909个,ST为6,048个,GO为6,831个。
对于ER,我们使用了广义线性混合模型(GLMM)[Bolker等人2009年],其中前馈、布局和中心偏移量作为固定因素。模型使用Type-III Wald χ2检验进行评估。事后分析使用估计的边际均值进行成对比较,并进行了Tukey校正。对于ST和GO,我们发现数据不符合正态分布。因此,我们对每个数据集应用了对齐等级变换[Wobbrock等人2011年],然后进行了带有前馈、布局和中心偏移量作为组内因素的三因素重复测量ANOVA。随后,我们使用Holm校正[Holm 1979年]进行了ART-C [Elkin等人2021年]的事后分析。GLMM和ANOVA的结果总结在表1中。
表1. 错误率(ER)、选择时间(ST)和注视偏移量(GO)的结果
变量 χ2值 p值 p值 p值 p值 F值 p值 p值 F值 p值 p值
FFD × LAY 97.22 <.01 F5, 600 = 2.18 .05 .002 F5, 679 = 200.99 <.01 .129
LAY 51.73 <.01 F1, 600 = 619.37 <.01 .093 F1, 679 = 842.75 <.01 .110
CO 35.03 <.01 F1, 600 = 88.34 <.01 .014 F1, 679 = 311.58 <.01 .044
FFD × LAY 11.23 <.05 F5, 600 = 2.58 <.05 .002 F5, 679 = 69.29 <.01 .049
FFD × CO 5.94 .31 F5, 600 = 0.99 .42 .001 F5, 679 = 10.56 <.01 .008
LAY × CO 5.81 <.05 F1, 600 = 15.35 <.01 .003 F1, 679 = 79.17 <.01 .012
FFD × LAY × CO 16.02 <.01 F5, 600 = 0.53 .75 .000 F5, 679 = 7.16 <.01 .005

表1显示了研究1中错误率(ER)和选择时间(ST)及注视偏移量(GO)的GLMM和ANOVA结果。变量前馈、布局和中心偏移量分别缩写为FFD、LAY和CO。

3.5.1 错误率(ER)
图3显示了每种前馈条件下布局和中心偏移量的ER。无前馈条件的ER为21.44%,气泡前馈条件为12.17%,轮廓前馈条件为9.11%,单元格前馈条件为10.50%,标签前馈条件为12.32%,图标前馈条件为9.21%。在放射形布局中,气泡、轮廓、单元格和图标在中等中心偏移量条件下的ER显著低于无前馈条件;无前馈条件在高中心偏移量条件下的ER显著高于其他前馈条件。尽管气泡前馈相对于无前馈条件降低了整体ER,但在放射形布局×高中心偏移量条件下,其ER仍然显著高于其他前馈条件。

图3. (a)十字形布局和(b)放射形布局的错误率(ER)。误差条代表95%的置信区间。统计上显著的差异(p <.05)通过连接正方形(▪)和三角形(▾)标记的实线来表示。3.5.2 选择时间(ST)。中位选择时间为:None为1.36秒,Bubble为1.36秒,Outline为1.36秒,Cell为1.39秒,Label为1.39秒,Icon为1.41秒。在Cross布局中,Outline条件(中位数=1.21秒)的选择时间显著快于Icon条件(中位数=1.30秒)(t6007 = 3.49,p <.05)。然而,就效应大小而言,选择时间的主要影响因素是布局(ηp2=.093)和中心偏移(ηp2=.014),而前馈效应相对较小(ηp2=.002)。3.5.3 注视偏移(GO)。图4展示了GO,图5展示了每种前馈条件下注视点的95%置信椭圆。None和Bubble条件下的注视偏移显著小于其他前馈条件。这些结果表明,Bubble条件将参与者的注视引导至目标中心,而Outline、Cell、Label和Icon条件则成功地将参与者的注视引导至选择区域中心。图4. (a) Cross布局和(b) Radial布局的注视偏移(GO)。虚线表示选择区域的中心,圆圈(○)代表目标的视觉空间质心(CoG)。统计上显著的差异(p <.05)通过连接正方形(▪)和三角形(▾)标记的实线来表示。图5. 注视点的95%置信椭圆。圆圈(•)代表目标位置,正方形(▪)代表选择区域的中心。3.5.4 参与者的反馈。加权平均偏好排名分别为:None为3.95,Bubble为2.14,Outline为2.52,Cell为2.42,Label为3.33,Icon为3.62。因此,前馈条件的偏好顺序从高到低为:Bubble > Cell > Outline > Label > Icon > None。对于None条件,大多数参与者对较高的错误率表示不满。然而,有三位参与者认为None条件没有视觉干扰。对于Bubble条件,参与者更喜欢看到注视光标,因为它帮助他们更准确地调整注视位置。P14评论说:“因为我能看到自己在看哪里,所以在即将做出错误选择时很容易纠正我的注视。”对于Outline条件,参与者倾向于将注视引导至选择区域中心,这受到选择区域轮廓可视化的影晌(P15:“通过关注选择区域而不是目标,选择变得更加容易。”)。P6和P14报告说他们调整了注视位置以利用轮廓可视化(P6:“我通过关注选择区域的外围来进行选择。”)。对于Cell条件,选择区域的可视化也使参与者能够将注视引导至选择区域中心。然而,P9认为视野中较大的填充选择区域在视觉上令人难以忽视(“如果没有填充会更好,因为背景很难看清。”)。对于Label条件,参与者认为他们的注视自然会被文本标签吸引(P7:“我的注视更多地落在文本上,超出了预期。”)。然而,也有几位参与者报告说水平排列的文本标签增加了视觉杂乱。P15指出:“当目标的文本标签靠近干扰物时,干扰物更有可能被错误选中。”对于Icon条件,参与者认为图标引导了他们的注视(P18:“与Label条件类似,我倾向于看图标而不是目标。”)。然而,也有几位参与者报告说大的图标在视觉上分散了注意力(P1:“图标太大,挡住了我的视线。”)并且对应该关注目标还是图标感到困惑(P5:“我不确定应该看目标还是图标。”)。3.6 研究1的总结我们研究了在六种视觉前馈条件下的目标选择表现。与None条件相比,Outline、Cell、Label和Icon条件将注视点移向了选择区域中心,从而显著提高了选择准确性。相比之下,Bubble条件无法将注视引导至选择区域中心,注视点分布在目标周围。尽管如此,它仍然是最受青睐的前馈条件,并且在所有条件下有效降低了错误率,除了Radial × High。4 研究2基于研究1的结果,我们观察到Bubble条件提高了选择准确性,而没有将注视点移向选择区域中心,这是出乎意料的。我们假设这种改进主要来自于注视位置的可视化,而不是气泡机制本身,并且在其他前馈类型中添加注视光标可以进一步提高选择准确性。为了验证这些假设,我们进行了后续研究。这项研究也得到了我们机构伦理审查委员会的批准(编号2024R866)。从当地大学招募了24名参与者(8名女性和16名男性;平均年龄=23.3岁,标准差=1.4岁,ID:19–42)。所有参与者都具有正常的色觉。其中,5人有正常视力,10人戴眼镜,9人戴隐形眼镜。此外,4人有使用基于注视的界面的经验。每位参与者获得了12美元的报酬,每次会话持续约70分钟。4.1 研究设置我们采用了参与者内设计。有三个独立变量:(1)前馈:None、Bubble、Outline、Cell、Label和Icon;(2)布局:Cross和Radial;(3)注视光标:Off和On。前馈和布局条件与研究1中使用的相同。注视光标因素表示注视光标是否可见。注视光标由一个直径为0.5°的黄色圆圈表示,位于距离参与者头部2.9米的位置。在Bubble条件下,当注视光标为On时,不显示黄色圆圈;相反,显示一个蓝色的气泡光标——与研究1中使用的相同——作为注视光标。当注视光标为Off时,注视光标不可见。也就是说,None × Off和Bubble × Off条件的视觉外观与研究1中的None条件相同,它们也具有相同的选择逻辑和选择区域的定义。前馈和注视光标条件的顺序是平衡的,前者遵循拉丁方阵设计。每位参与者依次体验每种前馈条件下的两种注视光标状态。每次引入新的前馈条件时,注视光标状态会交替。一半的参与者在Off条件下开始他们的第一个前馈条件,另一半在On条件下开始。参与者完成了每种前馈和注视光标组合的两次会话,每次会话包含16次试验(2种布局×8个目标位置)。每次会话内的16次试验顺序是随机的。我们收集了每位参与者384次有效试验数据(6种前馈×2种注视光标×32次试验),从而得到了所有24名参与者的9,216次试验数据。设备和程序、任务和指标与研究1中使用的相同。对象是在中心偏移设置为High条件下生成的。完成给定前馈条件的所有试验后,参与者被要求指出他们偏好的注视光标条件。这个过程对所有六种前馈条件都重复进行。完成所有试验后,对参与者进行了访谈,并询问他们偏好的前馈条件。4.2 结果在所有试验中,有17.5%的试验出现了目标选择错误(9,216次中的1,612次)。在这些错误试验中,超时占11.4%(1,612次中的183次)。此外,有三次试验没有记录注视数据,这些数据被排除在ER、ST和GO的分析之外。最终的有效数据点数量分别为:ER为9,213个,ST为7,601个,GO为9,030个。对于ER、ST和GO,我们使用了与研究1相同的统计程序,将前馈、布局和注视光标作为被试内因素。这些分析的结果总结在表2中。表2. 错误率(ER)选择时间(ST)注视偏移(GO)变量χ2值pF值pηp2F值pηp2FFDχ52=152.96<.01F5, 7556 = 2.47<.05.002F5, 8983 = 240.62<.01.118LAYχ12=143.38<.01F1, 7556 = 1013.31<.01.118F1, 8983 = 847.99<.01.086GCχ12=60.32<.01F1, 7555 = 0.13.72.000F1, 8983 = 7.86<.01.001FFD × LAYχ52=44.94<.01F5, 7554 = 0.57.73.000F5, 8983 = 63.40<.01.034FFD × GCχ52=9.24.10F5, 7555 = 3.98<.01.003F5, 8983 = 0.44.82.000LAY × GCχ12=0.31.58F1, 7554 = 1.18.28.000F5, 8983 = 2.86.09.000FFD × LAY × GCχ52=12.32<.05F5, 7554 = 1.42.21.001F5, 8983 = 0.64.67.000研究2中错误率(ER)的GLMM结果以及选择时间(ST)和注视偏移(GO)的ANOVA结果。前馈、布局和注视光标分别缩写为FFD、LAY和GC。4.2.1 错误率(ER)。图6显示了每种注视光标条件下前馈和布局值的ER。在Cross布局中,当注视光标可见时,None、Bubble和Cell条件显著降低了ER。在Radial布局中,当注视光标可见时,None、Cell、Label和Icon条件也显著降低了ER。这些结果表明,将注视光标可视化与其他形式的视觉前馈结合使用可以提高选择准确性。图6. (a) Cross布局和(b) Radial布局的错误率(ER)。误差条代表95%置信区间。统计上显著的差异(p <.05)通过连接正方形(▪)和三角形(▾)标记的实线来表示。4.2.2 选择时间(ST)。在Outline条件下,显示注视光标导致选择时间显著加快(中位数:1.43秒对比1.52秒)(t7555 = 3.38,p <.05)。然而,就效应大小而言,选择时间的主要影响因素是布局(ηp2=.118),而前馈×注视光标的交互作用仅显示出微小效应(ηp2=.003)。4.2.3 注视偏移(GO)。观察到注视光标的主效应显著。对涉及注视光标的交互作用的后续分析没有发现显著差异。总体而言,显示注视光标(中位数=1.00°)导致注视偏移显著小于不显示注视光标的情况(中位数=1.15°)。4.2.4 参与者的反馈。前馈的加权平均偏好排名分别为:None为5.29,Bubble为3.95,Outline为3.76,Cell为2.95,Label为3.76,Icon为4.29。因此,前馈条件的偏好顺序从高到低为:Cell > Outline = Label > Bubble > Icon > None。关于参与者对不同前馈条件下注视光标的偏好,显示注视光标在所有情况下都更受欢迎。以下是偏好On条件的参与者比例:None—75%(18/24),Bubble—75%(18/24),Outline—92%(22/24),Cell—67%(16/24),Label—71%(17/24),Icon—63%(15/24)。此外,注视光标用于识别参与者实际注视与系统估计注视位置之间的差异,从而使他们能够相应地进行调整。P33评论说:“因为注视光标向左偏移,我将我的注视或头部稍微向目标的右侧移动。”相比之下,一些参与者报告说显示选择区域(或其中心)和注视光标造成了视觉杂乱。在Label条件下,P22评论说:“我更希望没有光标,因为视觉信息太多。”4.3 研究2的总结我们研究了在六种视觉前馈条件下的选择表现,包括显示和不显示注视光标的情况。显示注视光标的条件下的GO值显著低于不显示注视光标的条件。然而,在Radial布局中,将注视光标与Cell、Label或Icon前馈条件结合使用显著提高了选择准确性。此外,所有前馈条件下参与者都更喜欢显示注视光标的条件。5 讨论5.1 RQ1:通过视觉前馈改变注视位置研究1和2的结果表明,可视化选择区域或其中心有效地将用户的注视引导至选择区域中心。相比之下,当视觉前馈显示注视光标时,注视点倾向于保持在目标附近。这些发现表明,通过视觉前馈改变目标的视觉空间质心(CoG),可以引导用户的注视至选择区域中心。然而,当视觉前馈改变了视觉空间CoG时,注视点在视觉空间CoG和目标CoG之间广泛分布(图5)。这一结果与先前的研究结果形成对比,那些研究指出人类倾向于注视物体的视觉空间质心(CoG)[Melcher和Kowler 1999]。这可能是因为参与者认为目标本身比视觉前馈信息更值得关注。先前的研究已经揭示,注视点往往会落在功能相关的物体部分上[van der Linden等人 2015]。因此,参与者感知到质心向目标方向移动,从而导致注视点的相应变化。此外,研究还表明,改变视觉空间质心可以改变注视位置,从而暗示通过视觉前馈引导用户视线到期望位置的可能性。这表明可以采用一种方法,使系统主动引导用户的视线到能够更可靠地推断出他们目标的位置,而不仅仅是依赖视线目标估计。从理论上讲,由于视线估计的准确性永远不会完美[MacKenzie 2010],设计能够使系统更容易解读用户注意力焦点的用户界面——正如本研究中提出的方法——对于推进基于视线的交互至关重要。

5.2 RQ2:每种视觉前馈的选择性能
我们确认,可视化选择区域或其中心的视觉前馈条件以及显示视线光标的条件都提高了选择准确性;而且,结合这些视觉前馈方法进一步提高了准确性。这些机制似乎通过不同的策略增强了选择准确性,表明它们的组合可以有效地提高选择精度。在研究1中,显示视线光标(Bubble)的条件最受参与者欢迎,并且也提高了选择准确性。参与者使用光标来识别他们预期的视线与系统估计的视线位置之间的差异,并相应地调整视线以更好地将光标与目标对齐,从而提高了准确性。这种由用户驱动的光标调整策略也已在先前的研究中得到报道[Wei等人 2025]。我们的结果进一步表明,当使用停留时间选择方法时,这种策略也可以应用于扩展的选择区域。尽管改变目标的质心在所有布局×中心偏移条件下都提高了选择准确性,但在径向布局×高中心偏移条件下,显示视线光标并没有提高选择准确性。在这种条件下,目标中心与选择区域中心之间的距离最大,且选择区域围绕目标的余地很小。一致地,径向布局的错误率高于交叉布局,表明当余地较小时,径向布局对视线偏离更为敏感。因此,当注视选择区域中心至关重要时,单独使用视线光标的效果有限。

5.3 视觉前馈的适当使用
在使用Voronoi镶嵌法扩展选择区域时,选择视觉前馈时应考虑预期提高的选择准确性和视觉干扰的程度。在我们测试的设置中,通常通过结合可视化选择区域(或其中心)和显示视线光标的前馈方法来实现最高的选择准确性。然而,这种组合也增加了视觉干扰,研究2证实一些参与者更喜欢没有视线光标的条件。因此,当需要高精度选择时,特别是在高密度环境中,我们推荐这种组合方法。尽管可视化选择区域或其中心在相似程度上提高了选择准确性,但不同条件下的视觉干扰类型有所不同。参与者的评论表明,可视化选择区域中心不太受欢迎,因为文本标签和图标会分散注意力。此外,一些参与者报告在单元格条件下出现了视觉杂乱。应尽可能减少视觉噪声;因此,应考虑离散的前馈方法[Guillon等人 2015],例如仅可视化当前注视对象的选择区域。尽管这种方法可能会增加选择时间,但它可能更实用,因为它减少了用户界面的杂乱。虽然在高密度环境中视线光标的好处有限,但在其他情况下,它以最小的额外视觉干扰提高了选择准确性。Bubble条件是唯一一种光标形状会连续变化的类型,而其他前馈条件的形式是静态的。尽管如此,我们的结果表明,Bubble的优势主要来自于可视化视线位置,而不是其动态形状。因为气泡光标可以动态扩展(在我们的设置中达到截止半径),它们可能会变得过于显眼并分散注意力,这反映了前馈显眼性和用户界面杂乱之间的权衡。因此,我们建议使用简单的点光标。此外,与可视化选择区域或其中心相比,视线光标通常产生的计算开销更低,因为它们不需要计算或渲染选择区域的轮廓。这使它们适合需要轻量级处理或在计算资源有限的系统上运行的系统。

5.4 限制
本研究有几个限制。首先,与参与者的人口统计特征有关。大多数参与者在二十岁出头,性别分布不平衡(42人中有32人为男性)。在研究1中,参与者主要来自我们的VR/MR研究实验室,这可能限制了研究结果的普遍性。此外,研究1中有一半的参与者(18人中有9人)有基于视线的界面的使用经验,这一比例明显高于研究2(24人中有4人)。这种先前的经验可能影响了表现,并可能部分解释了研究1中观察到的错误率低于研究2的原因。其次,本研究仅关注目标和选择区域中心不对齐的情况,没有考察它们重合的情况。第三,只研究了两种布局类型——交叉布局和径向布局。第四,视觉前馈仅在简单的对象选择任务中进行了评估;因此,它对于选择复杂形状对象的有效性以及视觉杂乱的潜在影响仍不清楚。最后,本研究采用了参与者内设计,这可能由于参与者对选择区域形状或中心位置的先验知识而引入了携带效应,可能影响了结果。

6 结论
在这项研究中,我们调查了在使用Voronoi镶嵌法扩展选择区域时,视觉前馈是否可以增强基于视线的界面的选择性能。结果表明,可视化选择区域或其中心引导用户的注视点向选择区域中心移动,从而提高了选择准确性。此外,显示视线光标进一步提高了选择准确性,最有效的前馈方法将错误率降低了多达75.8%。这些发现强调了适当视觉前馈设计的重要性,并突出了在开发基于视线的交互技术时考虑目标视觉空间质心的作用。

致谢
这项工作部分得到了JSPS KAKENHI资助,项目编号为24K21319和25K24403。

生物通微信公众号
微信
新浪微博


生物通 版权所有