多方向像素阵列计算技术在注视估计中用于高效实现瞳孔定位

时间:2025年11月14日
来源:IEEE Transactions on Emerging Topics in Computational Intelligence

编辑推荐:

基于多方向像素阵列计算的瞳孔定位方法在BioID数据集上实现60帧/秒的实时定位精度,通过旋转变换与像素阵列旋转相似性指数优化策略有效提升定位鲁棒性,并作为轻量级模块集成到注视估计模型中。

广告
   X   

摘要:

精确的瞳孔定位是眼球追踪中的一个关键要求,它可以用来提升人机交互的性能。由于实际场景的复杂性以及计算所需的实时性和准确性,实现具有鲁棒性和实时性的精确瞳孔定位仍然是一项具有挑战性的模式识别任务。本研究提出了一种基于多方向像素阵列计算(MPAC)的新瞳孔定位方法,并结合了几种优化策略,包括旋转变换和像素阵列旋转相似性指数。这些策略分别通过调节像素阵列分布和微调初始定位来进一步提高定位精度。为了应用于眼球追踪,所提出的瞳孔定位方法被封装为一个轻量级模块,并集成到眼球追踪模型中。为了评估所提出方法的准确性和实时性能,并将其与现有的方法进行比较,在BioID基准数据集上进行了实验。此外,还进行了眼球追踪模型的训练和测试实验,以验证瞳孔定位模块在提升眼球追踪性能方面的贡献。实验结果表明,所提出的鲁棒且高效的瞳孔定位方法能够达到与现有无学习方法相当的性能。该方法计算复杂度较低,在BioID基准数据集上几乎可以实现实时瞳孔定位,每秒处理约60帧图像。此外,所提出的瞳孔定位方法还可以被封装为一个可调用模块,以提高眼球追踪模型的测试准确性。

引言

人眼的形态和注视行为包含了丰富的情绪和意图信息。瞳孔是注视行为中传递意图信息的主要结构[1]、[2]、[3]。精确可靠的瞳孔定位是眼球追踪中的一个关键要求,它可以用来提升人机交互的性能[4]、[5]、[6]。

生物通微信公众号
微信
新浪微博


生物通 版权所有