理解选择建模者的决策过程

时间：2025年8月27日

来源：Journal of Choice Modelling

编辑推荐：

本研究开发了离散选择建模严肃游戏（DCM-SG），通过跟踪40名参与者的决策过程，分析其模型构建、工具使用及结果差异。研究发现，多数参与者偏好简单模型（如MNL），数据可视化与模型比较工具使用频繁，但未充分探索复杂因素（如非线性变换、协变量交互）。研究提出基于流程的透明化改进建议，并开源了DCM-SG代码。

选择建模（Discrete Choice Modelling, DCM）是一种广泛应用于多个科学领域的框架，旨在理解人类在面对不同选项时的行为选择过程。无论是交通、健康还是环境经济学，DCM都为研究个体如何在有限信息下做出决策提供了重要的工具。选择建模的过程既复杂又具有一定的主观性，它涉及到一系列的步骤，包括数据探索、模型设定、参数估计、结果解释和报告撰写。由于这些步骤的灵活性，模型的最终结果和结论往往存在较大的差异，甚至在相同的数据集上也可能产生截然不同的分析路径。这种多样性虽然反映了建模者的专业技能和经验，但也可能带来一定的不确定性，尤其是在缺乏足够时间和资源的情况下。

为了解决这一问题，本研究引入了一种创新的方法——离散选择建模严肃游戏（Discrete Choice Modelling Serious Game, DCM-SG）。DCM-SG是一种模拟选择建模过程的工具，通过追踪参与者在游戏中的行为，揭示他们如何构建和优化模型。在本研究中，参与者被要求开发模型以估计减少噪音污染的意愿支付（Willingness-to-Pay, WTP）值。他们需要在游戏环境中处理数据、选择模型、进行参数估计和结果分析。这种模拟环境为研究者提供了一个观察建模者行为模式的机会，同时也为改进选择建模实践提供了新的视角。

本研究的主要目标是揭示选择建模过程中的行为模式，以及这些模式如何影响最终的建模结果。为了实现这一目标，我们对40名参与者进行了实验，其中大多数拥有超过五年的建模经验。通过跟踪他们的操作，我们发现参与者普遍倾向于使用数据可视化工具和简单的模型设定（如多项Logit模型），同时在尝试更复杂的模型设定时表现出一定的犹豫。这些发现表明，在时间或资源有限的情况下，建模者可能未能充分探索诸如协变量、非线性关系和复杂设定等关键因素，从而影响了模型的准确性和解释力。

研究还发现，那些在数据探索和模型比较过程中更加深入的参与者，通常能够获得更好的模型拟合效果和更简洁的模型结构。这表明，模型设定的复杂性和对数据的深入分析在提升模型性能方面起着至关重要的作用。通过分析参与者在游戏中的行为，我们能够识别出不同建模策略之间的差异，并探讨这些策略如何影响最终的模型选择和结果解释。

此外，本研究引入了一种方法论上的创新，即利用数据追踪和顺序模式挖掘技术，分析建模者在游戏中的操作序列。这种方法不仅可以揭示建模过程中的行为模式，还可以提供关于建模者如何选择和优化模型的深入见解。通过这种分析，我们发现参与者在设定模型时，往往优先考虑数据的可视化和基本统计分析，而较少关注更复杂的模型设定，如随机参数的分布和非线性变换的应用。

本研究还强调了选择建模过程中主观因素的重要性。建模者在设定模型时，通常会结合理论假设、数据特征以及个人经验，这使得建模过程具有一定的灵活性和多样性。然而，这种灵活性也可能导致模型设定的不一致，从而影响研究结果的可比性和可靠性。因此，本研究通过DCM-SG提供了一个结构化的环境，使得建模者能够在可控条件下进行模型设定，并减少因主观判断而带来的不确定性。

在数据处理方面，参与者普遍使用数据可视化工具和统计描述方法，以更好地理解数据结构和分布。尽管这些工具在模型设定过程中提供了重要的支持，但研究也发现，参与者在处理缺失值时存在较大的差异。一些参与者选择删除缺失值，而另一些则尝试用均值、众数或中位数进行替换。这种做法的多样性反映了建模者在处理数据时的不同策略，同时也突显了在实际建模过程中，数据预处理环节的重要性。

模型设定阶段，参与者主要集中在多项Logit模型（MNL）和混合多项Logit模型（MMNL）上，而对潜在类别模型（Latent Class Model, LCM）的使用相对较少。尽管LCM在理论上能够更好地捕捉决策者的偏好异质性，但在实际应用中，许多参与者由于时间限制或对模型复杂性的顾虑，选择了更为简单的模型。这种偏好可能与建模者对模型设定的熟练程度有关，也可能是由于在实际研究中，更复杂的模型需要更多的计算资源和专业知识。

在模型评估和结果解释阶段，参与者普遍关注模型的拟合指标，如对数似然值、Akaike信息准则（AIC）和贝叶斯信息准则（BIC）。这些指标在评估模型的性能和复杂性方面起到了关键作用。然而，研究也发现，一些参与者在分析模型结果时，忽略了对参数显著性和经济意义的深入探讨，这可能影响了他们对模型性能的判断。因此，模型设定和结果解释之间的平衡对于获得可靠的研究结论至关重要。

本研究的结果表明，选择建模是一种高度依赖个人经验和专业知识的活动，同时也受到时间限制和资源可用性的影响。通过引入DCM-SG，我们能够更系统地分析建模者的决策过程，并揭示他们在不同阶段的行为模式。这些发现不仅有助于理解选择建模的复杂性，也为未来的建模实践提供了改进的方向。例如，通过提供更多的建模工具和更灵活的设定选项，可以帮助建模者更全面地探索数据，从而提高模型的准确性和可靠性。

总之，本研究通过DCM-SG提供了一个创新的平台，用于观察和分析选择建模过程中的行为模式。参与者在游戏中的操作不仅揭示了他们在设定模型时的偏好，也反映了他们在处理数据和优化模型时的不同策略。这些发现对于改进选择建模方法、提高模型的透明度和可重复性具有重要意义。未来的研究可以进一步扩展DCM-SG的功能，使其能够支持更复杂的模型设定，并鼓励建模者在设定模型时进行更全面的探索和分析。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部