编辑推荐:
本研究针对在线赌博问题赌博风险识别的实际需求,利用机器学习算法分析1,611名真实世界在线赌博者(涵盖彩票、赌场、宾果和体育博彩玩家)的30天行为追踪数据与问题赌博严重指数(PGSI)自我报告结果。研究发现,仅参与彩票游戏与较低问题赌博风险相关(12%),而赌场(18%)、宾果(20%)游戏参与者的风险显著更高。逻辑回归和随机森林模型预测性能最佳(AUC=0.789/0.776),行为特征(如单次会话平均存款次数、日均投注额)比货币变量更具预测力。该研究为赌博运营商基于行为数据实施早期干预提供了重要实证依据。
在数字技术飞速发展的今天,动动手指就能参与的在线赌博已经渗透到日常生活,这种便利性在带来巨大市场规模的同时,也埋下了问题赌博的隐患。欧洲博彩和博彩协会的数据显示,2022年在线赌博总收入高达382亿欧元,占全球市场的35%,且增长势头强劲。然而,隐藏在繁荣背后的赌博相关问题——如成瘾、财务危机和心理健康问题——也日益凸显,如何在海量玩家中精准识别出高风险个体,成为监管部门和赌博运营商面临的巨大挑战。
传统的问题赌博识别多依赖自我报告量表,但这种方式存在滞后性和主观偏差。幸运的是,在线赌博平台详细记录着每位玩家的行为轨迹,这为利用数据驱动方法进行早期风险预测提供了可能。《International Journal of Mental Health and Addiction》近期发表的一项研究,正是利用机器学习这把“利器”,对真实世界在线赌博行为进行深度挖掘,探索能否通过玩家的行为模式“预测”其自我报告的问题赌博状态。
为了回答这个关键问题,研究人员开展了一项基于1,611名北美在线赌博平台真实玩家的实证研究。这些玩家在参与研究前的30天内至少进行过一次投注,并完成了国际通用的“问题赌博严重指数”(PGSI)量表。研究团队收集了玩家的人口统计学信息(年龄、性别)以及详尽的30天行为追踪数据,包括投注金额、存款次数、会话时长、参与游戏类型(彩票、赌场、宾果、体育博彩)等23项特征。通过严谨的数据清洗(如排除在一分钟内完成PGSI的玩家以保障数据质量),研究团队运用了逻辑回归、决策树、随机森林、支持向量机和梯度提升机五种机器学习算法来构建预测模型,并以曲线下面积(AUC)、精确度、召回率等指标评估模型性能。
研究结果揭示了一系列有趣且重要的发现。首先,不同游戏类型与问题赌博风险存在显著关联。参与彩票游戏的玩家问题赌博比例为12%,而不玩彩票的玩家这一比例升至19%。相反,参与赌场游戏的问题赌博比例为18%(不参与者为8%),宾果游戏为20%(不参与者为12%)。这表明,彩票可能是一种风险相对较低的赌博形式,而赌场、宾果等游戏需要更高的风险关注。此外,参与的游戏种类越多,问题赌博风险也越高,参与一种、两种、三种和四种游戏类型的玩家中,问题赌博比例依次递增。
在预测模型方面,逻辑回归和随机森林模型表现最为出色,AUC分别达到0.789和0.776。一个关键的发现是,仅包含行为变量(如存款频率、会话时长、游戏类型参与)的模型,其预测效能与包含行为变量和货币变量(如投注金额、输赢金额)的完整模型无显著差异。这意味着,赌博强度和行为模式本身(例如单次会话内的平均存款次数、日均投注额)就是问题赌博强有力的预测指标,这有助于开发不依赖于敏感财务信息的风险评估工具。
通过对模型特征重要性的分析,研究人员识别出最关键的预测指标包括:单次会话平均存款次数、日均投注额、年龄、彩票投注金额占比、会话总时长等。值得注意的是,男性玩家的问题赌博风险是女性的2.18倍,年轻玩家风险也更高。
研究还特别关注了“高危害问题赌徒”(GHPG),即那些在PGSI量表中不仅总分≥8,并且在“是否觉得有赌博问题”、“赌博是否导致健康问题”和“赌博是否导致财务问题”这三个直接反映危害的条目上均回答“几乎总是”的玩家。这部分玩家占样本的4.6%,他们的行为模式(如更高的投注额、更长的会话时间、更高的赌场游戏参与度)比普通问题赌徒更为极端,进一步验证了行为指标与赌博危害严重程度之间的关联。
主要研究结果概述如下:
• 游戏类型与问题赌博风险关联分析 :通过比较参与不同游戏类型玩家的问题赌博发生率,证实赌场、宾果等游戏风险显著高于彩票。
• 行为变量与货币变量预测效能比较 :通过分层逻辑回归分析,发现行为变量已能充分解释问题赌博风险,货币变量未提供显著额外信息。
• 机器学习算法性能评估 :比较五种机器学习算法,确定逻辑回归和随机森林在预测自我报告问题赌博方面表现最优。
• 关键预测特征识别 :利用优势比(OR)和SHAP值分析,识别出性别、存款行为、游戏类型偏好、年龄等是预测问题赌博的最重要特征。
• 高危害问题赌徒特征分析 :通过界定GHPG亚组,发现其赌博行为强度(投注额、会话时长等)显著高于普通问题赌徒和非问题赌徒。
综上所述,本研究有力地证明了利用机器学习分析玩家行为追踪数据可以有效预测在线赌博中的问题赌博风险。研究结论强调,行为特征(尤其是存款模式和游戏参与类型)是识别高风险玩家的可靠指标。这一发现具有重要的现实意义:赌博运营商可以基于这些相对客观的行为数据,开发自动化风险监测系统,对识别出的高风险玩家及时采取干预措施,如推送个性化反馈、鼓励设置限额等,从而在赌博问题恶化前进行有效预防,推动负责任赌博实践的发展。尽管存在样本来源单一、样本量有限等局限性,但本研究为在不同文化和监管环境下应用数据驱动方法减轻赌博危害提供了有价值的证据和支持。
打赏