基于泰国人群下颌骨三维形态测量学的性别推断:一种结合独立模型验证的比较机器学习方法

时间:2026年5月25日
来源:Translational Research in Anatomy

编辑推荐:

背景:在法医人类学案例工作中,下颌骨因其保存潜力及可测量的性二态性,成为当主要诊断骨骼缺失时实用的骨骼元素。材料与方法:研究人员共纳入260例泰国东北部成人骨骼标本(男130例,女130例),来自孔敬大学人类骨骼仓库研究单元。通过结构化光三维表面扫描获取7项标

广告
   X   

背景:在法医人类学案例工作中,下颌骨因其保存潜力及可测量的性二态性,成为当主要诊断骨骼缺失时实用的骨骼元素。材料与方法:研究人员共纳入260例泰国东北部成人骨骼标本(男130例,女130例),来自孔敬大学人类骨骼仓库研究单元。通过结构化光三维表面扫描获取7项标准化下颌骨测量指标,随机分为训练集(n=200)与独立预留测试集(n=60)。采用三种机器学习分类器——支持向量机(Support Vector Machine, SVM)、随机森林(Random Forest, RF)和神经网络(Neural Network, NN),通过10折分层交叉验证训练,并以分类准确率(Classification Accuracy, CA)、F1值、精确率、召回率、马修斯相关系数(Matthews Correlation Coefficient, MCC)及受试者工作特征曲线下面积(Area Under the Curve, AUC)进行评估。结果:所有7项测量指标均表现出统计学显著的性二态性(p<0.01),其中颏宽(bigonal width)、双髁宽(bicondylar breadth)与双冠突宽(bicoronoid breadth)区分能力最强。交叉验证中,RF取得最高CA(81.5%,MCC=0.630),SVM取得最高AUC(0.860)。在独立验证中,NN表现最优(CA=86.7%,AUC=0.938),且三模型性能均维持或优于训练集,初步表明模型具有良好的泛化性且无过拟合迹象。结论:所训练的模型可作为适用于泰国东北部骨骼材料的性别推断工具,为法医人类学实践提供了人群特异性参考数据及多算法机器学习框架。
该研究发表于《Translational Research in Anatomy》,聚焦于法医人类学中的骨骼性别推断难题。在法医学实践中,构建个体生物档案的首要环节是准确判定生物学性别,这能将潜在匹配池缩减约50%,显著提升身份识别效率。传统上,骨盆和颅骨因性二态性显著而被优先选用,但在实际案件特别是腐败或残缺案件中,这些部位往往难以保全。相比之下,下颌骨由致密皮质骨构成,在各种埋藏环境下具有较高的保存率,且其解剖标志明确,便于标准化测量,成为理想的替代骨骼。然而,传统的判别函数分析(Discriminant Function Analysis, DFA)依赖于多元正态性和方差齐性等假设,这在具有连续形态变异和性别重叠分布的生物数据中往往难以满足,可能限制分类性能。为此,研究人员引入机器学习(Machine Learning, ML)算法,这类算法无需严格的数据分布假设,并能有效建模多维特征空间中的复杂非线性关系,特别适用于性二态性并非线性可分的骨骼数据。
研究人员开展了一项针对泰国东北部人群的下颌骨三维形态测量学与机器学习结合的研究。研究共纳入260例成人骨骼标本(男女各半),所有标本均来源于孔敬大学人类骨骼仓库研究单元,且排除了骨折、病变及严重结构退变样本。数据采集采用结构化光三维扫描技术,提取了7项标准化的下颌骨测量指标,包括颏高(chin height)、颏宽(bigonal width)、双髁宽(bicondylar breadth)、双冠突宽(bicoronoid breadth)、最小支宽度(minimum ramus breadth)、最大支宽度(maximum ramus breadth)及下颌角(gonial angle)。样本被随机分配为训练集(n=200)和独立预留测试集(n=60)。研究人员采用三种不同的机器学习范式进行建模:代表最大间隔分类的支持向量机(SVM)、集成树学习的随机森林(RF)以及基于神经网络的NN。模型训练采用10折分层交叉验证,并通过z-score标准化处理特征变量。性能评估指标涵盖分类准确率(CA)、F1值、精确率、召回率、马修斯相关系数(MCC)及受试者工作特征曲线下面积(AUC)。
研究结果
测量可靠性与性二态性:组内和组间测量误差分析显示,所有7项指标的相对技术误差(rTEM)均低于2.5%,可靠性系数(R)均高于0.95,符合骨测量学标准。统计分析表明,所有指标均存在显著性别差异(p<0.01)。除下颌角(M7)女性大于男性外,其余6项指标均为男性大于女性。效应量(Cohen's d)分析显示,颏宽(M2)、双髁宽(M3)和双冠突宽(M4)表现出最大的性二态性(d≥0.80),特征重要性排序也证实这三项指标最具判别力。
训练集分类性能:在10折交叉验证中,随机森林(RF)取得了最高的综合分类性能,分类准确率达81.5%,MCC为0.630;支持向量机(SVM)则表现出最高的AUC(0.860),显示出优异的类别区分能力;神经网络(NN)在训练集中表现相对较低。
独立预留验证:在完全独立于训练集的60例样本中,所有模型均保持了良好的性能。值得注意的是,神经网络(NN)在独立测试中表现最佳,分类准确率达到86.7%,AUC高达0.938。所有模型在独立测试中的表现均未下降,甚至有所提升,且未观察到过拟合现象,证明了模型的泛化能力。
讨论与结论
研究人员在讨论中指出,三种算法在独立测试中的一致表现,强有力地证明了下颌骨形态中存在真实的性二态性,而非算法伪影。尽管训练集样本多为老年个体,模型在独立验证中依然表现稳健,但需注意牙槽区域指标(如M1)可能受年龄相关的牙齿脱落影响。与既往基于判别函数分析(DFA)的研究相比,本研究的机器学习模型准确率处于70%至90%的主流区间内,验证了该方法的有效性。
研究结论认为,基于泰国东北部人群下颌骨三维形态测量学的性别推断是可行且准确的。颏宽(M2)、双髁宽(M3)和双冠突宽(M4)被确定为最具判别力的核心指标。随机森林(RF)在训练中表现最优,而支持向量机(SVM)在区分能力上表现突出。所有模型在独立验证中均表现出色且无过拟合。最终,研究人员构建了可直接部署的保存模型,其功能类似于传统的判别函数方程,为泰国东北部法医人类学案件提供了可靠、可重复且具有人群特异性的性别推断工具。

生物通微信公众号
微信
新浪微博


生物通 版权所有