为了填补这一空白,一项发表在《Tropical Animal Health and Production》上的研究应运而生。研究人员选取了三种具有代表性的鸡基因型:代表慢速生长的马来西亚本地适应品种SAGA、代表中速生长的法国双用途品种Sasso,以及代表快速生长的全球主导商业肉鸡品种Cobb 500。研究从14日龄开始,在受控环境下对总共300只雄性雏鸡进行了为期4周的实验,每周记录其体重和六项形态测量指标(体长、体围、大腿长、胫骨长、小腿长、翅膀长),最终获得了2160条数据记录。
通过比较不同生长类型鸡种的模型误差条形图(见图2-图4)发现,GER consistently achieved the lowest RMSE and MAE(始终取得最低的RMSE和MAE),FFNN在训练阶段表现出可比的精度,DT表现中等,而SVM consistently the weakest(始终最弱)。雷达图(见图5-图7)进一步支持了这些结果,GER的R2值在所有品种中均排名最高。
统计检验(见表3)进一步证实,GER和FFNN在 all growth-rate categories(所有生长速率类别中)均显著优于SVM和DT(p < 0.001)。GER与FFNN之间的性能差距在中速和快速生长组中并不显著。
5. 赤池信息量准则(AIC)结果
AIC分析(见表4)为模型效率提供了额外证据。GER在所有品种和训练/测试阶段均 consistently shows the lowest AIC value(始终显示最低的AIC值),表明它在取得高精度的同时,模型结构最为简洁高效(仅13个参数)。FFNN虽然训练R2高,但因模型复杂而被AIC严重惩罚。
结论与讨论
本研究的核心结论是,在用于预测不同生长速率鸡种体重的四种机器学习模型中,高斯指数回归(GER) consistently performed better than other models, exhibiting the highest accuracy and lowest errors(始终优于其他模型,展现出最高的准确度和最低的误差),被证明是最准确、最普适且最有效的模型。前馈神经网络(FFNN)对于慢速和中速生长品种表现良好,但对于快速生长的Cobb 500鸡种,其预测误差显著增加,显示出对高方差生长模式可能存在的过拟合风险。支持向量机(SVM)和决策树(DT)则 consistently had the poorest results, with higher errors and poor generalizability(始终结果最差,误差更高且普适性差)。
GER的优异表现归因于其数学结构与生物生长动力学的高度契合。作为一种参数回归方法,GER将因变量表达为自变量指数函数之和,这 naturally captures the nonlinear, saturating relationships characteristic of biological growth(自然地捕捉了生物生长特有的非线性、饱和性关系),从而能够以简约的模型精准表征整个生长轨迹,并最小化过拟合风险。相比之下,FFNN作为通用函数逼近器虽然强大,但其性能高度依赖于架构和数据量;SVM对核函数选择敏感,难以拟合平滑的生物生长曲线;而DT的 piecewise-constant structure(分段常数结构)本质上不适合对体重这样的连续过程进行平滑建模。