编辑推荐:
摘要健康信息学领域在追求个性化医疗方面一直面临着患者、临床医生以及资源限制所带来的诸多挑战。近年来,人工智能(AI)和机器学习(ML)模型的进步使得它们在个性化基因组研究中得到了广泛应用,这些模型在预测药物反应方面表现出色,从而为个性化医疗和定制疗法等众多应用提供了有力支持。尽管
健康信息学领域在追求个性化医疗方面一直面临着患者、临床医生以及资源限制所带来的诸多挑战。近年来,人工智能(AI)和机器学习(ML)模型的进步使得它们在个性化基因组研究中得到了广泛应用,这些模型在预测药物反应方面表现出色,从而为个性化医疗和定制疗法等众多应用提供了有力支持。尽管这些模型的使用日益广泛,但它们往往像“黑箱”一样运作,缺乏验证其预测结果是否真正由模型输入生成或事后被篡改的途径。为应对这些挑战,本研究提出了一种去中心化模型,该模型将AI预测建模与基于区块链的验证技术相结合,以确保AI生成结果的完整性、可追溯性、可信度和可重复性,从而实现可证明的机器学习和可靠的AI应用。我们开发的方案计算AI预测结果、模型输入的加密哈希值以及数据哈希值,并通过智能合约(SC)利用创新的输入-输出加密哈希技术将这些信息永久存储在区块链上。这一方案引入了一种确定性的标记化和规范化的哈希处理流程,将每个GDSC2药物-细胞系输入及其AI预测结果绑定到一个经过加密处理的、可在链上验证的记录中。随后,通过区块链的不可篡改性以及审计日志的交叉验证,任何利益相关者都可以独立确认某个特定预测结果确实来源于已知的模型和可靠的数据源,同时不会泄露敏感的基因组信息,从而确保审计的可验证性和真实性,有效解决AI模型被事后篡改的问题。使用GDSCv2数据集生成的基因组数据进行实验结果表明,该模型能够训练出随机森林回归器(RFR),实现高达0.979的R²值,用于精确预测药物敏感性。5折交叉验证的平均R²值为0.977±0.001,进一步证明了该模型的强大可靠性、鲁棒性和跨数据集的泛化能力。在获得患者同意的情况下,该模型还可以将这些预测结果存储在区块链上,以便进行验证或审计,检测篡改行为,确保透明度和可验证性。通过对数据集中10个样本进行的审计试验,验证了该模型在高达70%的程度上能够保持数据的完整性。这些发现支持了该模型在高风险个性化医疗和生物医学环境中的适用性,在这些环境中,可验证的AI预测结果至关重要。
生物通 版权所有