今日动态
  • 生物通首页
  • 今日动态
  • 新技术专栏
  • 人才市场

生物通首页 > 今日动态 > 正文

临床研究中用于调整的自动化候选混杂因素识别方法:一种基于数据检索的增强生成技术

时间:2026年5月17日
来源:BioData Mining

编辑推荐:

摘要背景识别混杂变量对于进行可靠的观察性研究至关重要,然而传统的手动方法不仅耗时,而且具有主观性,给研究人员带来了困难。最近在检索增强生成(Retrieval-Augmented Generation, RAG)技术方面的进展为这一问题提供了解决方案,但大多数现有系统依赖于全文访

广告
   X   

摘要

背景

识别混杂变量对于进行可靠的观察性研究至关重要,然而传统的手动方法不仅耗时,而且具有主观性,给研究人员带来了困难。最近在检索增强生成(Retrieval-Augmented Generation, RAG)技术方面的进展为这一问题提供了解决方案,但大多数现有系统依赖于全文访问、云托管的API或手动策划的知识图谱,这引发了关于隐私、版权和计算成本的担忧,并使得本地部署变得困难。

目的

本研究开发并评估了一种启发式工具,用于确定观察性研究中需要调整的潜在混杂变量。通过使用本地部署的、仅基于摘要的RAG架构,该工具能够从医学摘要的PICO(人群、干预措施、比较对象、结果)查询中生成一份可追踪的潜在混杂变量候选列表。

方法

我们实现了一个三阶段的架构来识别潜在混杂变量。该流程部署在一个一体化的本地服务器上,并使用1000个由专家策划的、涵盖20个临床专业的PICO查询进行了评估。性能从四个维度进行了评估:内部一致性、输出量、效率以及临床接受度,并与仅基于图谱的SemMedDB基线进行了比较。

结果

在多次运行中,该流程显示出较高的内部一致性(潜在混杂变量列表一致性为94.6%±8.7%;PMID集合一致性为79.4%±23.5%)。它建议每个查询平均识别出6个潜在混杂变量(四分位数范围为8个),并检索到平均33个独特的PMID(四分位数范围为7个)。平均处理时间为44.50秒(四分位数范围为31.72秒)。专家评审的总体临床接受率为87.12%。

结论

作为一种探索性方法,本地部署的、仅基于摘要的RAG工作流程可以生成具有临床可解释性和可追踪性的潜在混杂变量建议,以支持早期观察性研究的设计,特别是在存在隐私限制或无法完全访问全文和云资源的情境下。

试验注册

不适用。

背景

识别混杂变量对于进行可靠的观察性研究至关重要,然而传统的手动方法不仅耗时,而且具有主观性,给研究人员带来了困难。最近在检索增强生成(Retrieval-Augmented Generation, RAG)技术方面的进展为这一问题提供了解决方案,但大多数现有系统依赖于全文访问、云托管的API或手动策划的知识图谱,这引发了关于隐私、版权和计算成本的担忧,并使得本地部署变得困难。

目的

本研究开发并评估了一种启发式工具,用于确定观察性研究中需要调整的潜在混杂变量。通过使用本地部署的、仅基于摘要的RAG架构,该工具能够从医学摘要的PICO(人群、干预措施、比较对象、结果)查询中生成一份可追踪的潜在混杂变量候选列表。

方法

我们实现了一个三阶段的架构来识别潜在混杂变量。该流程部署在一个一体化的本地服务器上,并使用1000个由专家策划的、涵盖20个临床专业的PICO查询进行了评估。性能从四个维度进行了评估:内部一致性、输出量、效率以及临床接受度,并与仅基于图谱的SemMedDB基线进行了比较。

结果

在多次运行中,该流程显示出较高的内部一致性(潜在混杂变量列表一致性为94.6%±8.7%;PMID集合一致性为79.4%±23.5%)。它建议每个查询平均识别出6个潜在混杂变量(四分位数范围为8个),并检索到平均33个独特的PMID(四分位数范围为7个)。平均处理时间为44.50秒(四分位数范围为31.72秒)。专家评审的总体临床接受率为87.12%。

结论

作为一种探索性方法,本地部署的、仅基于摘要的RAG工作流程可以生成具有临床可解释性和可追踪性的潜在混杂变量建议,以支持早期观察性研究的设计,特别是在存在隐私限制或无法完全访问全文和云资源的情境下。

试验注册

不适用。

First slide
引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>
First slide
揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>
First slide
对同一细胞中的转录组和表观基因组进行同时分析(使用细胞核分离试剂盒简化样本制备工作流程)>>
First slide
「大小鼠繁育与健康管理」指导海报,点击即可免费领取电子版或实体海报>>
Previous Next
热点排行
  • 1综述:从三维角度解析癌症:模型、机制及个性化治疗方案
  • 2综述:放射性核素-药物偶联物在肺癌中的应用:精准治疗领域的进展及其临床转化
  • 3综述:哺乳动物半乳糖凝集素家族的结构多样性、信号通路及疾病靶向治疗潜力
  • 4Cell:14种蛋白质标志物可提前五年预测肺癌风险
  • 5综述:诊断技术的进步——肺病学
  • 6整合基因组学和表观基因组学分析揭示了多发性骨髓瘤疾病进展及多重耐药性中的表观遗传可塑性 开放获取
  • 7在阿尔茨海默病中,作为神经退行性病变的预测指标,“tau范围”(tau extent)的表现优于“tau负荷”(tau load)
  • 8通过脊髓硬膜下AAV9-GAD65/VGAT载体治疗脊柱损伤引起的肌肉痉挛:在大鼠、猪和非人灵长类动物中的疗效与安全性研究
  • 9经过治疗性细菌训练的自然杀伤(NK)细胞能够提供长期的防癌转移保护作用
  • 10AAV(腺相关病毒)介导的FGF21基因疗法通过全身组织特异性适应性反应延长了健康寿命
生物通微信公众号
生物通新浪微博
在线客服
微信
新浪微博
我要投稿

返回顶部


生物通 版权所有

订阅Biohot解锁原文链接索取