今日动态
  • 生物通首页
  • 今日动态
  • 新技术专栏
  • 人才市场

生物通首页 > 今日动态 > 正文

Spliceread:利用残差块和合成数据增强技术提升规范和非规范剪接位点预测的准确性

时间:2026年5月23日
来源:BMC Bioinformatics

编辑推荐:

摘要准确的剪接位点预测对于理解基因表达及其相关疾病至关重要。然而,大多数现有模型都偏向于常见的规范剪接位点,这限制了它们检测罕见但生物学上重要的非规范变异的能力。这些模型通常依赖于大型且不平衡的数据集,无法捕捉非规范剪接位点的序列多样性,从而导致较高的假阴性率。在这里,我们提出了

广告
   X   

摘要

准确的剪接位点预测对于理解基因表达及其相关疾病至关重要。然而,大多数现有模型都偏向于常见的规范剪接位点,这限制了它们检测罕见但生物学上重要的非规范变异的能力。这些模型通常依赖于大型且不平衡的数据集,无法捕捉非规范剪接位点的序列多样性,从而导致较高的假阴性率。在这里,我们提出了SpliceRead,这是一种新颖的深度学习模型,它通过结合残差卷积块和合成数据增强技术来改进规范和非规范剪接位点的分类。SpliceRead使用数据增强方法生成多样化的非规范序列,并利用残差连接来增强梯度流动并捕捉细微的基因组特征。在包含400个和600个核苷酸序列的多物种数据集上进行训练和测试后,SpliceRead在所有关键指标(包括F1分数、准确率、精确度和召回率)上均优于现有最先进模型。值得注意的是,它的非规范剪接位点误分类率显著低于基线方法。广泛的评估,包括交叉验证、跨物种测试和输入长度泛化,证实了其鲁棒性和适应性。我们进一步通过将该增强技术应用于其他最先进模型来评估其适应性,证明了其持续的改进和有效的泛化能力。SpliceRead为剪接位点预测提供了一个强大且可泛化的框架,特别是在具有挑战性的、低频序列场景中,并为模型生物和非模型生物中的更准确基因注释铺平了道路。SpliceRead的开源代码和详细文档可在https://github.com/OluwadareLab/SpliceRead获取。

准确的剪接位点预测对于理解基因表达及其相关疾病至关重要。然而,大多数现有模型都偏向于常见的规范剪接位点,这限制了它们检测罕见但生物学上重要的非规范变异的能力。这些模型通常依赖于大型且不平衡的数据集,无法捕捉非规范剪接位点的序列多样性,从而导致较高的假阴性率。在这里,我们提出了SpliceRead,这是一种新颖的深度学习模型,它通过结合残差卷积块和合成数据增强技术来改进规范和非规范剪接位点的分类。SpliceRead使用数据增强方法生成多样化的非规范序列,并利用残差连接来增强梯度流动并捕捉细微的基因组特征。在包含400个和600个核苷酸序列的多物种数据集上进行训练和测试后,SpliceRead在所有关键指标(包括F1分数、准确率、精确度和召回率)上均优于现有最先进模型。值得注意的是,它的非规范剪接位点误分类率显著低于基线方法。广泛的评估,包括交叉验证、跨物种测试和输入长度泛化,证实了其鲁棒性和适应性。我们进一步通过将该增强技术应用于其他最先进模型来评估其适应性,证明了其持续的改进和有效的泛化能力。SpliceRead为剪接位点预测提供了一个强大且可泛化的框架,特别是在具有挑战性的、低频序列场景中,并为模型生物和非模型生物中的更准确基因注释铺平了道路。SpliceRead的开源代码和详细文档可在https://github.com/OluwadareLab/SpliceRead获取。

First slide
引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>
First slide
揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>
First slide
对同一细胞中的转录组和表观基因组进行同时分析(使用细胞核分离试剂盒简化样本制备工作流程)>>
First slide
「大小鼠繁育与健康管理」指导海报,点击即可免费领取电子版或实体海报>>
Previous Next
热点排行
  • 1综述:免疫检查点阻断在黑色素瘤中的机制及临床应用
  • 2口服小分子GLP-1受体激动剂(oral small molecule GLP-1 receptor agonist) aleniglipron治疗超重或肥胖人群的随机、双盲、安慰剂对照2b期临床试验
  • 3通过药物手段重新调节病毒与肿瘤之间的相互作用,可以增强麻疹病毒在BRAF突变型结直肠癌模型中的抗肿瘤活性
  • 4综述:持续性炎症在围产期脑损伤后恢复失败中的作用:炎症消退就是治愈的关键吗?
  • 5SERPINE2介导的JAK2/STAT3激活促进了NRF2向细胞核的转运以及GCLC基因的转录,从而赋予肝细胞癌对铁死亡(ferroptosis)和乐伐替尼(lenvatinib)的耐药性
  • 6NOTCH3通过P62–ROS信号通路调控肌成纤维细胞向CAF(癌相关纤维)的分化,从而促进膀胱癌的进展
  • 7NSUN2/m5C/TPI1轴在乳腺癌中促进糖酵解和免疫逃逸
  • 8综述:多囊卵巢综合征(PCOS)中的肠道微生物群:关键的微生物变化、潜在机制及临床应用
  • 9星形胶质细胞特异性NRCAM基因缺陷会促进GABA能突触的修剪,从而加剧骨癌疼痛中的中枢敏化现象
  • 10高压氧疗法可改善慢性疲劳综合症(ME/CFS)患者的临床症状和功能能力,并调节丘脑的连接性:一项前瞻性队列研究
生物通微信公众号
生物通新浪微博
在线客服
微信
新浪微博
我要投稿

返回顶部


生物通 版权所有

订阅Biohot解锁原文链接索取