在数字时代海量数据产生的背景下,对能够高效、可扩展处理信息的计算范式需求日益迫切。DNA分子计算凭借其固有的生物相容性和可编程性,不仅作为传统硅基计算的替代方案,更成为直接在生物样本中分析多种生物标志物的强大生物计算工具。然而,现有的连接主义模型(如人工神经网络)通常作为计算“黑箱”运行,其决策过程可解释性有限,这限制了其在医疗诊断等需要高可解释性场景的实际应用。相比之下,基于决策树的算法通过明确的IF-THEN规则语句和可追溯的决策路径提供可解释的决策,但该算法在DNA计算范式中仍未得到充分探索。以往的酶辅助或无酶逻辑门方法间接映射决策树规则,牺牲了可解释性和可扩展性,并且无酶系统存在信号泄漏和衰减问题,使得电路组成精细且深度受限(通常不超过6层)。此外,模仿电子学布尔范式的DNA计算设备存在巨大的内存成本,即使基本操作也需要大量不同的DNA链。因此,迫切需要一种能够以可扩展且内存高效的方式直接实现决策树计算的DNA计算系统。为了解决上述挑战,研究人员在《Nature Communications》上发表了题为“Interpretable molecular decision-making with DNA-based scalable and memory-efficient tree computation”的研究论文。该研究开发了一种无酶DNA计算系统,通过将决策规则符号化地表示并在可编程、模块化、可扩展的基于DNA的决策树中实现,以可解释的方式完成多样化的决策任务。研究人员主要运用了几项关键技术方法:首先,设计了模块化的DNA分子编码决策节点,通过抗泄漏的熵驱动链置换反应级联实现树遍历;其次,开发了独特趾介导特异性节点激活(UTMSNA)策略,确保同一决策树内或不同树间节点的正交性操作,为构建随机森林(RF)分类器奠定基础;再者,利用分子倒位探针(MIP)和连接酶介导的探针环化反应(LPCR)进行DNA甲基化传感,将甲基化水平(如β值)转化为分子指令;此外,设计了模拟-数字转换器,将环化探针转化为代表不同甲基化阶段的单链DNA指示剂;最后,通过荧光动力学实验在96孔板中实时监测树遍历过程,并对数据进行标准化处理以量化输出链浓度。研究还使用了来自NCBI GEO数据库的DNA甲基化芯片数据集(如GSE108124、GSE218549)来训练随机森林和决策树模型。