编辑推荐:
分子细胞生物学系Leeat Keren博士关于combplex的研究,这是一种人工智能辅助方法,可以同时对组织样本中的数十种蛋白质进行成像,为生物医学研究和临床诊断提供了一种新的、可扩展的工具
人工智能系统已经在生物医学科学的许多领域发挥了神奇的作用,帮助解决蛋白质结构问题,发现基因组中的隐藏模式,并处理大量生物数据。现在,魏茨曼科学研究所(Weizmann Institute of Science)开发了一项人工智能辅助技术,并在《自然生物技术》(Nature Biotechnology)上进行了描述,这项技术可能会为研究人员和医生提供一种前所未有的手段,通过在组织样本中同时观察到比以往更多的蛋白质,从而深入观察人体组织。
“要了解任何特定组织的工作原理,同时测量其大量蛋白质是至关重要的,”魏茨曼分子细胞生物系的Leeat Keren博士说,他是该研究小组的负责人。“这让我们了解了组织中存在哪些细胞,以及它们如何相互交流和相互作用。”
Keren解释说,这些知识对疾病过程的研究至关重要。例如,除了肿瘤细胞外,癌变的生长还包含各种其他类型的细胞,包括肿瘤生长的组织和免疫系统的健康细胞。肿瘤的细胞组成以及这些细胞类型如何相互作用可以决定治疗的有效性,或用于预测哪些患者预后较好,哪些患者可能发生转移。这些发现,反过来,可以导致改进的个性化治疗。
魏茨曼研究所的这项新技术被称为CombPlex,它为组织细胞组成的研究提供了一个重大飞跃。与传统方法一次只能从三到四种蛋白质中获取数据不同,CombPlex在其概念验证阶段已经展示了在单个细胞中同时成像和量化近二十几种蛋白质的能力,并有可能在未来将这种能力扩大到数百种蛋白质。这项技术不需要额外的仪器,使其易于使用。
在寻找一张照片
传统方法的局限性来自于光的光学特性。在过去的几十年里,用于标记蛋白质的荧光探针极大地推进了蛋白质研究,但是当同一组织样本中的几种蛋白质被不同颜色的探针标记时,类似玻璃纸的颜色可能会重叠,从而混淆显微镜图像。解决这个问题的一种方法是多次重复成像,每次洗掉现有的标签并放置新的标签。但是这种被称为循环荧光的方法非常耗时,而且它最终可能只能对至多几十种蛋白质进行成像——而人类基因组中大约2万个蛋白质编码基因可以产生无数种蛋白质。
“我们想开发一种成像方法,可以一次捕获更多的它们,这样我们就可以最终对它们进行成像,”Keren说。
她用一个拍照的比喻来描述她使命的本质。“想象一下,你想拍一张房间的快照,但一次只能拍三到四个物体,比如一开始只能拍桌子、椅子和电视屏幕。当你到达窗户、地毯和立灯时,你已经拍了几十张照片,然后需要把它们组合起来,才能得到一个房间的大致图像。”凯伦的目标是提供一种拍摄整个房间的方法,其中包含了所有物体,在一个镜头中。
读取重叠蛋白
Keren和她的团队决定依靠一种被称为组合方法的方法:通过在每个蛋白质上附加几个荧光标签来标记每个蛋白质,这样每个分子就可以通过荧光标签的独特组合来识别,从而产生各种条形码。
组合或条形码的优势在于,它们可以极大地增加由少量颜色标记的分子数量。如果你想成像,例如,七个不同的分子,它们可以只用三种颜色来标记,因为这三种颜色可以有很多可能的组合。随着标签的增加,潜在组合的数量呈指数增长,打开了更大的可能性调色板。但是,如果查看多个单独的探针很复杂,那么在查看多个条形码时,问题就会变得更加严重。随着条形码数量的增加,它们很快开始重叠,使得无法区分它们。
Keren和她的团队认为,人工智能或许能够解决条形码重叠这一看似棘手的问题。他们假设人工智能可以通过从组织图像中学习不同蛋白质的表达特性来做到这一点,因为有些蛋白质只由一种细胞表达,而另一些则由不同的细胞表达;有些在细胞表面表达,有些在细胞内表达;有些是普遍存在的,而另一些是罕见的。
“为了了解任何特定组织的工作原理,同时测量其大量蛋白质是至关重要的。”
令人惊讶的是,他们的预感被证明是正确的。与魏茨曼人工智能中心的Shai Bagon博士合作,Keren和她的学生团队——他们的背景从生物化学到生物信息学再到数学——开始设计一种可以同时测量多种蛋白质的实验方法,以及一种可以梳理含有大量蛋白质条形码的图像的人工智能算法。该团队训练了一个深度神经网络来解决将组合图像分解为单个蛋白质图像的挑战。该网络是在模拟数据上进行训练的,模拟数据是通过汇集世界各地实验室生产的大量单个蛋白质的荧光图像而产生的。
其结果是CombPlex,一种人工智能辅助成像方法,可以在单个细胞水平上准确测量组织样本中的多种蛋白质。它可以对人类观看者看起来像噩梦般的荧光纠缠的图像进行解压,将信号分类为单个蛋白质的图像。
由于CombPlex与广泛用于研究和临床的传统荧光显微镜兼容,它有望极大地促进生物医学和医学实验室的组织研究。除了提供更全面的组织图像外,它还可以在一两天内提供常规方法需要数周才能获得的蛋白质成像。
“我们希望有一天CombPlex能够取代常规的病理学方法,因为它提供了更全面的组织观察,并为临床决策提供了更精确的见解,”Keren说。
科学数据
理论上,CombPlex使研究人员能够仅使用n个标签捕获多达2n-1个蛋白质。这意味着3个标签可以捕获7个蛋白质;5个标签,31个蛋白;10个标签,1023个蛋白质,尽管现实生活中的挑战可以减少这些数字。在这项研究中,凯伦的团队能够使用条形码测量22种蛋白质,每种条形码包含5个不同的标签。
CombPlex的开发得到了Bina的指导和支持,Bina是Weizmann研究所的转化研究单位,负责识别具有应用潜力的早期项目。“当我们咨询该领域的专家时,他们都对这项技术非常热情,”比纳的负责人莎伦·法尔曼博士说。
High-dimensional imaging using combinatorial channel multiplexing and deep learning
生物通 版权所有