编辑推荐:
为解决癌症细胞模型蛋白质组学数据碎片化问题,研究人员开展跨54种癌细胞系的多维蛋白质组学研究,整合质谱(MS)和反相蛋白质芯片(RPPA)技术,系统解析总蛋白质组、磷酸化修饰(phosphoproteome)和糖基化修饰(glycoproteome)特征,发现组织特异性激酶活性模式及潜在治疗脆弱性,为精准肿瘤学提供多组学资源。
癌症作为全球重大健康威胁,其分子机制的深入研究依赖于可靠的实验模型。人类癌细胞系长期以来是生物医学研究的关键工具,然而传统的基因组学和转录组学分析难以全面捕捉蛋白质层面的功能调控信息。蛋白质不仅是生命功能的直接执行者,其翻译后修饰(Post-Translational Modifications, PTMs)如磷酸化和糖基化,更在细胞信号转导、肿瘤发生发展中扮演核心角色。尽管已有研究如癌症细胞系百科全书(CCLE)和美国国家癌症研究所的NCI-60细胞系集合提供了部分蛋白质组数据,但多数工作局限于总蛋白质组分析,缺乏对PTMs的系统性刻画,且不同蛋白质组学技术平台(如质谱MS与反相蛋白质芯片RPPA)之间的数据整合与比较不足,限制了多维度生物学洞见的发掘。
为了填补这一空白,由Tsinghua University和The Hong Kong University of Science and Technology (Guangzhou)等单位的研究人员Wenhao Shi, Tianlong He, Nan Wang等合作,在《iScience》上发表了题为“Integrated multi-dimensional comparison of proteomic profiles across 54 cancer cell lines”的研究论文。该研究通过对54种常用人类癌细胞系进行多层次蛋白质组学分析,结合质谱(MS)和反相蛋白质芯片(RPPA)两种主流技术,全面绘制了总蛋白质组、磷酸化蛋白质组和糖基化蛋白质组的表达图谱,揭示了细胞系特异的激酶活性和信号网络特征,为癌症生物学研究和治疗靶点发现提供了宝贵资源。
研究团队运用了以下关键技术方法:采用54种源自不同组织的癌细胞系(包括乳腺、胃食管、淋巴、肺等);通过液相色谱-串联质谱(LC-MS/MS)进行全局蛋白质组、磷酸化肽段(使用IMAC富集)和糖基化肽段分析;利用RPPA技术针对305个药物相关蛋白及磷酸化靶点进行抗体芯片检测;应用生物信息学工具(MaxQuant、Byonic、KSEAapp等)进行数据整合、功能注释和激酶活性推断。
研究结果首先通过“Overview of the study”展示了数据质量和广度:MS技术共鉴定到10,088种蛋白质、33,161个磷酸化位点(涉及7,469种磷酸化蛋白)和56,320位点特异性糖型(覆盖5,966种糖蛋白),RPPA则检测了305个蛋白靶点。主成分分析(PCA)显示蛋白质表达和磷酸化模式具有组织来源依赖性,且技术重复性高(CV<20%)。热图和差异表达分析识别出292个组织特异性标志蛋白,如淋巴系中高表达的HLA-DRB1、CD74等,与已知癌症生物学一致。
“Phosphoproteomics revealed phosphorylation dynamics of cancer cell lines”部分深入探讨了磷酸化修饰的生物学意义:磷酸化类型分布(Ser/Thr/Tyr)与数据库记录一致,且通过整合蛋白表达与磷酸化水平筛选出细胞系特异激活的激酶,如慢性粒细胞白血病系SPI-801中ABL1、卵巢癌OVCAR-3中AKT2、胃癌KATOIII/SNU-16中FGFR2的显著激活。研究发现弥漫大B细胞淋巴瘤系Pfeiffer中LYN激酶高表达与磷酸化,且基因依赖性评分提示其可能比BTK更具靶向价值;肺腺癌HCC-827中NRK激酶的激活则提示了EGFR/c-Met信号的新调控机制。激酶-底物富集分析(KSEA)进一步揭示了细胞系特异的激酶活性模式,如Pfeiffer系中CDK6底物高磷酸化、胃癌SNU-16和肝癌HepG2中CSNK2A1(CK2)的过表达。MS与RPPA在激酶检测上呈现互补性:MS覆盖更广(216激酶),RPPA则对酪氨酸激酶家族(TK)有更高灵敏度。拷贝数变异(CNA)分析显示顺式调控对蛋白表达影响广泛,而磷酸化与CNA的关联更局部化(如5p/6q染色体)。磷酸化与总蛋白水平的相关性分析表明,多数位点呈正相关(r>0.6),但部分位点无关联或负相关,提示磷酸化调控的独立性。
“Glycoproteome landscape of cancer cell lines”刻画了糖基化修饰的异质性:49.72%糖型含唾液酸,25.11%为高甘露糖型,25.16%含岩藻糖。功能富集显示肉瘤和淋巴瘤细胞系共同富集液泡腔相关通路。糖基化位点仅36.6%在多数细胞系中稳定检测,且上皮来源细胞系(如HCC-827、NCI-H460)糖蛋白丰度更高。表皮生长因子受体(EGFR)的多糖基化位点(如N361、N352、N528)被详细解析,提示这些修饰可能影响其结构与功能。
“Comparison of mass spectrometry and reverse-phase protein array proteomics data”对比了两种技术平台:MS与RPPA组内相关性高(0.85-0.95),但磷酸化数据的组间相关性较低。MS漏检了RPPA面板中8.2%的蛋白,但两平台在蛋白识别上高度重叠(91.8%共同检测)。功能分类上,MS偏好钙黏蛋白结合相关蛋白,RPPA则更多检测丝/苏氨酸激酶活性。定量比较显示90%蛋白呈正相关(中位r=0.6),且折叠变化(fold-change)相关性达0.79,表明两者在捕捉生物学差异方面具有良好一致性。
研究结论与讨论部分强调,该工作首次在54种癌细胞系中整合了总蛋白质组、磷酸化组和糖基化组的多维数据,揭示了PTMs在癌症信号调控中的关键作用。研究发现不仅验证了已知激酶靶点(如ABL1、AKT2),还发掘了新的背景依赖性激酶激活事件(如LYN、NRK),为精准治疗提供了新思路。MS与RPPA技术的互补性(MS广度 vs RPPA灵敏度和标准化)增强了数据的可靠性,而糖基化异质性分析则为癌症生物标志物发现提供了新维度。该资源有助于科研社区优化模型选择、探索信号通路机制和识别治疗脆弱性,推动蛋白质组学驱动的癌症研究。研究局限性包括DDA模式的数据缺失、糖肽富集方法对某些糖型的偏好、细胞系数量限制异质性表征等,未来可通过扩大样本量、结合多组学数据和功能验证加以完善。
生物通 版权所有