Cell分析解读||蛋白质组学寻找早期肺腺癌的异质性和标志物(下)
发布于 2021-09-27 19:16
很多人从不抽烟,但是还是会得肺癌。大多数研究肺癌的队列都纳入了吸烟人群,不吸烟人群又有哪些独特的特征? 这篇文章来自cell,去年发表。文章很长,而对蛋白质组学数据解读要看结果六和结果七。
上一篇我们说了结果六。蛋白质组学的角度,将肺癌人群分为三个亚型。
亚型1包括最大的群体,特征是:代表晚期肿瘤(分期超过II)、有内脏胸膜侵犯的肿瘤、TP53突变和最高的突变负荷;亚型2是一个较小的群体,由没有EGFR-L858R突变的早期患者(主要是IA和IB)组成;到了亚型3代表早期阶段(主要是IA阶段),无TP53突变。
今天我们说结果七--Protein Network Characterizationof Proteomic Subtypes Identify Candidate Biomarkers and Druggable Targets, 采用WGCNA分析。
WGCNA(Weighted correlation network analysis)你可能听说过。找过范例吗?这一篇文章的结果七,就是WGCNA的范例。
结果七提供了决定每个分子亚型的生物学特征的整体视角,而且还使潜在的药物靶点和生物标志物的选择更加合理。怎么做的呢?还是三步。分别是建网络、看网络特征、找靶点。
第一步:建WGCNA分析网络
WGCNA分析步骤如下:
首先,选工具和输入数据。使用RStudio中的WGCNA(Langfelder和Horvath,2008);使用的是至少80%的腺癌患者中量化的9072个蛋白质的中心化-log2T/N值。
然后,确认重要参数。根据无尺度拓扑模型拟合(R2=0.8),选择了power为5的软阈值。用 "cutreeDynamic "函数进行模块识别,使用 "树 "方法和minModuleSize=5。使用Perseus 1.6中的GOBP-slim、GOCC-slim、CORUM和KEGG术语,通过Fisher's exact检验进行模块的功能注释(Tyanova等,2016)。
最后,可视化以及网络修剪。蛋白网络在Cytoscape(Shannon等人,2003)中进行了可视化。为了简洁,研究者对网络进行了修剪,只保留了属于每个注释类别中富集最高的术语的蛋白,相关权重大于0.03的边(仅有正相关),源节点和靶节点的相互作用阈值为50。
研究者应用过滤来修剪输入,构建了一个由3014个节点和44665条边组成的网络(图7A;表S7A)。
图7A:由3,014个节点和44,665条边组成的蛋白质相关网络。节点根据模块成员身份用颜色编码。代表性的富集生物术语显示为不同的模块。
经过上述的分析,网络做好了。在这个蛋白质组的网络中, 有什么特征?
得结合亚型才能找到最有价值的信息。
第二步: 结合亚型看蛋白网络特征
网络特征通过以下几个方面:相关性、子网络功能、免疫细胞分析。
首先我们来看相关性。所有边的平均Pearson相关性为0.63,28%是已知的STRING相互作用,得分>0.4。
值得注意的是,RNA水平上的相关性值很低(中位数为0.19),即使是找已知的关联也低至中位数仅为0.25(图7B)。
图7B:(A)网络中显示的相互作用的成对蛋白质-蛋白质和RNA-RNA相关性的密度图。
而且,图7C也显示了RNA与蛋白的相关性,从颜色的分布会发现整体相关性不高。
图7C: 网络节点上的RNA-蛋白质相关性的叠加。
接下来我们看子网络功能。
目光仍然放在蛋白网络上。 使用模块eigengenes,确定了29个较小的子网络,我们上一篇说过,蛋白质组学的一致性聚类将肺癌人群分为三个亚型。
而在这里, 将每个蛋白质组亚型的相对蛋白丰度叠加在网络上寻找功能差异, 你会发现在三种蛋白质组亚型之间,不同的调节模式如下(图S7A):
从亚型3和2到亚型1(含晚期肿瘤),观察到蛋白酶体、细胞周期和内质网网络的富集逐渐增加。
亚型2具有独特的特征,过氧化物酶体、细胞连接、粘附、信号转导、氨基酰-tRNA生物合成、TRAPP复合体和染色质修饰网络的富集较高。
亚型3中,细胞因子介导的信号网络、纤毛膜、细胞粘附和细胞外基质组织、细胞连接和内吞作用富集较高。(图S7A中的网络17-21)。
图S7A:基于eigengene值的蛋白质组亚型之间具有不同调节的蛋白质网络(方差分析,FDR < 0.05)。
其中有两个子网络引起了他们注意:这两个子网络包括免疫细胞特异性蛋白,如转录因子IKZF1、IKZF3、NFATC1和NFATC2(图S7A中的网络25和26),并且在代表早期肿瘤的第3亚型中有较高的表达。
根据人类蛋白质组图数据库(图S7B),这两个模块都含有在B细胞、T细胞和自然杀伤(NK)细胞中高表达的蛋白(Kim等人,2014)。
图S7B:根据人类蛋白质组图数据库(https://www.humanproteomemap.org/),在网络#25和#26中发现的蛋白质的组织蛋白表达。
最后是免疫细胞分析。为了研究上面的观察结果,对所有组织的RNA-seq数据进行了CIBERSORT分析。结果发现, 肿瘤与NAT分离,大约一半的肿瘤中几种免疫细胞类型共存,有几个肿瘤呈现出低水平的免疫浸润(图S7C)。
图S7C:基于RNA-seq数据的CIBERSORT分析的免疫细胞剖析。热图显示了患者组织中Z-score转换后的绝对免疫细胞丰度。
蛋白网络和基于RNA的方法发现显著相关(图S7D),以此区分免疫细胞相关蛋白丰度高或低的患者(图S7E)。
图S7D-E :(D) T、B、NK细胞的平均z-coreCIBERSORT结果与免疫相关网络#25和#26的平均eigengene值的相关性图。(E)免疫细胞相关蛋白谱的聚类图。临床信息按免疫力高和低的队列进行聚类。重要的临床特征通过Fisher's exact test进一步计算。
有趣的是,位于肺部右侧的原发肿瘤患者与位于左侧的患者相比,呈现出更高的免疫表达(P =0.0379)。“Antigen processing and presentation”(MHC II类)在亚型3中也较高(网络27)。这个结果提示,免疫浸润是否与病人的结果或对免疫疗法的反应相关,还可以继续研究。
接下来就是找靶点。
第三步:找靶点
鉴于肿瘤微环境(TME)在肿瘤发生和发展中的重要作用,研究者进一步使用ESTIMATE算法(Yoshihara等人,2013年),利用RNA-seq数据来解读肿瘤中基质细胞的贡献。
为了确定潜在的蛋白质生物标志物用于TME的免疫组化验证,将患者分为基质得分高和低的两组(<第一和>第三四分位数),并计算出不同的蛋白质表达(图S7G)。
在排名靠前的蛋白质中,CILP在高基质组的丰度高出2.6倍(方差分析,p = 0.00396,图S7H)。
CILP蛋白平均31个肽,并被映射到与细胞外基质组织相关的模块,代表了一个有希望的基质细胞靶点候选分子,可使用免疫组化或基于质谱的检测方法进一步开发。
图S7G -H:(G) 利用肿瘤和正常邻近组织的量化归一化RNA读数,将患者分为高和低两组的基质评分(<第一和>第三四分位)。(H)高基质组和低基质组的CILP蛋白的log2T/N值差异(倍数变化=2.6,方差分析,P = 0.00396)。
另一方面, 为了确定潜在的药物靶点,根据药物基因相互作用数据库中的已知抑制剂(图7F;表S7D),对网络上所有可药用的蛋白质进行了注释。
做完注释,确定了一个由65个上调蛋白组成的小型子网络(中位数log2T/N>0.5),其中包括几个基质金属蛋白酶(MMP2、MMP11、MMP12和MMP14,图7F;表S7E),表明对matrisome有重大调控。
图7F: 网络中具有已知药物抑制剂的蛋白质节点(来源:DGIdb)用橙色突出显示。中位数log2T/N>0.5的可药用蛋白质子网络被放大。
聚焦matrisome调控蛋白,发现基底膜和ECM附属蛋白大多下调,而ECM调节分子,包括MMPs和Cathepsins,上调(图7G)。这些发现可能反映了肿瘤微环境(TME)的调节,其中MMPs是关键角色(Naba等人,2012)。
图7G:带有蛋白质类型注释的顶级差异调节母体蛋白质的热图。
MMP7、MMP11和MMP12在亚型1的晚期和晚期类中表现出最明显的上调(图7H)。有报道将MMPs作为治疗靶点(Merchant等人,2017)。
图7H :Boxplots说明了MMP2、MMP7、MMP11、MMP12和MMP14在不同精细分类中的丰度。中心线代表中位数,方框的边界代表第一和第三四分位数,上下须延伸到1.5×IQR内的最高或最小的值。
为了评估它们作为生物标志物可能性,在另一个有生存数据的117名早期患者的独立回顾性队列的肿瘤中,对选定的MMPs进行了免疫组化染色。结果显示,MMP11和MMP7的高表达与低生存率显著相关(图7I),提示其潜在的预后价值。
图7I:MMP11、MMP7和MMP2的免疫组织化学染色数据的Kaplan-Meier图。
再去看看这些分子的研究背景。MMP11以前被发现在NSCLC中高表达(Kettunen等,2004),而且最近被报道为一个关键的促肺癌基因(Yang等,2019);然而,它在进展过程中的蛋白水平调节从未被探索过。
综上所述,研究者提出MMP11是一个有潜力作为NSCLC早期检测和治疗的生物标志物的候选,待在更大的队列中进一步验证。
总结
WGCNA蛋白质网络, 不仅提供了决定每个分子亚型的生物学特征的整体特征,而且还使潜在的药物靶点和生物标志物的选择更加合理。
几种免疫细胞类型在肿瘤样本中共存,免疫细胞丰度不一,基质金属蛋白酶(MMP)在肺癌进展中发挥重要作用。
利用一个独立的回顾性队列,提示基质金属蛋白酶(MMP)与疾病的结果有关。
总的来说,这项研究揭示了早期肺腺癌的分子结构和肿瘤进展的特征,对东亚人群的非吸烟肺癌管理有用。
相关阅读:
Cell分析解读||蛋白质组学寻找早期肺腺癌的异质性和标志物(上)
CKG|怎么利用临床知识图谱,将蛋白质组学数据整合到临床决策
临床大队列蛋白质组学你真的会做么?
通路分析里面的级联反应
为什么癌症精准治疗需要蛋白质组学?
本文来自网络或网友投稿,如有侵犯您的权益,请发邮件至:aisoutu@outlook.com 我们将第一时间删除。
相关素材