标准化2021干湿结合5+套路模板,零代码就可以复现!来抄作业啦!
发布于 2021-10-16 11:58
大家好!我是麦麦,今天跟大家分享一篇肿瘤领域的“干湿结合”的生信文章,整个文章逻辑清晰,且可借鉴性很强。2021年1月发表医学二区期刊“Journal of Translational Medicine(IF=5.531)”上。题目是“GSK2126458 has the potential to inhibit the proliferation of pancreatic cancer uncovered by bioinformatics analysis and pharmacological experiments”。文章借助生物信息学分析和药理验证性实验确定PI3K-Akt信号通路可能是胰腺癌发病发生发展的关键途径,并且作者发现了GSK2126458,一种特定的mTOR抑制剂,具有治疗胰腺癌的潜力。
期刊简介
“挑圈联靠”题目要素拆解
疾病:胰腺癌(pancreatic cancer)
数据来源:GEO数据库
文章类型:肿瘤领域“干湿结合”生信文章
研究背景
胰腺癌(Pancreatic cancer )是消化道常见恶性肿瘤之一,在肿瘤领域被称为“癌中之王”。胰腺癌确诊后的五年生存率约10%,是预后最差的恶性肿瘤之一。目前为止,越来越多的证据表明,多种基因和细胞通路参与胰腺癌的发展和进展,但其胰腺癌发病进展的确切分子机制的尚未阐明清楚。因此,确定枢纽基因和关键途径对于进一步研究胰腺癌的发病机制和开发更有效的治疗方法具有重要意义。
在这项研究中,作者借助GEO数据库以及GEO2R 在线工具,对GSE15471 和 GSE62165 数据集进行数据挖掘以及差异表达分析,筛选出胰腺癌中的差异表达基因(differentially expressed genes;DEGs)。同时,利用 DAVID数据库对DEGs进行GO分析以及KEGG富集分析。作者通过构建DEGs的蛋白质-蛋白质相互作用(PPI)网络和模块化分析,以挑选与胰腺癌发病机制密切相关的枢纽基因。同时使用GEPIA验证癌症患者和健康人人群中枢纽基因的表达情况。最后,MTT、克隆形成和侵袭实验检测PI3K-Akt信号通路抑制剂(mTOR抑制剂,GSK2126458)对胰腺癌细胞生存能力的影响。对DEGs的生物功能和途径的分析将更好地了解胰腺癌的分子机制和筛选潜在的候选治疗靶点。
数据精析
挑:表达差异
(1)作者首先利用GEO数据库获取胰腺癌的基因表达数据集。以|logFC|>1和FDR < 0.01为标准,作者随后通过2个微阵列数据集(GSE15471 和 GSE62165 )筛选出胰腺癌样本和健康样本之间的差异表达基因(图1a)。Venn图显示,2个数据集中共有432个上调的DEGs和177个下调的DEGs(图1b)。
(图1)
圈:DEGs的功能富集分析
采用DAVID数据库对609个共同的DEGs 进行GO以及KEGG功能富集分析(图2)。胰腺癌中 DEGs 的显着富集的 KEGG 通路(前30名)如图 2B 所示。表1 显示了上调 DEGs 的前 15 条富集 KEGG 通路和下调 DEGs 的前 5 条富集 KEGG 通路。如表 1 所示,DEGs 的 KEGG 通路富集分析表明,上调的 DEGs 在补体和凝血级联反应(complement and coagulation cascades)中最显着富集,下调的DEGs在胰腺分泌甘氨酸(pancreatic secretion glycine)通路中最显着富集。按照富集基因数量进行排序,排名前三个富集的 KEGG 通路分别是focal adhesion, phagosome 以及 PI3K–Akt signaling pathway(表 1)。
(图2)
(表1)
联:构建PPI网络
利用STRING 数据库和 Cytoscape 软件, 构建了由 485 个DEGs(总共609个DEGs,剔除游离DEGs)组成的PPI网络 (362 个上调基因和 123 个下调基因),PPI互作图中包括 485个节点和 2202条边。表2列出了连接度较高的排名前15个节点(hub基因)。ALB 的连接节点度值(Degree)最高,为 120。使用 STRING数据库中的 GO和 KEGG 通路分析,作者发现 COL3A1、EGF、FN1 和 ITGA2 靶点基因主要富集在 focal adhesion 和PI3K–Akt signaling pathway通路上。采用Cytoscape软件MCODE 插件确定整个PPI 网络中重要的模块。根据 MCODE 分数> 4 和节点数> 4 的标准,共筛选出排名前4的互作模块(表3)。STRING 在线数据库对4个模块中涉及的基因进行KEGG通路富集(图3A-D)计算。通路富集分析表明,4个模块中的基因主要富集在chemokine signaling pathway, PI3K–Akt signaling pathway, phagosome, tuberculosis等通路(图3E-H)。
(图3)
(表2)
(表3)
靠:枢纽基因表达量初步验证
(1)为了验证胰腺癌患者和健康人之间枢纽基因的表达差异情况,作者借助GEPIA数据库分析来自 TCGA 正常和GTEx 数据库下载的数据。由于90%的胰脏腺癌(PAAD)是胰腺导管腺癌(PDAC)。因此在 TCGA 数据库中,PAAD疾病并未进行分类,只能用 PAAD的数据进行分析。作者采用PAAD的基因芯片数据用来间接反映PDAC的情况。图4A反映,与正常组织相比,本研究中识别出的枢纽基因在胰腺癌患者组织中表现出明显的异常。作者进一步分析了COL3A1、FN1和ITGA2在胰腺癌组织中表达与患者整体存活率之间的关系。如图4B-D 中所示,高 FN1表达胰腺癌组织与总体存活率呈现显著的负相关。
(图4)
(2)借助HPA数据库(图5),作者发现,与正常组织相比,胰腺癌组织中COL3A1、FN1和ITGA2的蛋白表达水平明显增加。COL3A1、FN1、ITGA2分别在PAAD组织中表现出中等甚至高的免疫反应,而正常胰腺组织中阳性表达较低。
(图5)
湿实验:针对枢纽基因的体外药物筛选
(1)前期生物信息学分析发现,大多枢纽基因富集在PI3K-Akt通路,作者进一步研究了三种PI3K-Akt信号通路抑制剂对PANC-1(人类胰腺癌细胞系)细胞生长的影响。BKM-120是一种选择性PI3K抑制剂;MK2206是一种高度选择性的Akt1/2/3抑制剂,也是第一个进入临床研究的小分子Akt变构抑制剂 ;GSK2126458 是一种高度选择性的、有效的p110+/β/γ/δ和mTORC1+2抑制剂。这三种化合物分别是针对PI3K/Akt-mTOR信号通路中三个关键靶点的抑制剂。作者采用GDSC 数据预测了 BNM-120、MK2206和 GSK2126458 化合物对泛癌细胞系的 IC50 值,结果分析表明胰腺癌细胞系对GSK2126458化合物反应较为敏感(图 6A)。如图6B所示,EWSR1-FLI1突变胰腺细胞对GSK2126458最为敏感。此外,FNR43突变胰腺癌细胞对GSK2126458敏感性明显高于其他野生型细胞(图6C)。
(图6)
(2)如图7A所示,GSK2126458化合物在孵育细胞24-72 h后,时间依赖以及剂量依赖方式降低了PANC-1胰腺癌细胞的生存率。GSK2126458 对PANC-1细胞的IC50分别是 > 10 μM (24 h), 0.87 ± 0.17 μM (48 h), 0.23 ± 0.13 μM(72 h)。同时,作者发现采用 GSK2126458孵育细胞48h后,PANC-1细胞集落的形成以及侵袭转移能力剂量依赖的方式受到显著抑制(图7C)。FACS结果表明,GSK2126458 可显著诱导PANC-1细胞晚期凋亡(图7 D,E)。这些结果表明,GSK2126458 能以时间和剂量依赖地方式抑制胰腺癌细胞的增殖和凋亡。
(图7)
全文总结
在这篇研究中,作者通过全面的生物信息学分析,以确定可能涉及胰腺癌进展的DEGs。作者一共筛选出609个DEGs,并且发现15个显著变化的枢纽基因主要与PI3K-Akt信号通路密切有关。此外,作者采用GDSC 数据库来证明胰腺癌细胞系对PI3K/Akt-mTOR信号通路中mTOR抑制剂—GSK2126458非常敏感,尤其是EWSR1、FLI2 和 RNF43的癌细胞突变体。体外细胞实验也进一步证明,GSK2126458能够抑制胰腺癌细胞的增殖和诱导细胞凋亡,呈现剂量依赖性。这也是作者首次报道GSK2126458对胰腺癌具有潜在的治疗作用。
全文采用“生物信息学+体外实验”手段将这篇肿瘤领域生信文章发在医学二区5分+SCI期刊。整体来说,该文基本按照酸菜校长总结的“挑、圈、联、靠”生信套路进行展开,所用技术以在线工具为主,非常适合初学者模仿。选好题目,讲好故事,再套用相同的逻辑思路,发表类似的生信SCI论文指日可待!
希望各位小伙伴们能从这篇5分+生信套路文章中领略到一些技巧和思路,我们下期再见啦,拜拜!
本文来自网络或网友投稿,如有侵犯您的权益,请发邮件至:aisoutu@outlook.com 我们将第一时间删除。
相关素材