程序员开发实例大全宝库

网站首页 > 编程文章 正文

保姆式教程|仅靠这个数据库就发到生信3+?这个套路值得耍一耍

zazugpt 2024-10-20 15:55:26 编程文章 51 ℃ 0 评论

15分钟零代码复现3分单基因生信文章

更多生信干货教程

私信我回复“数据库”即可免费领取哦

从小白的角度,15分钟复现生信套路。今天为大家带来一篇2021年1月发表于OncoTargets and Therapy(影响因子:3.337)的单基因生信文章Low Expression of Keratin17 is Related to Poor Prognosis in Bladder Cancer的复现。



本文是干湿结合的文章,涉及6个图片和3个表格:

图一:临床标本的免疫组化图片

这里是作者自行取样和切片的图片,在此不进行复现。

图二:KRT17在肿瘤组织中的表达

这里我们分别采用了GEPIA和仙桃学术两种方法作图。



01

GEPIA复现

GEPIA网址:http://gepia.cancer-pku.cn/index.html


1. 进入主页,输入基因名“KRT17”,点击“GoPIA!”。▼



2. 点击“Expression DIY”,输入基因名“KRT17”,选择肿瘤类型“BLCA”,根据需要选择“Log Scale”,“Jitter Size”等,最后点击“Plot”,即可得到原文中的图2。▼




02

仙桃学术复现


在仙桃学术中,有类似的功能,非常方便快捷。

仙桃学术生信工具网址:https://www.xiantao.love/products


1. 进入主页,选择高级版,点击“立即使用”(注:免费版和基础版都可以进行统计和可视化,由于高级版功能最全,这里选择高级版作为范例)。▼



2. 选择“分析工具”后,在左侧选择“表达差异”下的“非配对样本”。

(配对样本与非配对样本的差异,参见仙桃学术 | 小白也可以学会的差异分析,赶快get起来~)▼



3. 在数据中选择肿瘤类型“TCGA-BLCA”,在参数中输入分子“KRT17”,并根据需要调整图形样式,点击“确认”,即可得到所需图片。▼


图3:qRT-PCR检测显示肿瘤组织中KRT17mRNA高表达


文章中,作者利用自己采集的标本进行qRT-PCR检测后绘制的配对图,我们选择仙桃学术里的云数据,即TCGA中的配对样本,进行的图形绘制。


(小贴士:仙桃学术在“差异分析”下选择“测序数据”即可上传自己的临床数据进行分析,完全可以代替prism绘图哦,贴心得不要不要的~)


1. 在左侧选择“表达差异”下的“配对样本”,在数据中找到待分析的肿瘤类型“TCGA-BLCA”,在参数中输入目的基因“KRT17”。▼



2. 调整图片的参数,如标题点、线、文本、图注、风格等,点击“确认”,即可得到满意的图片。▼


图四:总生存曲线(OS)和无进展生存曲线PFS


因为作者对KRT17的高表达和低表达的定义是基于图1的组织切片后免疫组化染色得分的结果,而我们没办法复制,因此采取了KRT17的中位数来区分其高低表达,并绘制了OS和PFS曲线。


1. 在左侧“临床意义”下的“预后分析”中选择“KM曲线图”,在数据中找到待分析的肿瘤类型“TCGA-BLCA”,在参数中输入目的基因“KRT17”,选择“预后参数”为“OS”,并调整图片形式,点击“确认”得到图片,这时记得“保存结果”,把图片保存到云端的历史记录中,也可用其他格式保存到电脑中。▼


(小贴士:建议后续需要拼图的图片均选择“保存结果”,这样可将保存的结果直接在“拼图工具”中进行拼图,待会儿就能见证奇迹~)



2. 在保存在云端的历史记录时,最好为文件起个清晰明了的名字,避免文件太多时混淆,例如保存此图为“OS”。▼



3. 用同样的方法,仅改变“预后参数”为“PFS”,点击“确认”,“保存结果”为“PFS”。▼



4. 选择“拼图工具”,在左下角就能看见刚刚保存在云端的“所有图片”了。将需要拼图的图片拖拉到右边的空白页面,调整图片的大小和位置,并根据需求选择“ABC标注”下的标注类型和风格。▼



5. 最下方可添加“参考线”来辅助图片对齐,得到满意的图片后,选择合适的格式“下载”保存,即可得到发表级别的图片了。▼



(小贴士:图片接近辅助线的时候有磁吸功能辅助对齐,在下载的图片中已经自动标记好了字母,相当的便利吧~)


表1:基线资料表


选择“临床意义”下的“基线资料表”,在数据中选择肿瘤类型“TCGA-BLCA”,在参数中输入目的分子“KRT17”,在表格格式中选择“列联表-简洁版”,并根据需要选择“分类变量”,最后点击“确认”即可得到想要的表格,有“Excel表格下载”、“CSV表格下载”、“Word表格下载”等多种形式可保存结果。


(基线资料表的各类格式如何选择,参见仙桃学术丨绝了!一分钟零代码无痛搞定临床统计,这个神器简单又高级!)▼



(小贴士:点击“保存结果”,输入名称,比如“基线资料表”,然后点击“确定”,这样在历史记录中就会保存有这个结果,留待以后的调整修改。)

“Word表格下载”后打开,就得到了可用于发表的三线表。


表2&表3:单因素分析、多因素分析


文章中表2和表3是分开展示的,仙桃学术能一键完成,这里就放在一起了。


1. 选择“临床意义”下“预后分析”中的“单因素|多因素Cox回归”,在数据中选择肿瘤类型“TCGA-BLCA”,在预后参数中选择“OS”。▼



2. 在左侧框里选择临床变量,或者输入基因名(可以填一个或多个基因名),在右侧框可里选择亚组变量,或者基因表达的Low或者High。如果需要再增加变量,点击右侧的加号;如果需要剔除某个变量,需要在变量的右侧点击减号。确定好临床变量和分组信息后,点击确认。最后会分析出统计分析表,以及统计数据、相应的材料与方法、结果部分的描述。▼




(小贴士:目前在仙桃学术工具中,只选择了一些重要的临床变量,有的临床变量还没有纳入,比如化疗数据、复发数据等,也许不久的将来,我们会提供更完善的数据哦~)


图5:列线图


1. 选择“临床意义”下“预后分析”中的“Nomogram图”,在数据中选择肿瘤类型“TCGA-BLCA”,在下方选择需要分析的因子并设置组别,在预测年限中选择“OS”,时间1为“3年”,时间2为“5年”,调整可视化参数,点击“确认”即可得到列线图。▼



(小贴士:记得只选择有意义的变量纳入nomogram分析哦~)


图6:GSEA结果显示最相关的富集路径


作者在方法中未说明是采用自己的数据还是TCGA数据,也未能清楚解释采用的是哪种数据集进行的GSEA分析,我们采用的是仙桃学术的TCGA云端数据,做出的GSEA分析图与文章中的图片略有差异。


1. 进行GSEA分析前,先要进行差异分析。在“表达差异”下找到“单基因差异分析”,在数据中选择肿瘤类型“TCGA-BLCA”,在右边输入目的分子“KRT17”,选择需要分析的方法和分组信息。▼


(更具体的步骤参见仙桃学术 | 小白也可以学会的差异分析,赶快get起来~



该步骤所需时间略长,可在“历史记录”中查看进度。▼



待状态呈现“完成”时,即可下载结果。▼



2. 打开“单基因差异分析”结果,将数据整理为“gene_name”一列,“logFC”一列。▼



(小贴士:这里可能会看到有些logFC值是空缺的,但是不用担心,可以直接上传,不需要进行数据过滤哦~)


3. 选择“功能聚类”,“GSEA富集”,“GSEA分析”,将准备好的文件上传,并选择数据集和物种;高级分析参数采用默认。然后点击确认。▼



4. 等待一段时间,在“历史记录”中状态从“等待”变为“完成”即可下载GSEA分析结果。▼



5. 选择“功能聚类”,“GSEA富集”,“GSEA可视化”,选中刚刚做好的“GSEA富集分析”,在基因集ID里会自动展现前两条富集分析到的通路(这里基因集ID最多可以展现5条通路,既可以选择top富集到的通路,也可以选择自己感兴趣的通路)。这里根据原文选择第一条信号通路,点击“确认”。点击“保存结果”或“查看大图”。▼



好了,本期零代码3+生信文章复现就到这里啦!有没有觉得仙桃学术的工具很赞很奈斯?希望大家好好利用这个宝藏,多多发文章~


—END—

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表