TCGA
多个基因的生存分析曲线一步绘制法
2021-09-12
欧阳松
有时候你通过各种挖掘,筛选出了一些基因,你可能需要对这些基因进行生存分析,常规的办法可能要去下载所有的基因表达量和临床表型,然后再去一个个分析。说真的,这样很低效,我们可以利用survminer包的ggsurvplot_facet()函数进行分面绘制,类似于ggolot2的facet。
[…] 我建议去xena浏览器的可视化卡片去直接筛选数据,这样可以节省很多很多时间,而且我建议你使 …
阅读全文 →
|
单个基因之间在各种癌症中的相关性分析
2021-09-04
欧阳松
今天一大早(其实快10点了)还在睡觉,李老师问我想知道几个基因在几个TCGA癌症中的相关性。
其实这个问题是很好解决的,我们只要有各种基因在各种癌症的表达量就可以了,然后就是一个相关性分析,图的话就是一个散点图,excel都能做。
可以在线做相关性分析的网址很多,比如xena、ualcan、gepia(官网上的介绍上用非log归一化进行计算,用log归一化进行可视化,好奇怪的设 …
阅读全文 →
|
那么多的基因,我只想要mRNA和lncRNA(或者miRNA)怎么办?
2021-09-02
欧阳松
之前我在简书上写了一篇“如何只下载TCGA肿瘤或正常标本的count”的教程,原以为没什么人看的。不过这两天简书上有朋友私信我,如何只下载lncRNA的数据。这个功能在GDCRNATools里好像上不支持的,因为这个包都是下载全部的RNA数据(包括其他的TCGA工具基本都是只下载RNA数据),具体要区分mRNA和lncRNA是要有专门注释文件的。
我这里想借鉴两种方法,链接在这里: …
阅读全文 →
|
如何只下载TCGA肿瘤或正常标本的count
2021-07-01
欧阳松
其实有很多教程指导怎么下载count,最简单当然还有xena,但是我们知道TCGA的肿瘤样本中包括了肿瘤了正常样本,而且有些样本还是重复的,所以需要去重,还需要把肿瘤和正常过滤,现在推荐一下我自己摸索的一个办法
使用的是GDCRNATools,这个包可以下载RNA、miRNA和lncRNA,数据也是count,有人说能不能下载FPKM或者TPM,其实count才是最原始的,自己找一个包转换成TPM …
阅读全文 →
|