09. 任意基因任意癌症表达量和临床性状关联
#视频中的代码
rm(list = ls())
options(stringsAsFactors = F)
#Ovarian serous Cystadenocarcinoma(TCGA,Nature 2011)
#All complete Tumors (316 samples)/1 Genes
#Gene Set/Pathway is altered in 28 (8.9%) of queried samples
a = read.table('plot-data-ARHGAP18-TCGA-OV-cbioportal.txt',header = T, sep = '\t', fill = T)
colnames(a) = c('id','stage','gene','mut')
dat = a
library(BiocManager)
BiocManager::install("metaBMA")
library(ggstatsplot)
ggbetweenstats(data = dat,x=stage,y = gene)
library(ggplot2)
ggsave('plot-data-ARHGAP18-TCGA-OV-cbioportal.png')
10. 表达矩阵的样本相关性
load("D:/Soft/airway_exprSet.Rdata")
dim(exprSet)#查看样本维度;8个维度,六万多个样本
#cor函数验证样本之间的相关性;接近于1,则相关性越高
cor(exprSet[,1],exprSet[,2])#取表格的第一列和第二列
cor(exprSet)
#根据相关性作图
pheatmap::pheatmap(cor(exprSet))
?
#把矩阵取小
x=exprSet[1,]
x>1#返回值为T或F
sum(x>1)
x=exprSet[2,]
x>1#返回值为T或F
sum(x>1)>5#基因表达量为大于5则符合要求
apply(exprSet,1,function(x) sum(x>1)>5)
dim(exprSet)#查看样本维度1
exprSet=exprSet[apply(exprSet,1,function(x) sum(x>1)>5),]
dim(exprSet)#查看样本维度2
#查看已安装的R包
#安装edgeR
#colnames(installed.packages())
#install.packages('BiocManager')
BiocManager::install('edgeR')
exprSet=log(edgeR::cpm(exprSet)+1)
exprSet=exprSet[names(sort(apply(exprSet,1,mad),decreasing = T)[1:500]),]
dim(exprSet)
M=cor(log2(exprSet+1))
pheatmap::pheatmap(M)
dev.off()#关闭画板
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?