生信人R语言

发布时间:2024年01月07日

09. 任意基因任意癌症表达量和临床性状关联

#视频中的代码
rm(list = ls())
options(stringsAsFactors = F)
#Ovarian serous Cystadenocarcinoma(TCGA,Nature 2011)
#All complete Tumors (316 samples)/1 Genes
#Gene Set/Pathway is altered in 28 (8.9%) of queried samples
a = read.table('plot-data-ARHGAP18-TCGA-OV-cbioportal.txt',header = T, sep = '\t', fill = T)
colnames(a) = c('id','stage','gene','mut')
dat = a
library(BiocManager)
BiocManager::install("metaBMA")

library(ggstatsplot)

ggbetweenstats(data = dat,x=stage,y = gene)
library(ggplot2)
ggsave('plot-data-ARHGAP18-TCGA-OV-cbioportal.png')

10. 表达矩阵的样本相关性

load("D:/Soft/airway_exprSet.Rdata")
dim(exprSet)#查看样本维度;8个维度,六万多个样本

c36cfe332dcb4e878b78ad5007c9b895.png

#cor函数验证样本之间的相关性;接近于1,则相关性越高
cor(exprSet[,1],exprSet[,2])#取表格的第一列和第二列
cor(exprSet)

e6d45d4edd9b4c13bfd045cf7ffc90ec.png

73a28a38513142b1960349fab9320473.png

#根据相关性作图
pheatmap::pheatmap(cor(exprSet))

d33d34f1f68f4937923cc21980c5be5b.png

?

#把矩阵取小
x=exprSet[1,]
x>1#返回值为T或F
sum(x>1)
x=exprSet[2,]
x>1#返回值为T或F
sum(x>1)>5#基因表达量为大于5则符合要求
apply(exprSet,1,function(x) sum(x>1)>5)
dim(exprSet)#查看样本维度1
exprSet=exprSet[apply(exprSet,1,function(x) sum(x>1)>5),]
dim(exprSet)#查看样本维度2

60af4ffb3044450287c092c9150d5820.png

d75bf6369d6d418ba9ce9a09cd49cd2d.png

dcb9b678fac14145819a4542ff2a5406.png

#查看已安装的R包
#安装edgeR
#colnames(installed.packages())
#install.packages('BiocManager')
BiocManager::install('edgeR')
exprSet=log(edgeR::cpm(exprSet)+1)
exprSet=exprSet[names(sort(apply(exprSet,1,mad),decreasing = T)[1:500]),]
dim(exprSet)

6d34630ef3fb44d89505e2edee6fbde4.png

M=cor(log2(exprSet+1))
pheatmap::pheatmap(M)
dev.off()#关闭画板

dd70085e2f8b42749e0db2d3b46f8d27.png

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

文章来源:https://blog.csdn.net/m0_56780122/article/details/135208603
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。