如何解释 Seurat 对象中 nCount_RNA 的十进制值
How to interpret decimal values for nCount_RNA in Seurat Object
我的数据集很奇怪。当我创建 Seurat 对象并为其加载元数据时,nCount_RNA 中的所有值都是十进制值而不是整数。我应该如何解释这个?数据本身是否存在问题,或者我可以做些什么来解决这个问题?我问是因为稍后在我的分析中,函数似乎找不到 nCount_RNA 对象,我相信小数值是原因。
Metadata for Seurat Object
这是我用来创建这个对象的代码:
#Loading in the data ----------------------------------------------------------
filePaths = getGEOSuppFiles("GSE124395")
tarF <- list.files(path = "./GSE124395/", pattern = "*.tar", full.names = TRUE)
untar(tarF, exdir = "./GSE124395/")
gzipF <- list.files(path = "./GSE124395/", pattern = "*.gz", full.names = TRUE)
ldply(.data = gzipF, .fun = gunzip)
# Creating the matrix -----------------------------------------------------------
P301_3_matrix <- read.delim(file = './GSE124395//GSM3531672_P301_3_CRYOMIXED11.coutt.csv')
P301_3_matrix <- data.frame(P301_3_matrix[,-1], row.names=P301_3_matrix[,1])
P301_3_matrix <- as.matrix(P301_3_matrix) #<- makes the excel file into a matrix
P301_3_colname <- read.table(file = './GSE124395//GSE124395_celseq_barcodes.192.txt', header = FALSE, row.names = 1)
P301_3_colname <- data.frame(P301_3_colname[,-1], col=P301_3_colname[,1])
P301_3_colname <- as.matrix(P301_3_colname)
colnames(P301_3_matrix) <- P301_3_colname[,1]
colnames(P301_3_matrix) <- paste(colnames(P301_3_matrix), "CryoMixed11", sep = "_")
P301_3_pdat <- data.frame("samples" = colnames(P301_3_matrix), "treatment" = "CryoMixed")
#Creating the Seurat object ----------------------------------------------------
sobj<- CreateSeuratObject(counts = P301_3_matrix, min.cells = 0, min.features=1, project = "Liver_Cell_Atlas")
sobj <- saveRDS(sobj,file="JoinedMatrixNoFilters.rds")
希望这不是太含糊,感谢阅读!
你读入的文件,不知怎么归一化了,肯定不是计数数据:
P301_3_matrix = read.delim('GSM3531672_P301_3_CRYOMIXED11.coutt.csv.gz',row.names=1)
head(colSums(P301_3_matrix))
X1 X2 X3 X4 X5 X6
205.2744 22457.6142 1232.4626 14193.6406 15372.4642 18808.8838
如果您阅读 details on processing,它会写道:
Based on binomial statistics, the number of observed UMIs were
converted into transcript counts (Grün et al., 2014)
所以很可能你必须向作者询问计数 table 或简单地转换为整数,继续并希望没有出错。
我的数据集很奇怪。当我创建 Seurat 对象并为其加载元数据时,nCount_RNA 中的所有值都是十进制值而不是整数。我应该如何解释这个?数据本身是否存在问题,或者我可以做些什么来解决这个问题?我问是因为稍后在我的分析中,函数似乎找不到 nCount_RNA 对象,我相信小数值是原因。
Metadata for Seurat Object
这是我用来创建这个对象的代码:
#Loading in the data ----------------------------------------------------------
filePaths = getGEOSuppFiles("GSE124395")
tarF <- list.files(path = "./GSE124395/", pattern = "*.tar", full.names = TRUE)
untar(tarF, exdir = "./GSE124395/")
gzipF <- list.files(path = "./GSE124395/", pattern = "*.gz", full.names = TRUE)
ldply(.data = gzipF, .fun = gunzip)
# Creating the matrix -----------------------------------------------------------
P301_3_matrix <- read.delim(file = './GSE124395//GSM3531672_P301_3_CRYOMIXED11.coutt.csv')
P301_3_matrix <- data.frame(P301_3_matrix[,-1], row.names=P301_3_matrix[,1])
P301_3_matrix <- as.matrix(P301_3_matrix) #<- makes the excel file into a matrix
P301_3_colname <- read.table(file = './GSE124395//GSE124395_celseq_barcodes.192.txt', header = FALSE, row.names = 1)
P301_3_colname <- data.frame(P301_3_colname[,-1], col=P301_3_colname[,1])
P301_3_colname <- as.matrix(P301_3_colname)
colnames(P301_3_matrix) <- P301_3_colname[,1]
colnames(P301_3_matrix) <- paste(colnames(P301_3_matrix), "CryoMixed11", sep = "_")
P301_3_pdat <- data.frame("samples" = colnames(P301_3_matrix), "treatment" = "CryoMixed")
#Creating the Seurat object ----------------------------------------------------
sobj<- CreateSeuratObject(counts = P301_3_matrix, min.cells = 0, min.features=1, project = "Liver_Cell_Atlas")
sobj <- saveRDS(sobj,file="JoinedMatrixNoFilters.rds")
希望这不是太含糊,感谢阅读!
你读入的文件,不知怎么归一化了,肯定不是计数数据:
P301_3_matrix = read.delim('GSM3531672_P301_3_CRYOMIXED11.coutt.csv.gz',row.names=1)
head(colSums(P301_3_matrix))
X1 X2 X3 X4 X5 X6
205.2744 22457.6142 1232.4626 14193.6406 15372.4642 18808.8838
如果您阅读 details on processing,它会写道:
Based on binomial statistics, the number of observed UMIs were converted into transcript counts (Grün et al., 2014)
所以很可能你必须向作者询问计数 table 或简单地转换为整数,继续并希望没有出错。