将 GENCODE ID 转换为 Ensembl - Ranged SummarizedExperiment
Convert GENCODE IDs to Ensembl - Ranged SummarizedExperiment
我有一个表达式集矩阵,其中的行名是我认为格式中的 GENCODE ID,例如
"ENSG00000000003.14"
"ENSG00000000457.13"
"ENSG00000000005.5" 等等。
我想将它们转换为 gene_symbol 但我不确定这样做的最佳方法,特别是因为我认为是“.14”或“.13”的版本。我应该先 trim 点后的所有 ID,然后使用 biomaRt 进行转换吗?如果是这样,最有效的方法是什么?有没有更好的方式到达 gene_symbol?
非常感谢你的帮助
如前所述,这些是 ENSEMBL ID。首先,您需要做的是检查您的表达式集对象并确定它用于注释的数据库。有时,ID 可能映射到较新(更新的)注释数据库中的不同基因符号。
总之,希望ID是人类的,用这段代码可以很方便的得到基因符号。
library(org.Hs.eg.db) ## Annotation DB
library(AnnotationDbi)
ids <- c("ENSG00000000003", "ENSG00000000457","ENSG00000000005")
gene_symbol <- select(org.Hs.eg.db,keys = ids,columns = "SYMBOL",keytype = "ENSEMBL")
您可以尝试使用 org.Hs.eg.db 或您的表达式集使用的确切数据库(如果该信息可用)。
感谢您的帮助。我的问题是去掉每个合奏基因 id 末尾的 .XX 版本。我认为从具有版本号(gencode 基本注释)的合奏基因 id 到基因符号会有更直接的方法。最后我做了以下并且似乎正在工作:
df$ensembl_gene_id <- gsub('\..+$', '', df$ensembl_gene_id)
library(biomaRt)
mart <- useDataset("hsapiens_gene_ensembl", useMart("ensembl"))
genes <- df$ensembl_gene_id
symbol <- getBM(filters = "ensembl_gene_id",
attributes = c("ensembl_gene_id","hgnc_symbol"),
values = genes,
mart = mart)
df <- merge(x = symbol,
y = df,
by.x="ensembl_gene_id",
by.y="ensembl_gene_id")
我有一个表达式集矩阵,其中的行名是我认为格式中的 GENCODE ID,例如 "ENSG00000000003.14" "ENSG00000000457.13" "ENSG00000000005.5" 等等。 我想将它们转换为 gene_symbol 但我不确定这样做的最佳方法,特别是因为我认为是“.14”或“.13”的版本。我应该先 trim 点后的所有 ID,然后使用 biomaRt 进行转换吗?如果是这样,最有效的方法是什么?有没有更好的方式到达 gene_symbol?
非常感谢你的帮助
如前所述,这些是 ENSEMBL ID。首先,您需要做的是检查您的表达式集对象并确定它用于注释的数据库。有时,ID 可能映射到较新(更新的)注释数据库中的不同基因符号。
总之,希望ID是人类的,用这段代码可以很方便的得到基因符号。
library(org.Hs.eg.db) ## Annotation DB
library(AnnotationDbi)
ids <- c("ENSG00000000003", "ENSG00000000457","ENSG00000000005")
gene_symbol <- select(org.Hs.eg.db,keys = ids,columns = "SYMBOL",keytype = "ENSEMBL")
您可以尝试使用 org.Hs.eg.db 或您的表达式集使用的确切数据库(如果该信息可用)。
感谢您的帮助。我的问题是去掉每个合奏基因 id 末尾的 .XX 版本。我认为从具有版本号(gencode 基本注释)的合奏基因 id 到基因符号会有更直接的方法。最后我做了以下并且似乎正在工作:
df$ensembl_gene_id <- gsub('\..+$', '', df$ensembl_gene_id)
library(biomaRt)
mart <- useDataset("hsapiens_gene_ensembl", useMart("ensembl"))
genes <- df$ensembl_gene_id
symbol <- getBM(filters = "ensembl_gene_id",
attributes = c("ensembl_gene_id","hgnc_symbol"),
values = genes,
mart = mart)
df <- merge(x = symbol,
y = df,
by.x="ensembl_gene_id",
by.y="ensembl_gene_id")