在 R 中使用 str_replace_all 和 strsplit 循环数据
Loops in data using str_replace_all and strsplit in R
我有一个数据框,其中有一列包含下一个字符:
head(example)
X. S10 tactagcaatacgcttgcgttcggtggttaagtatgtataatgcgcgggcttgtcgt
1 + AM \t\ttgctatcctgacagttgtcacgctgattggtgtcgttacaatctaacgcatcgccaa
2 + AR \t\tgtactagagaactagtgcattagcttatttttttgttatcatgctaaccacccggcg
3 + DE \taattgtgatgtgtatcgaagtgtgttgcggagtagatgttagaatactaacaaactc
So I want replace each letter by specific chain. For example: when it appears "a" i want put 0,0,0,1. But I get it
str_replace_all(例如,“[a]”,c(“0”,“0”,“0”,“1”))
[1] "tgct0tcctg0c0gttgtc0cgctg0ttggtgtcgtt0c00tct00cgc0tcgcc00"
Also I need separate each value in one column.
我们可以使用命名向量 str_replace_all
library(stringr)
str_replace_all(example, setNames( c('0001', '1000'), c('a', 't')))
它将字母 'a'、't' 分别替换为值 '0001' 和 '1000'
我有一个数据框,其中有一列包含下一个字符:
head(example)
X. S10 tactagcaatacgcttgcgttcggtggttaagtatgtataatgcgcgggcttgtcgt
1 + AM \t\ttgctatcctgacagttgtcacgctgattggtgtcgttacaatctaacgcatcgccaa
2 + AR \t\tgtactagagaactagtgcattagcttatttttttgttatcatgctaaccacccggcg
3 + DE \taattgtgatgtgtatcgaagtgtgttgcggagtagatgttagaatactaacaaactc
So I want replace each letter by specific chain. For example: when it appears "a" i want put 0,0,0,1. But I get it
str_replace_all(例如,“[a]”,c(“0”,“0”,“0”,“1”)) [1] "tgct0tcctg0c0gttgtc0cgctg0ttggtgtcgtt0c00tct00cgc0tcgcc00"
Also I need separate each value in one column.
我们可以使用命名向量 str_replace_all
library(stringr)
str_replace_all(example, setNames( c('0001', '1000'), c('a', 't')))
它将字母 'a'、't' 分别替换为值 '0001' 和 '1000'