r 中的 colsplit：将一列分成两列

Question

我将一个 csv 文件 ("sumCounts") 加载到 r 中，其中包含一个名为 "transcript" 的列。此列中的一行示例如下所示：

TR43890|c0_g1_i1

我想沿着管道“|”将此列拆分为两列，分别称为 "transcript" 和 "isoform"字符.

sumCounts <- colsplit(transcript, "|", c("transcript", "isoform"))

我不断收到以下错误：str_split_fixed(string, pattern, n = length(names)) 中的错误：未找到对象 'transcript'

Answer 1

您的问题没有包含足够的信息来判断这是否可行，但我假设您的数据已读入名为 sumCounts 的数据对象，其中包含一个名为 transcript 的列，您希望将其分成两部分。如果是这样，那么 Hadley Wickham 的 tidyr 包将做你想做的事：

install.packages("tidyr")
require(tidyr)

#sumCounts <- read.csv("sumCounts.csv")

## Toy example:
sumCounts <- data.frame(
  "transcript"=c(
    "TR43890|c0_g1_i1", 
    "TR43890|c0_g1_i1", 
    "TR43890|c0_g1_i1"
  )
)

##  Note that the sep= argument requires a regular expression, for which
##    the pipe argument is a special character and must be escaped:
separate(sumCounts, transcript, c("transcript", "isoform"), sep="\|")

r 中的 colsplit：将一列分成两列

colsplit in r: separate one column into two

split

r

reshape2