从 matchPattern 中提取值
Extracting values from matchPattern
我正在使用 Biostrings
包中的 matchPattern
函数来查找基因组中的特定序列。一旦找到,我想显示匹配实例之间的间距和频率分布。
例子:运行下面的代码
Match1 <- matchPattern(ResEnz, genome$chr1)
Match1
将return这个:
Views on a 248956422-letter DNAString subject
subject: NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN...NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
views:
start end width
[1] 27974 27979 6 [GAATTC]
[2] 29889 29894 6 [GAATTC]
[3] 32212 32217 6 [GAATTC]
[4] 36941 36946 6 [GAATTC]
[5] 49920 49925 6 [GAATTC]
... ... ... ... ...
[67137] 248927762 248927767 6 [GAATTC]
[67138] 248928956 248928961 6 [GAATTC]
[67139] 248929077 248929082 6 [GAATTC]
[67140] 248932486 248932491 6 [GAATTC]
[67141] 248941974 248941979 6 [GAATTC]
现在,我想使用此数据形成一个向量,该向量将在一个条目的终点和下一个条目的起点之间具有差异。 (忽略第一个起点和最后一个终点)
即,对于 Match1
1910, 2318, 4724, 12974 .... 9483
生成的 Match1 对象是 XStringViews class,名称函数 returns NA,我目前对如何处理这个感到困惑。请帮忙
经过进一步调查,我发现函数 start(Match1)
和 end(Match1)
将生成包含感兴趣值的向量。我会把它留在这里以防其他人遇到同样的问题。
我正在使用 Biostrings
包中的 matchPattern
函数来查找基因组中的特定序列。一旦找到,我想显示匹配实例之间的间距和频率分布。
例子:运行下面的代码
Match1 <- matchPattern(ResEnz, genome$chr1)
Match1
将return这个:
Views on a 248956422-letter DNAString subject
subject: NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN...NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
views:
start end width
[1] 27974 27979 6 [GAATTC]
[2] 29889 29894 6 [GAATTC]
[3] 32212 32217 6 [GAATTC]
[4] 36941 36946 6 [GAATTC]
[5] 49920 49925 6 [GAATTC]
... ... ... ... ...
[67137] 248927762 248927767 6 [GAATTC]
[67138] 248928956 248928961 6 [GAATTC]
[67139] 248929077 248929082 6 [GAATTC]
[67140] 248932486 248932491 6 [GAATTC]
[67141] 248941974 248941979 6 [GAATTC]
现在,我想使用此数据形成一个向量,该向量将在一个条目的终点和下一个条目的起点之间具有差异。 (忽略第一个起点和最后一个终点)
即,对于 Match1
1910, 2318, 4724, 12974 .... 9483
生成的 Match1 对象是 XStringViews class,名称函数 returns NA,我目前对如何处理这个感到困惑。请帮忙
经过进一步调查,我发现函数 start(Match1)
和 end(Match1)
将生成包含感兴趣值的向量。我会把它留在这里以防其他人遇到同样的问题。