将 GWAS 摘要统计文件从 build 38 提升到 build 37

Lifting over GWAS summary statististic file from build 38 to build 37

我正在使用 UCSC 提升工具和相关链将我的 GWAS 摘要统计文件(制表符分隔文件)的结果从构建 38 提升到构建 37。GWAS 摘要统计文件 看起来像:

1 chr1_17626_G_A 17626 A G 0.016 -0.0332 0.0237 0.161
1 chr_20184_G_A  20184 A G 0.113 -0.185  0.023 0.419

Follwing 是我正在使用的关联链的 UCSC 工具:

我想从 GWAS 摘要统计文件创建一个 bed 格式 的文件,这是该工具所需的输入,我希望前三列以制表符分隔其余列合并为一列,并用非制表符分隔符(例如“.”)分隔。以便在 运行 电梯结束时保存它们。输入床文件的前三列为:

awk '{print chr, -1, }' GWAS summary stat file > ucsc.input.file

# = chrx - where x is chromosome number 
#  position -1  for SNPs
#  bp position hg38 for SNPs

以上三列为工具必填项

我的问题是:

  1. 如何使用非制表符分隔符“:”将 GWAS 摘要统计文件的其余列合并到一列中?
  2. 在 运行 提升后,如何解压由 :?
  3. 分隔的列

我不确定这是否能回答您的问题,但请看一看。

您可以使用awk通过:

合并多列
awk '{print  ":"  ":" }' file

然后说你想用 </code> 中的制表符替换 <code>: 然后你可以做

awk -F ":" '{gsub(/:/,"\t",)}1' file

这有什么帮助吗?