将 GWAS 摘要统计文件从 build 38 提升到 build 37
Lifting over GWAS summary statististic file from build 38 to build 37
我正在使用 UCSC 提升工具和相关链将我的 GWAS 摘要统计文件(制表符分隔文件)的结果从构建 38 提升到构建 37。GWAS 摘要统计文件 看起来像:
1 chr1_17626_G_A 17626 A G 0.016 -0.0332 0.0237 0.161
1 chr_20184_G_A 20184 A G 0.113 -0.185 0.023 0.419
Follwing 是我正在使用的关联链的 UCSC 工具:
- 提升:http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/liftOver
- 链文件:ftp://hgdownload.cse.ucsc.edu/goldenPath/hg38/liftOver/hg38ToHg19.over.chain.gz
我想从 GWAS 摘要统计文件创建一个 bed 格式 的文件,这是该工具所需的输入,我希望前三列以制表符分隔其余列合并为一列,并用非制表符分隔符(例如“.”)分隔。以便在 运行 电梯结束时保存它们。输入床文件的前三列为:
awk '{print chr, -1, }' GWAS summary stat file > ucsc.input.file
# = chrx - where x is chromosome number
# position -1 for SNPs
# bp position hg38 for SNPs
以上三列为工具必填项
我的问题是:
- 如何使用非制表符分隔符“:”将 GWAS 摘要统计文件的其余列合并到一列中?
- 在 运行 提升后,如何解压由 :?
分隔的列
我不确定这是否能回答您的问题,但请看一看。
您可以使用awk通过:
合并多列
awk '{print ":" ":" }' file
然后说你想用 </code> 中的制表符替换 <code>:
然后你可以做
awk -F ":" '{gsub(/:/,"\t",)}1' file
这有什么帮助吗?
我正在使用 UCSC 提升工具和相关链将我的 GWAS 摘要统计文件(制表符分隔文件)的结果从构建 38 提升到构建 37。GWAS 摘要统计文件 看起来像:
1 chr1_17626_G_A 17626 A G 0.016 -0.0332 0.0237 0.161
1 chr_20184_G_A 20184 A G 0.113 -0.185 0.023 0.419
Follwing 是我正在使用的关联链的 UCSC 工具:
- 提升:http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/liftOver
- 链文件:ftp://hgdownload.cse.ucsc.edu/goldenPath/hg38/liftOver/hg38ToHg19.over.chain.gz
我想从 GWAS 摘要统计文件创建一个 bed 格式 的文件,这是该工具所需的输入,我希望前三列以制表符分隔其余列合并为一列,并用非制表符分隔符(例如“.”)分隔。以便在 运行 电梯结束时保存它们。输入床文件的前三列为:
awk '{print chr, -1, }' GWAS summary stat file > ucsc.input.file
# = chrx - where x is chromosome number
# position -1 for SNPs
# bp position hg38 for SNPs
以上三列为工具必填项
我的问题是:
- 如何使用非制表符分隔符“:”将 GWAS 摘要统计文件的其余列合并到一列中?
- 在 运行 提升后,如何解压由 :? 分隔的列
我不确定这是否能回答您的问题,但请看一看。
您可以使用awk通过:
awk '{print ":" ":" }' file
然后说你想用 </code> 中的制表符替换 <code>:
然后你可以做
awk -F ":" '{gsub(/:/,"\t",)}1' file
这有什么帮助吗?