vcfのINFOのparse

ワンライナー
extract () {
  cat $1 | awk -v regex="$2=([-|.|e|0-9]+);" \
  '{match($8, regex, arr);\
   if(length(arr)==0){print "NA"} else {print arr[1]}}
  '
}
とかにするとよろしい。
for var in AC AF AN BaseQRankSum ; do
  extract oreno.vcf $var > $var.txt
done
たぶん遅い。

コメント

このブログの人気の投稿

Inverse-normal transformation

SKAT

locuszoom