rvtest

vcfとくにvcf.gzから直接色々な解析をしてくれるソフトとしてrvtestがある。

通常のassociation test(Wald test)を行いたい場合

rvtest \
  --pheno example.pheno \
  --inVcf example.vcf \
  --single wald \
  --out example.wald

vcfは圧縮されていても良い。example.phenoはいわゆるplink.famファイル。6列目以降にもphenotypeデータをおくことができて、--mpheno Xで指定する。6列目がデフォルト、7列目が--mpheno 2となる。column名で指定する場合には--pheno-name PHENOTYPEなどとする。

rvtest \
  --pheno example.pheno \
  --inVcf example.vcf \
  --single wald \
  --covar example.covar \
  --covar-name C1,C2 \
  --mpheno 2 \
  --out example.wald

covariateを取り入れたい場合は--covar example.covar とする。--covar-name C1,C2などとしてcovariate名を指定する。

rvtest \
  --pheno example.pheno \
  --inVcf example.vcf \
  --single wald \
  --out example.wald

Burden test(CMC)を実行する場合

※tabixでindex化されたvcf.gzファイルが必要

rvtest \
  --pheno example.pheno \
  --invcf example.vcf.gz \
  --setFile example.set \
  --burden cmc \
  --out example

example.setファイルを用意する。これは

annotation1 1:1-3
annotation2 2:4-6

といった形式のファイルである。実行するとexample.CMC.assocというファイルが出力される。中身は以下のようになっている。

Range	RANGE	N_INFORMATIVE	NumVar	NonRefSite	
value
set1	1:1-3	9	3	6	0.509777

コメント

このブログの人気の投稿

Inverse-normal transformation

SKAT

locuszoom