3.13. JCNVv1
- データセットカテゴリ
Copy Number Variation
- 概要
日本人48,874人の短鎖全ゲノム解析から得られたコピー数多型頻度データ
- 参考文献
Tadaka et al. [2]
- 解析対象
血液 (Buffy coat)・唾液
- 解析方法
54KJPN-SNV/INDEL で作成したCRAMファイルに対して以下の処理を実行する
各シークエンサーとシークエンス機関の組み合わせごとに200サンプルをランダムに選択する
- 2.で選んだ200サンプルのセットごとに GATK CNV Germline Cohort Workflow を実行する
この時、CNVの解析領域は各染色体のNではない領域を1kbpごとに切ったものを利用している
各シークエンサーとシークエンス機関の組み合わせごとに全てのサンプルを200サンプルごとにグループ化する
2.で作成した Panel of Normal を利用して 4.で作成したグループごとに GATK CNV Germline Case Workflow を実行する
5.で作成した全サンプルの常染色体について、AmplificationとLossの数を数える
- 四分位範囲(IQR)を利用してAmplificationとLossの数が外れ値になっている検体を取り除く
IQRの1.5倍を 75percentile に足した値を上限とし、IQRの1.5倍を 25percentile から引いた値を下限とした
7.で選択したサンプルのうち 54KJPN-SNV/INDEL に含まれていないサンプルを取り除く
binごとにCNごとのサンプル数を計算する