3.8. JCNVv1

データセットカテゴリ

Copy Number Variation

概要

日本人48,874人の短鎖全ゲノム解析から得られたコピー数多型頻度データ

参考文献
  • Tadaka et al. [2]

解析対象

血液 (Buffy coat)・唾液

解析方法
  1. 54KJPN-SNV/INDEL で作成したCRAMファイルに対して以下の処理を実行する

  2. 各シークエンサーとシークエンス機関の組み合わせごとに200サンプルをランダムに選択する

  3. 2.で選んだ200サンプルのセットごとに GATK CNV Germline Cohort Workflow を実行する
    • この時、CNVの解析領域は各染色体のNではない領域を1kbpごとに切ったものを利用している

  4. 各シークエンサーとシークエンス機関の組み合わせごとに全てのサンプルを200サンプルごとにグループ化する

  5. 2.で作成した Panel of Normal を利用して 4.で作成したグループごとに GATK CNV Germline Case Workflow を実行する

  6. 5.で作成した全サンプルの常染色体について、AmplificationとLossの数を数える

  7. 四分位範囲(IQR)を利用してAmplificationとLossの数が外れ値になっている検体を取り除く
    • IQRの1.5倍を 75percentile に足した値を上限とし、IQRの1.5倍を 25percentile から引いた値を下限とした

  8. 7.で選択したサンプルのうち 54KJPN-SNV/INDEL に含まれていないサンプルを取り除く

  9. binごとにCNごとのサンプル数を計算する

jMorp Web サイトにおける掲載ページ