3.10. JSV1

データセットカテゴリ

Genome Variation

概要

日本人 222 人の長鎖全ゲノム解析から得られた構造多型アレル・ジェノタイプ頻度データ

参考文献
  • Otsuki et al. [3]

解析対象

Activated T-lymphocytes

検体数

333 検体 (男性: 161, 女性: 172) (111 トリオ)

解析プラットフォーム

PromethION (Flowcell R9.4.1 (cat# FLO-PRO002))

サンプル準備

Gentra Puregene Blood Kit(Qiagen)を使用して活性化T細胞からゲノムDNAを抽出し、 29ゲージの針を使用して剪断し適切なサイズの DNA 断片を得た。 2 マイクログラムの DNA フラグメントをライブラリ調製に供した(Ligation Sequencing Kit; cat# SQK-LSK109)

情報解析パイプライン
  • ベースコール: Guppy 4.2.2 (hac モード)

  • 品質フィルタリング: 平均品質スコアが 6 を超えるリードの先頭・末尾を 100bp トリミングした後に下流解析に供した

  • リードアライメント: LRA 2.17-r941 (-ONT オプションを使用)

  • SV コール:
    • CuteSV 1.0.9 (-min_sv_length 50 オプションを使用)

    • 個人ごとのコール結果を SURVIVOR 1.0.6 を使用してマージ (1000 1 1 -1 -1 -1 オプションを使用) し SV サイト情報を得た

    • その後 CuteSV を用いて joint call を実施

このパイプラインは、基本的に Oxford Nanopore Technologies が提供する公式パイプラインに基づいています。 https://github.com/nanoporetech/pipeline-structural-variation/releases/tag/v2.0.2

アレル頻度推定、およびメンデル遺伝エラー分析

最初に、333 人の参加者から特定された SV に基づいて SV データセット (リポジトリ) を構築した。 次に、リポジトリから 222 人の血縁関係のない個人(つまり、父親と母親)で観察されたSVを抽出し、アレル頻度 (AF) を算出した。 この手順は、親と子孫の間で共有される SV の二重カウントを回避し、SV のアレル頻度の過大評価を防ぐために必要である。 また、トリオベースの分析を利用して、メンデル遺伝エラー率 (MIE率) を評価した。

jMorp Web サイトにおける掲載ページ