2.2. SNV/INDEL ページ
SNV/INDEL ページでは、54KJPN など TMM の全ゲノムパネル に含まれる SNV/INDEL に関する情報が表示されます。
jMorp トップページで dbSNP ID (rsID) や HGVS.p 等で検索を行うと SNV/INDEL 詳細ページが表示されます。 SNV/INDELページには以下のようなパネルが表示されます。
基本情報パネル (ID・ゲノム座標・座標・アノテーション等)
アレル・ジェノタイプ頻度パネル
遺伝子アノテーションパネル
dbNSFP スコアパネル
GWAS 解析結果パネル
LiftOver パネル
ここから先の節では rs671 の SNV/INDEL ページ (https://jmorp.megabank.tohoku.ac.jp/genome-variations/sr-snvindel/06354ff1d08c00000) を利用して 各パネルの内容について説明します。
2.2.1. 基本情報パネル
このパネルには jMorp variation ID / Name (jMorp 上でのSNV/INDELのID・名前)、ゲノム上の座標、アレル、dbSNP ID、 遺伝子アノテーション、ClinVarアノテーション、Japonica Array への搭載状況、およびこのゲノムバリアントと重なっているゲノムバリアント等が表示されます。
Tip
jMorp variation ID や jMorp variation name は jMorp が SNV/INDEL の区別のために用いている ID や 名前です。 SNV/INDEL ごと (chromosome, position, reference allele, alternative allele の組ごと) に付与されています。 jMorp variation ID は VariantKey をベースに、 jMorp variation name は RefSeq の Canonical transcript をベースにしています。
2.2.2. アレル・ジェノタイプ頻度パネル
このパネルには TMM の全ゲノム解析結果 (54KJPN ・ 38KJPN ・14KJPN・8.3KJPN・4.7KJPN・3.5KJPNv2) から算出されたゲノムバリアントのアレル頻度等が表示されます。 比較用に米国 Broad Institute が運用するアレル頻度データベースである gnomAD が公開する世界各地の民族集団ごとの頻度情報も合わせて表示されます。 1行が1集団に対応し、バリアントの品質情報 (Filter列; PASSだと品質が良く、FAILEDだと品質が悪い)・アレル頻度・ Allele Count ・ Allele Number ・ホモでの保有者人数が並んでいます。
show breakdown を押すことで TMMデータは性別ごと・解析プラットフォーム (シークエンサ) ごと、gnomADデータは民族集団ごとの頻度を参照可能です。 上の画像では gnomAD データの breakdown を表示させています。 性別や民族集団名は略語で書かれておりますが、それぞれ以下の意味です。
略語 |
意味 |
---|---|
XY |
男性 |
XX |
女性 |
EAS |
East Asian |
AFR |
African |
AMR |
Admixed American |
NFE |
Non-Finnish European |
PopMax |
Population Max (民族集団ごとに頻度を算出し、その最大値を表示したもの) |
Filter 列にはバリアントの品質情報が記載されています。 TMM の全ゲノムパネルは、VQSR filtering の結果を反映しています。 フィルタリング手法の詳細は https://gatk.broadinstitute.org/hc/en-us/articles/360035531612 や DePristo et al. [13] を参照してください。 gnomAD データセットは、TMMとは別のフィルタリング手法が採用されています。詳細は Karczewski et al. [14] を参照してください。
2.2.3. 遺伝子アノテーションパネル
Gene annotation (function) パネルには、ゲノムバリアントをトランスクリプト配列へマッピングした時のアノテーションが表示されます。 RefSeq 及び GENCODE が配布している遺伝子モデルを元にしています。 アノテーション付けは SnpEff によって行っています。 1行が1トランスクリプト配列に対応し、遺伝子シンボル・トランスクリプト配列のID・アノテーション・ HGVS.c ・ HGVS.p が表示されています。 このテーブルの一番左側にある Protein structure mapping 列からこの変異をタンパク質構造にマッピングした時の結果を見ることができます。 詳細は SNV/INDEL タンパク質構造マッピングツール で説明します。
Gene annotation (LoF & NMD) パネルには SnpEff による LoF (Loss of Function)・NMD (nonsense-mediated decay) の予測結果が (あれば) 表示されます。
2.2.4. dbNSFP スコアパネル
dbNSFP は non-synonymous な SNV に対して種々の有害性予測ツールを実行し、 そのスコアをまとめたデータベースです。jMorp の dbNSFPスコアパネルでは dbNSFP に収録されているスコアのうち Rankscore (予測ツールごとにそのツールが出力する有害性スコアを0~1に正規化したもので、値が高いほど有害度が高い) を表示しています。
プロットには赤いバーと青いバーが含まれています。 赤いバーが有害性予測ツールごとの Rankscore を示しているのに対し、青いバーは個々のツールが出力する Rankscore を纏めたものです。 詳細は dbNSFP Web サイト や 論文 (Liu et al. [15], Liu et al. [16], Dong et al. [17]) を参照して下さい。
2.2.5. GWAS解析結果パネル
jMorp には TMM計画内で行われた GWAS解析結果 (要約統計量ファイル) のレポジトリが搭載されています。 このパネルでは、GWAS解析結果レポジトリからこの変異が有意と判定された解析結果を抽出され、トレイト名・ p-value ・ Beta 値が表示されています。 また、 Manhattan && QQ リンクからGWAS解析の結果 (マンハッタンプロット及びQQプロット) を参照することができます。
2.2.6. LiftOverパネル
このパネルには LiftOver の結果 (異なるゲノム配列における座標) が表示されます。 現在は GRCh37 ・ GRCh38 ・ JG2.1.0 ・ CHM13v2 への変換結果が表示されます。 LiftOver処理には transanno が利用されています。