Geneticist Assistant
cpga.png

NGSヒトバリアントデータ管理&解釈支援ワークベンチ Geneticist Assistant

バリアント解釈支援*バリアント追跡*カバレッジ確認*リソース削減*全てのNGSプラットフォームのデータに対応*ターゲットパネルシーケンス&エクソームシーケンス

Geneticist Assistant(ジェネティシストアシスタント) NGSヒトバリアントデータ管理&解釈支援ワークベンチは、Pathogenic なバリアントを同定することを目的とした、次世代シーケンシングによって得られたヒトバリアントデータの管理・コントロール・ビジュアライゼーション・機能解釈・ナレッジデータベース構築のためのツールです。米メイヨークリニックのLaboratory Medicine, Information Technology, and Health Science Research departmentsとのコラボレーションにより開発されました。

Geneticist Assistantワークベンチは全てのNGSプラットフォームで処理されたデータに対応しています。バリアントデータをVCFファイル(オプションでBAMファイル)によりGeneticist Assistantデータベースへロードし、バリアントの解釈のため、SIFTやPolyPhen2、LRT、Mutation Taster由来の機能予測情報や、PhyloP、GERP++、SiPhy由来のConservation Score、ExAC(Exome Aggregation Consortium)、GnomAD(The Genome Aggregation Database)、Exome Variant Server(EVS)由来の集団頻度情報などを格納しています。またCOSMIC (Catalogue Of Somatic Mutations In Cancer) データベースのSomatic Mutation情報なども簡単にインポート可能です。

バリアント CNV コピー数多型

1サンプルのバリアントリスト:

バリアントテーブルの構成例。各列はカスタマイズして外部データベースの必要な情報フィールドを表示できます。ユーザーは各バリアントのPathogenicityをセットできます。各バリアントのPathogenicityはこのサンプルのみに対してセットするか同じパネルに紐付けられた全てのサンプルの同じバリアントに対してセットするか選択できます。

(図をクリックすると拡大します)

Geneticist Assistantには、バリアントのフィルタリングツールやトリオや家族メンバー間でバリアントを比較できるサンプル比較ツール、カスタムPDFレポートデザインツールなどが搭載されています。またユーザーが設定したクオリティメトリクスを確認することなどが可能です。

バリアント CNV コピー数多型

フィルタリングツール:

このサンプルのバリアントは、GnomADのアレル頻度が0.05より小さいバリアントがハイライトされるよう設定されています。ハイライトオプションを解除するとフィルタリング設定にマッチしたバリアントのみが表示されます。(図をクリックすると拡大します)

Geneticist Assistantは同じSoftGenetics社製の第二世代シーケンサーデータ統合解析ソフトウェアNextGENeと連携することにより、シームレスなパイプラインとしてアライメントからバリアントコール、バリアント解釈までを実行できます。

対応データベース
 機能予測情報:
  SIFT、PolyPhen2、LRT、Mutation Taster、FATHMM、CADD、Mutation Assessor
 疾患関連情報:
  ClinVar、OMIM、COSMIC
 保存スコア:
  PhyloP、GERP++、phastCons、SiPhy
 集団内アレル頻度情報:
  1000 Genomes Project、GnomAD、ExAC、Exome Variant Server(EVS)

dbNSFPに含まれる上記以外の情報のほか、AlamutやLOVDなど外部データベース情報にも埋め込まれたリンクから簡単にアクセスできます。

(Alamutにアクセスするにはライセンスが必要です。)

 

オリジナルバリアントナレッジベースの構築

Geneticist AssistantはNGSヒトバリアントデータの格納と追跡を行うための完全なデータベースソリューションです。バリアント、Patient、サンプル、シーケンス領域のカバレッジなどの情報は、いつでもバリアントを再判定できるように全てデータベースに格納されます。そのため、同じバリアントを何回も調べるような作業の重複による時間や労力の浪費を減らし、コストを抑えながら解析をスピーディーに行えます。データベースを使用することで、解釈が必要な膨大な数のバリアントを、短時間で少数の新規バリアントに絞り込むことが可能です。

各バリアントはPathogenicityをセットしてデータベースに格納することができます。Pathogenicityをセットした後は、同じパネルに紐付けられている同じバリアントを含むサンプルでも同じPathogenicityが自動的に適用されます(あるサンプルのみに適用も可能)。さらに、そのバリアントのGeneticist Assistantデータベース内の頻度を追跡し、同じバリアントをもつ全サンプルのリストを生成できます。

バリアント CNV コピー数多型

サンプルバリアントテーブル:

あるサンプルのバリアントテーブルです。バリアントテーブルには、そのバリアントが他のサンプルも含めてどれくらいの頻度で見られるか表示されます。(図をクリックすると拡大します)

【例」MSH2遺伝子(NM_000251.2)のc.211+9C>Gの場合

(上図バリアントテーブル一番上の行のバリアント)

  • 「Times Observed Per Panel」=7・・・同じパネルに紐づけられた全サンプルのうち、このバリアントが観察された回数

  • 「Samples Per Panel」=9・・・同じパネルに紐づけられたサンプル数

  • 「Frequency Observed Per Panel」=0.778(=7/9)・・・同じパネルに紐づけられた全サンプルにおけるこのバリアントの頻度

Geneticist Assistantを使って、カバレッジ統計量を時間とともに追跡することも可能です。あるパネルの各シーケンス領域にセットされているカバレッジ閾値(カバレッジ%・平均カバレッジ・最小カバレッジ)、そのパネルに紐づいているサンプルの各シーケンス領域におけるカバレッジ関連数値の平均をレポートできます。これらの統計量は同じパネルに紐付けられた全サンプルについて算出するだけでなく、指定した期間内、選択した特定のRunやサンプルグループについても算出できます。

バリアント CNV コピー数多型

Panel Statisticsタブ:

Panel Statisticsタブにはカバレッジに関する統計量がレポートされます。同じパネルに紐付いている全サンプルについての統計量が算出されます。指定した期間や選択したRunやサンプルグループについて算出することも可能です。(図をクリックすると拡大します)

 

バリアントアノテーション - 外部データベース

Geneticist Assistantにロードしたバリアントには、複数のソースからバリアントの解釈や頻度、機能予測、保存スコア、疾患との関連性などの情報が付けられ、一画面で表示されます。一度コールされたバリアントはデータベースに格納され、同じバリアントを含む別のサンプルでも同じ情報が表示されるため、以降の解析で重複する作業を無くし作業にかかる時間と労力を大きく削減できます。

バリアント CNV コピー数多型

1サンプルのバリアントリスト:

1サンプルのバリアントテーブルの構成例。各列はカスタマイズして必要な情報フィールドを表示できます。ユーザーは各バリアントのPathogenicityをセットできます。バリアントのPathogenicityはこのサンプルのみに対してセットするか同じパネルに紐付けられた全てのサンプルの同じバリアントに対してセットするか選択できます。

(図をクリックすると拡大します)

バリアント CNV コピー数多型

1バリアントの詳細情報(Variantタブ)

バリアントリストのバリアントをダブルクリックすると、1バリアントの詳細情報を示すVariantタブが開きます。Variantタブは2つのタイプのペイン(バリアント情報と参照情報)によって構成されています;

バリアント情報

ユーザーによってそのバリアントに指定されたPathogenicityやその変更履歴、その根拠となったサポート情報、コメント、そのバリアントが検出されたデータベース内のサンプルリストなど

参照情報

dbSNPやdbNSFPデータベースなど参照データベース由来のバリアント情報

いつも参照する参照データベースの情報フィールドを選択して、サンプルバリアントリストやVariantタブのトップにあるVariantペインに表示させられます。複数の情報フィールドを使ってカスタムフィールドを作成し表示することも可能です。(図をクリックすると拡大します)

コピー数バリアントデータへの対応​(v.1.8.1より対応)

Geneticist Assistantデータベースはコピー数バリアント(CNV)解析結果に対応しました。Geneticist Assistantは、データベースにインポートされたサンプルのうち同じコピー数バリアントが検出されたサンプルの総数や、各パネルに紐付いている全サンプルやCNVデータがインポートされている全サンプルにおける各コピー数バリアントの頻度をレポートできます。各コピー数バリアントをレビューした後にClassificationを割り当てると、以降同じコピー数バリアントに同じClassificationが表示されます。これにより、以降の解析で重複する作業を無くし、解析作業の効率性を大きく改善できます。
コピー数バリアントコールはGVF形式ファイルを使ってGeneticist Assistantにインポートします。このコピー数バリアントデータも、SNPやIndelなどのバリアントをVCFファイルからデータベースへロードしたサンプルやPatientと紐付けて管理できます。

 
バリアント CNV コピー数多型

1サンプルのコピー数バリアントリスト:

各コピー数バリアントコールとアノテーション、統計量およびユーザーがセットしたClassificationが表示されます。(図をクリックすると拡大します)

アプリケーションノート(SoftGenetics社のWebサイトへ移動します。)

https://softgenetics.com/PDF/GA_CopyNumber_AppNote_2020.pdf

 

フィルタリング - Human Phenotype Ontology(HPO)

サンプルのバリアントをフィルタリングするため様々なオプション機能を利用できます。以下を含むバリアントテーブルの全ての列をフィルタリングに使用できます;;
バリアントに関する統計量
 カバレッジ
 頻度(Geneticist Assistantデータベース内)
 バランスレシオ
外部データベース由来情報
 集団内アレル頻度情報
 臨床的意義情報
 予測スコア
複数のフィルターをANDやOR関係で組み合わせてカスタマイズできます。

バリアント CNV コピー数多型

AND関係を使って追加したフィルター例:

複数フィルターは全て満たされなければいけません。

バリアント CNV コピー数多型

OR関係を使って追加したフィルター例:

複数フィルターのうち1つを満たしたバリアントが残ります。

バリアント CNV コピー数多型

OR関係フィルターを使ってフィルタリングした結果:

指定したPathogenicityのどれかをもつバリアントが残りました。

Human Phenotype Ontology(HPO)

「Gene」列を用いたフィルターでは、Human Phenotype OntologyデータベースのPhenotype情報を使ったフィルタリングを行えます。このPhenotype情報は関連する単語を入力するとオートコンプリート機能によりデータベース内の一致するPhenotype Termが表示されます。Phenotypeを選択するとそのPhenotypeに関連する遺伝子のリストがフィルタリングに使用されます。

 
バリアント CNV コピー数多型

Phenotypeによるフィルタリング:

HPOデータベースのPhenotypeに関連する遺伝子によってフィルタリングされます。

(図をクリックすると拡大します)

 

サンプル比較

Geneticist Assistantでは、血縁関係や表現型情報、遺伝パターンを用いたバリアントの絞り込みや、サンプル間のバリアント比較を行えます。

Family Comparison機能は、血縁関係のある個人のサンプルをシーケンスしたとき、定義した遺伝パターンに一致したバリアントを同定するのに有効なツールです。比較結果として選択した遺伝パターンに一致したバリアントのみFamily Comparisonタブに表示されます。

バリアント CNV コピー数多型

Family Comparisonタブ:

Family Comparison結果には、比較された各サンプルを表す家系図記号とともに、各サンプルについてバリアントアレル頻度(AF:Allele Frequency)やカバレッジ(Cov:Coverage)の値が表示されます。(図をクリックすると拡大します)

Family Comparisonタブの左側に家族情報を使ったバリアント比較結果が表示され、各サンプルのバリアントアレル頻度、カバレッジ(オプション)、リードバランス(オプション)を確認できます。家系図記号上にマウスを合わせると、サンプル名と血縁関係、表現型が表示されます。

この機能を使用するために、家族の複数メンバーのVCFファイルをインポートできます。Patient Import機能を使って血縁関係をもつ患者全ての患者IDや表現型情報、血縁関係情報をインポートすることが可能です。インポートしたサンプルは自動的に適切な患者IDに紐付けられます。Family Comparison機能は少なくとも両親と1人の子供のデータがあれば使用できます。子供のデータはいくつでも比較可能です。

バリアント CNV コピー数多型

Family Comparison設定:

RelationshipやPhenotypeなどFamily Comparison機能のオプションは、データベース内にその情報があればデータベース内の患者IDに基いて自動的に選択されます。ドロップダウンリストから手動で選択することも可能です。(図をクリックすると拡大します)

血縁関係の無いサンプルを比較する際はCompare Samplesオプションを使用できます。Compare Samples機能では、バリアントを共有しているサンプル数や、サンプル間のバリアントアレル頻度差、バリアントアレル頻度範囲を指定してバリアントを探すことができます。

バリアント CNV コピー数多型

Sample Comparison設定:

オプションは指定した数のサンプルが共有しているバリアントや指定した範囲内のアレル頻度をもつバリアントをレポートするのに使用できます。また使用したパネルやPathogenicityでのフィルタリングも行えます。(図をクリックすると拡大します)

レポートデザイナーツール

Geneticist Assistantでは、レポートデザイナーツールを使ってカスタムレポートテンプレートを作成できます。このテンプレートを使って各サンプルや各Patientの標準レポートを迅速かつ簡単に生成できます。レポートデザイナーツールでは、ユーザーはレポートに含めるコンテンツを選択し、レポートヘッダやページヘッダ、ラボのロゴのようなレポートのフォーマットを定義することが可能です。

 
バリアント CNV コピー数多型

PDFレポートデザイナー:

カスタムPDFレポートのテンプレート作成では、データベースフィールドの選択やカスタムテキストやカスタム画像の追加、フォント・レイアウト・境界などフォーマットの定義を行います。

(図をクリックすると拡大します)

カスタムテーブルはバリアント情報やPatient詳細情報などのデータをGeneticist Assistantデータベースから直接引き出して作成されます。メソッドや臨床的情報、免責条項などを追記するためにカスタムテキストフィールドも追加できます。カスタムセクションはレポートデザイナーツールでレポートテンプレートを作成しているときに追加することが可能です。このレポートテンプレートは保存レポートの一つとして保存できます。複数のレポートタイプを生成するため複数のレポートテンプレートを作成することも可能です。

レポートテンプレートはシングルクリックで適用され、任意のサンプルやPatientのPDFレポートを保存できます。

バリアント CNV コピー数多型

PDFレポートのエクスポート:

サンプル個々のPDFレポートや複数サンプルのバッチレポートを迅速にエクスポートします。(図をクリックすると拡大します)

Patient情報

Geneticist AssistantではPatient情報をインポートしてPatient情報とサンプル情報を関連付けることが可能です。複数Patientの情報もテキストファイルからバッチインポートできます。各Patientに付随する情報フィールドはカスタマイズでき、カスタム情報フィールドはテキストファイルに記述してデータベース内のPatient情報に追加することが可能です。Patient間の関係性もテキストファイル内で定義できます。Patient情報はすでに保存したレポートに追加することも可能です。

 
バリアント CNV コピー数多型

Patient情報のバッチインポート:

カンマ区切りテキストファイルかタブ区切りテキストファイルをロードしてPatient情報をバッチインポートできます。テキストファイルにはPatientに付随させるカスタム情報フィールドを追加できます。(図をクリックすると拡大します)

pi_2_edited.jpg

Patient詳細:

インポートしたPatient情報はPatientタブで確認できます。(図をクリックすると拡大します)

 

外部プログラムへのリンクと連携

NextGENe、IGV、Alamut、UCSCなど外部プログラムやツールへのダイレクトリンクが組み込まれています。またExome Variant ServerやdbSNP、ClinVarなどバリアントデータベースのハイパーリンクも使用できます。

バリアント CNV コピー数多型

外部プログラムへのリンク:

NextGENe、IGV、Alamut、UCSCでバリアントを閲覧するためのダイレクトリンク

(図をクリックすると拡大します)

リファレンスゲノム:GRCh37

対応ファイル形式

サンプルデータ:VCF(Variant Call Format)ファイル(オプション:BAMファイル)

サンプルデータ(CNV):GVF(Genome Variation Format)ファイル

 
 

動作環境

サーバー(データベース含む)

OS:64 bit Windows® 7, 8, 10, Server 2008R2, 2012, 2016

         64 bit Linux (Ubuntu 10.04以降)

CPU:4コア 
動作メモリ: 8GB RAM
必要HDD容量:100 GB 空き容量(1TB SSD
推奨)

​クライアント

OS:64 bit Windows® 7, 8, 10, Server 2008R2, 2012, 2016

CPU:4コア 
動作メモリ: 8GB RAM
必要HDD容量:500GB 空き容量

ライセンス・価格・納期等

 

カタログおよびユーザーマニュアル

 

​簡易カタログ(日本語)

Brochure (ENG)

ユーザーマニュアル(日本語)

User's manual (ENG)

​関連商品

 
 

第二世代NGSデータ解析ソフトウェア

バリアント CNV コピー数多型

サンガーシーケンス変異解析ソフトウェア

バリアント CNV コピー数多型

DNAフラグメント解析ソフトウェア

 
バリアント CNV コピー数多型
 
 
 

※本製品は研究用です。研究用途以外の目的で使用しないでください。

記載の社名および製品名は、SoftGenetics社または各社の商標または登録商標です。

Geneticist Assistant, がんパネル, 遺伝子パネル