GTOPとは?
GTOPデータベースは、ゲノムにコードされる全タンパク質の配列データを解析した結果を まとめたデータベースです。 国立遺伝学研究所の 旧大量遺伝情報研究室 で製作されました。配列相同性解析を 主な手段として、立体構造の情報を積極的に利用していること が特徴です。
以下の方法を使って解析しています。
対PDBの配列相同性検索。Reverse PSI-BLASTを使用。
よくアノテートされた配列データベース(Swissprot)に対する 配列相同性解析。BLASTを使用。
現時点で解析が終わっている種については Organismの ページをご覧ください。
Organismのページから遺伝子の解析結果へアクセスすることが出来ます。
遺伝子ごとに下のような画面が表示されます。これは ヒトのENSG00000196876.3という遺伝子の場合の例です。 ( ENSG00000196876.3のページを見る)
先頭には生物種名(1)、GTOPで用いられる遺伝子名(2)、ゲノムプロジェクトにより 割り当てられたアノテーション(3)、Swiss-Protのエントリ(4)が記述してあります。 Homologs GTOPで解析された生物種にホモログがあるか否かを示しています。 --- 5 古細菌、真正細菌、真核生物、ウイルスの順にホモログの有る生物種の数が表示されています。 表示内容は、[ホモログの有る生物種数]/[生物種総数]となっています。 界名をクリックすると、各界ごとに生物種名とホモログのリストが表示されます。(ホモログリストのページを見る)
SECSTR 予測された2次構造を表します。マジェンタがαヘリックス、黄色がβシートです。 --- A
PSIPRED: PSIPREDにより予測された二次構造。マジェンタがαヘリックス、黄色がβシートです。 --- B
DISOPRED:DISOPRED2により予測された天然変性領域。変性領域は灰色で表示されます。 --- C
BLT:PDB: BLASTによる対PDBに対するアライメント領域。 --- D
類似領域、PDBコード、Evalue、類似度が示されます。
この例では、thrAのアミノ酸550-785残基が、PDBの1ebfAにヒットし、Evalueは2e-36、類似度は%identityで36.8%、となっています。
RPS:PDB: Reverse PSI-BLASTによる対PDBに対するアライメント領域。 --- E
類似領域、PDBコード、Evalue、類似度が示されます。
RPS:SCOP: Reverse PSI-BLASTによる対SCOPに対するアライメント領域。 --- F
類似領域、PDBコード、Evalue、類似度が示されます。対PDBと異なりドメインごとの予測の情報を得ることができます。
HMM:SCOP:HMMerによるSCOPに対するアライメント領域 --- G
類似領域、PDBコード、SCOPコード、SCOPファミリーのゲノムでの分布(*をクリックで表示)、Evalue、類似度が表示される。
RPS:PFAM: Reverse PSI-BLASTによる対PFAMに対するアライメント領域。 --- H
類似領域、PFAMコード、PFAMのDescription、Evalue、類似度が示されます。
HMM:PFAM:HMMerによるPFAMに対するアライメント領域 --- I
類似領域、PFAMコード、PFAMドメインのゲノムでの分布(*をクリックで表示)、PFAM名、Evalue、類似度、類似領域長/PFAMドメイン長が表示される。
BLT:SWISS: BLASTによる対SWISSPROTに対するアライメント領域。 --- J
類似領域、SWISSPROTコード、Evalue、類似度が示されます。
PROS: ProSiteモチーフの見られる領域です。 --- K
ProSiteのホームページでモチーフの情報を見ることができます。
REPEAT: 繰り返し配列が現れる領域です。 --- L
TM: SOSUIで予測された膜貫通ヘリックス領域です。 --- M
COIL: coiled-coilが予測された領域を表示します。 --- N
SEG: SEGにより見つけられた、同じアミノ酸が連続するような配列複雑性の低い領域をあらわします。 --- O
EXONS: エクソンごとに緑・青で色分けされ表示される。 --- P
Function: Gene Ontologyによる機能分類が表示されます。 --- 8SeqInfo: バー表示をアミノ酸配列上に表示します --- 9
AminoSeq: FASTA形式のアミノ酸配列が表示されます --- 10
See neighbor genes: ゲノム上前後にあるORFのリストが表示されます。オペロン構造などを考える上で便利です。 --- 11
Link to: 他のデータベースへのリンクです。 --- 12
Abbreviation: このページで使用される略号の説明です。略号はマスターファイル(以下参照)のヘッダと共通です。 --- 13
予測されたPDBコード、例えば上図の1ebfA をクリックすると、以下のような構造とのアライメント を見ることができます (1ebfAのアライメントを見る)。 さらにそれらの立体構造を表示させるには3つの方法(画像、Chime-plugin、rasmol) の3つの方法があます。画面上のアイコン、[3D(image)]、[3d(Chime-plugin)]、[3D(rasmol)]で表示できます。Chime-pluginとrasmolについては お使いのブラウザを設定する必要があります。この設定の詳細については 「立体構造を表示する方法」のページ をご覧ください。
遺伝子がいくつかのエクソンから成り立っている場合、アライメント上にエクソン毎に色分けされた マーキングを表示できます。


また、これ以外にも下記の4つの検索が可能です。
ゲノム全体の各種の統計データをまとめたまとめのページを見ていただくと、全てのタンパク質のリスト、Reverse PSI-BLASTで新たに構造予測された タンパク質のリスト、 予測構造のSCOPファミリーのランキング、 ProSiteモチーフのランキング、 Pfamファミリーのランキング などを見ることができます。 これらには対応する遺伝子のページへのリンクが貼ってあります。
○GTOPに関する質問・コメントは
にお寄せください。