transparent KEGG   KEGG2   PATHWAY   BRITE   MEDICUS   DBGET  

GenomeNet [ English | Japanese ]
Search for

line
ゲノムネット
 ゲノムネットとは
 お知らせ
 謝辞
統合データベース
 統合DBの概要
 DBGETの概要
 リリース情報
医薬品データベース
KEGG
varDB
研究支援データベース
計算ツール
FTP
フィードバック

DBGET の概要

1. 分子生物学データのウェブ

DBGET システムはゲノムネットのバックボーンとなる検索システムです。そこではデータベースはエントリーという単位の集合として取り扱われます。既存の分子生物学関連データベースのほとんどは、このような単純な見方で(すなわち、フラットファイルとして)眺めることができます。各エントリーにはエントリー名(またはアクセッション番号)というデータベース内でユニークな名前がつけられていますので、
データベース名:エントリー名
の組を与えると、世界中に存在する数多くのデータベースを統合的に参照することができるわけです。また、KEGG にある生物種ごとの遺伝子やタンパク質は
生物種名:遺伝子名
により、やはり DBGET で統合的に検索することができます。

分子生物学の分野では異なるデータベースに関連するデータがあれば、それにリンクを付加してデータベース化が行われています。文献データと文献に報告された配列データとの関連、塩基配列とそれを翻訳したアミノ酸配列の関連などが代表例です。このリンク情報は
データベース1:エントリー1 → データベース2:エントリー2
の形で表現され、これを2項関係といいます。DBGET では LinkDB と呼ぶ2項関係だけのデータベースをもっており、2項関係を演繹して(組み合わせたり、逆向きにたどったりして)新たな2項関係を作ることにより、多くの関連データを容易に見いだせるようになっています。また、リンクはゲノムネットの外のデータベースにも多数つけられており、より専門的なデータベースで細かな情報を調べることができるようになっています。

2. データベースの分類

DBGET/LinkDB システムでは多数のデータベースを統合するために、データベース利用条件の違い(ミラリング可、キーワードインデクシング可、リンクのみ)を考慮して、各データベースを以下の5つのカテゴリーに分類しています。

カテゴリー検索コマンド備考
bgetbfindblink
1. KEGGデータベースyesyesyesゲノムネットでミラリング
2. その他のDBGETデータベースyesyesyes
3. Web上の検索可能データベースnoyesyes各サイトのサービスを利用
4. Web上のリンクのみのデータベースnonoyes
5. PubMedデータベースyesnoyes

3. KEGGデータベース (カテゴリー1)

ゲノムネットが提供するKEGGデータベースは以下の通りで、多くのものは毎日更新されています。

データベース内容備考
brite 機能階層・オントロジー KEGG BRITE
pathway パスウェイマップ KEGG PATHWAY
module KEGG モジュール
network 疾患関連のネットワーク要素 KEGG NETWORK
variant ヒト遺伝子バリアント
disease 疾患 KEGG DISEASE (日本語)
drug 医薬品 KEGG DRUG (日本語)
dgroup 医薬品グループ
orthology オーソログ (KO) グループ KEGG ORTHOLOGY
genome KEGG生物種 KEGG GENOME
mgenome メタゲノム
genes 高精度ゲノム中の遺伝子カタログ KEGG GENES
mgenes メタゲノム中の遺伝子カタログ
compound 化合物 KEGG COMPOUND
glycan 糖鎖 KEGG GLYCAN
reaction 化学反応 KEGG REACTION
rclass 反応クラス
enzyme 酵素分類
expression マイクロアレイ遺伝子発現プロフィール 著者による登録

4. その他のDBGETデータベース (カテゴリー2)

ゲノムネットがミラリングしているデータベースは以下の通りです。

データベース内容元サイト
refseq refnuc 核酸塩基配列 NCBI
refpep タンパク質アミノ酸配列
uniprot swissprot ExPASy / EBI
trembl
refgene rg001 OM-RGC: Ocean microbial reference gene catalog EMBL
rg002 IGC: Integrated reference catalog of the human gut microbiome BGI / EMBL
rg003 MATOU: Marine Atlas of Tara Oceans Unigenes Tara Oceans
pdb タンパク質立体構造 RCSB
pdbstr PDBアミノ酸配列 京都大学
epd 真核生物プロモーター ISREC
motifdic prosite タンパク質配列モチーフ ExPASy
pfam EBI
ncbi-cdd NCBI
pmd 変異タンパク質 国立遺伝学研究所
aaindex アミノ酸指標 京都大学
carbbank 糖鎖構造 (更新なし) 帝京大学/ジョージア大学
prosdoc PROSITE文献 ExPASy

5. Web上の検索可能データベース (カテゴリー3)

ゲノムネットでキーワード検索のみできるデータベースは以下の通りです。

データベース内容元サイト
insdc genbank 核酸塩基配列 NCBI
ddbj 国立遺伝学研究所
embl EBI
ncbi-gene Entrez 遺伝子データベース NCBI
ensembl 真核ゲノムアノテーション Ensembl
hgnc ヒト遺伝子名 HGNC
hmdb ヒトメタボローム HMDB
go 遺伝子オントロジー GO
brc-dna ヒト完全長cDNAクローン 理研BRC
interpro タンパク質ファミリー・ドメイン EBI
pubchem PubChem 化合物データベース NCBI
chebi ChEBI 化合物データベース EBI
pdb-ccd PDB リガンド辞書 PDB
lipidmaps 脂質代謝 LIPIDMAPS
knapsack 植物二次代謝産物 KNApSAcK
3dmet 天然化合物の立体構造 3DMET
ligandbox 医薬品の立体構造 LigandBox
sider 医薬品の副作用 SIDER

参考文献

  1. Kanehisa, M.; Linking databases and organisms: GenomeNet resources in Japan. Trends Biochem Sci. 22, 442-444 (1997). [pubmed]
  2. Fujibuchi, W., Goto, S., Migimatsu, H., Uchiyama, I., Ogiwara, A., Akiyama, Y., and Kanehisa, M.; DBGET/LinkDB: an integrated database retrieval system. Pacific Symp. Biocomputing 1998, 683-694 (1997). [pubmed]

    (DBGETのルーツは1980年代にGenBankのために開発されたIDEASシステムです)
  3. Kanehisa, M., Klein, P., Greif, P., and DeLisi, C.; Computer analysis and structure prediction of nucleic acids and proteins. Nucleic Acids Res. 12, 417-428 (1984). [pubmed] [pdf]
  4. Kanehisa, M.I.; Los Alamos sequence analysis package for nucleic acids and proteins. Nucleic Acids Res. 10, 183-196 (1982). [pubmed] [pdf]

Last updated: June 27, 2019
line
京都大学化学研究所バイオインフォマティクスセンター