日本語
 
Help Privacy Policy ポリシー/免責事項
  詳細検索ブラウズ

アイテム詳細

  The SYSTERS protein family database: taxon-related protein family size distributions and singleton frequencies

Meinel, T., Vingron, M., & Krause, A. (2003). The SYSTERS protein family database: taxon-related protein family size distributions and singleton frequencies. In H.-W., Mewes, D., Frishman, V., Heun, & S., Kramer (Eds.), Proceedings of the German Conference on Bioinformatics (GCB '03) (pp. 103-108).

Item is

基本情報

表示: 非表示:
資料種別: 会議論文

ファイル

表示: ファイル
非表示: ファイル
:
gcb2003_meinel.pdf (全文テキスト(全般)), 162KB
ファイルのパーマリンク:
https://hdl.handle.net/11858/00-001M-0000-0010-8B29-C
ファイル名:
gcb2003_meinel.pdf
説明:
-
OA-Status:
閲覧制限:
公開
MIMEタイプ / チェックサム:
application/pdf / [MD5]
技術的なメタデータ:
著作権日付:
-
著作権情報:
eDoc_access: PUBLIC
CCライセンス:
-

関連URL

表示:

作成者

表示:
非表示:
 作成者:
Meinel, Thomas1, 著者
Vingron, Martin2, 著者           
Krause, Antje1, 著者
所属:
1Max Planck Society, ou_persistent13              
2Gene regulation (Martin Vingron), Dept. of Computational Molecular Biology (Head: Martin Vingron), Max Planck Institute for Molecular Genetics, Max Planck Society, ou_1479639              

内容説明

表示:
非表示:
キーワード: protein family; large scale clustering; taxonomy; taxon-related; cluster size distribution
 要旨: Based on the SYSTERS protein family database, we present taxon-related protein family frequencies and distributions. A set of taxon-related protein families is a subset of the whole family set with respect to one taxon, where taxon is not restricted to the species level but may be any rank in the taxonomy. We examine eight ranks in the lineages of seven organisms. A strong linear correlation is observed between the total number of different families and the number of sequences in the data set under consideration. We fitted the generalised power-law function to protein family distributions in a least-squares sense excluding singleton frequencies. Taxon-related family distributions tend to have the same shape and a negative slope being not larger than -2.1 for large data sets. For smaller data sets, the slope is decreasing down to -3.7. Slopes of family distributions are found to be slowly increasing towards higher taxonomic ranks. Our observations lead to a new estimation of single sequence cluster frequencies. Data sets of various species are studied with respect to being complete or incomplete.

資料詳細

表示:
非表示:
言語: eng - English
 日付: 2003
 出版の状態: 出版
 ページ: -
 出版情報: -
 目次: -
 査読: -
 識別子(DOI, ISBNなど): eDoc: 175889
 学位: -

関連イベント

表示:
非表示:
イベント名: German Conference on Bioinformatics
開催地: Neuherberg/Garching near Munich
開始日・終了日: 2003-10-12 - 2003-10-14

訴訟

表示:

Project information

表示:

出版物 1

表示:
非表示:
出版物名: Proceedings of the German Conference on Bioinformatics (GCB '03)
種別: 会議論文集
 著者・編者:
Mewes, H.-W., 編集者
Frishman, D., 編集者
Heun, V., 編集者
Kramer, S., 編集者
所属:
-
出版社, 出版地: -
ページ: - 巻号: - 通巻号: - 開始・終了ページ: 103 - 108 識別子(ISBN, ISSN, DOIなど): -