本期,边肖将给大家带来KEGG基因组数据库的原理。文章内容丰富,从专业角度进行分析和描述。看完这篇文章,希望你能有所收获。
kegg基因组由三个数据库组成:生物体、选定病毒和元基因组。
Kegg生物体数据库包含具有完整基因组序列的物种信息。对于每个物种,有两种表示:
三个字母或四个字母的物种代码称为组织代码。比如,人对应的组织编码是HSA,鼠标对应的组织编码是mmu。
T数,对于生物中的所有物种,开头都是T0,比如人类对应的T数是T01001
以人类为例,链接是
http://www.kegg.jp/kegg-bin/show_organism?org=hsa
生物体数据库记录以下信息:
除了T号、组织编码等基础信息外,还包括分类学等其他信息。在这些详细的信息中,数据源代表基因组序列的源数据库,通常是Refseq或Genebank原始数据库是另一个物种特定的数据库。单击蓝色单词跳转到相应的数据库。其实这就是综合数据库的价值所在。你只需要在综合数据库中浏览,就知道与这个物种相关的数据库有哪些,就可以轻松跳转到感兴趣的数据库。
精选病毒数据库包含与人类或植物病理学相关的病毒信息,不同的病毒通过T数进行区分。所有病毒的T数以T4开头,如T40218。
http://www.kegg.jp/dbget-bin/www_bget?gn:T40218
病毒数据库还将提供病毒宿主和相关疾病等详细信息。
宏基因组数据库包含了一些关于环境微生物的信息,主要包括口腔、肠道、空气、皮肤和泌尿生殖系统,其中大部分是口腔和肠道微生物。对于环境微生物,每个物种的T数从T3开始。
kegg官网提供的基因组数据库示意图如下:
Kegg为生物数据库中的物种提供了一个简单的分类系统,不同于NCBI的分类数据库。
00-1010 Kegggenome数据库存储物种信息,由生物、病毒、宏基因组三个数据库组成。
每个物种都由T Number唯一识别,生物中的所有物种都从T0开始,病毒中的物种从T4开始,元基因组中的物种从T4开始。
Kegg有一个相对简单的物种分类系统,叫做kegg分类法,它不同于ncbi分类法。
上面边肖分享的KEGG基因组数据库的原理是什么?如果你恰好也有类似的疑惑,可以参考上面的分析来理解。想了解更多,请关注行业信息渠道。
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/130723.html