本期,边肖将给大家带来KEGG网络数据库的原理。文章内容丰富,从专业角度进行分析和描述。看完这篇文章,希望你能有所收获。
Kegg矫形学数据库是kegg的核心。利用不同物种之间的基因保守性,我们可以在更高的水平上解释基因功能。data、brite、module等数据库都是基于KO数据库,所以任何基因组数据都可以映射到这些数据库。当然,这种方法也有其局限性。在某种程度上,它忽略了特定物种中基因的变异信息。
对于人类来说,网络数据库不仅提供了基因的功能和相互作用,还包含了基因的变异信息,与疾病进一步相关。
以上是kegg官网提供的示意图。KO是基于不同物种基因的同源性,通路利用KO注释信息提供跨物种通路信息,而网络数据库是从通路数据库扩展而来的。在Pathway的基础上,还包括了基因变异信息(包括SNP、基因融合等结构变异现象和基因表达变化),为人类基因相关变异和疾病的研究提供了更详细的参考信息。
网络数据库中的每条记录都被称为网络元素,由N个数字唯一标识。它记录了基因之间的相互作用网络。因为网络来自路径数据库,所以每条记录都会有相应的路径信息。在这些通路图中,基因将被特别标记,如对应于N0002的hsa05220通路。
上图中,用粉色标注的方框是网络中记录的基因,而突变的基因在粉色方框中用红色显示。
为了记录N0002
Defiinition字段记录基因之间的相互作用信息,其中ABL基因发生突变,产生BCR-ABL融合基因,从而导致疾病。结合上面的通路图一起理解,我们可以看到BCR-ABL在通路图中用粉色方框和红色字体标注,而其他记录的基因只用粉色方框标注;
在网络中,所有的记录都分为三类。
参考文献,这些网络只从通路中提取基因的相互作用信息;
变体,基于原始基因相互作用,包含基因的变异信息;
病毒在原有基因相互作用的基础上,包括病毒入侵基因引起的相互作用的变化。
在下面的链接中,您可以看到
http://www.kegg.jp/kegg-bin/show_network?id=nt06201cancer=1
第一列是对应网络数据库中的记录;第二列各种颜色的小方块代表与网络相关的疾病,不同的疾病用不同的颜色标注;其他是这个网络中记录的基因之间的相互作用,其中绿色代表参考,红色代表变体,粉色代表病毒。
我们可以看到参考网上没有相关的疾病信息,只有变种和病毒才能看到相关的疾病信息。
红色链接可以与变异体的详细信息相关,例如EGF*代表的具体变异信息为1950v1,代表EGF基因的过表达;粉色链接链接到KO数据库,该数据库提供了关于该基因功能的特定信息,例如,vK1是病毒基因;
总结
网络数据库是专门为人类设计的,从通路数据库中提取基因之间的相互作用,构建了相互作用网络。
该数据库还涉及基因变异、外来基因入侵和疾病信息。在整个数据库中,可以分为三类:参考网络,直接从通路中提取基因的相互作用;变体网络,包含基因的变异信息,包括结构变异和表达变异;病毒网络,包含病毒入侵生物体的遗传信息。对于变种和病毒网络,也会给出相关的疾病信息。
Network也有相关的通路图,其中记录的基因用粉色方框突出显示;
以上边肖共享的KEGG网络数据库的原理是什么?如果你恰好也有类似的疑惑,可以参考上面的分析来理解。想了解更多,请关注行业信息渠道。
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/130722.html