本文是关于如何理解ArrayExpress数据库的。边肖觉得很实用,所以分享给大家学习。希望你看完这篇文章能有所收获。我们就不多说了。让我们和边肖一起看看。
与GEO数据库类似,ArrayExpress是EBI拥有的公共数据库,用于存储与芯片和高通量测序相关的数据。
数据来自下图所示的两部分。
第一部分是科研人员提交的数据,第二部分是从GEO数据库自动导入的数据。在这个数据库中,数据基于实验实验,每个实验对应一个唯一的数字,如下图所示。
第一列中的“访问”代表与每个实验设计相对应的数字,“测定”代表与实验相对应的样本总数,“原始”代表原始数据。当前版本数据量如下
通过这个数据库,我们可以
检索数据,根据关键词、数字等找到感兴趣的数据集。
下载数据并基于公共数据进行分析和挖掘。
提交数据并将您自己的数据上传到数据库。
点击每个实验号显示详细信息,如下图所示。
红框标注的部分是平时要注意的三个部分。第一部分展示了实验中包含的样本的详细信息。单击后,您可以查看与样本相关的元数据,如下所示。
第二部分用于下载数据,第三部分用于将结果导入其他软件,如GenomeSpace,进行分析和查看。
除了下载和分析公共数据集,您还可以将自己的数据上传到数据库。除了与元基因组/元翻译体和转录组组装相关的数据外,其他大部分数据都可以上传到数据库,如SNP分型、基因表达谱、chip_seq、atac_seq、甲基化测序等结果。
数据库还配备了相应的API和R包,可以批量、分流程的检索和下载数据。如果没有数据,也可以基于ArrayExpress的公共数据进行深度挖掘。
以上就是如何理解ArrayExpress数据库。边肖认为,一些知识点可能会在我们的日常工作中看到或使用。我希望你能通过这篇文章学到更多的知识。更多详情请关注行业信息渠道。
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/112503.html