国际三大数据中心(NCBI、EBI、DDBJ)对全球生物数据长期占据着主导地位,北京基因组研究所生命与健康大数据中心(BIG Data Center),作为基因组所的重要研究单元,承担相关公共数据库资源体系的研究与建设,面向我国人口健康和社会可持续发展的重大战略需求,围绕国家精准医学和重要战略生物资源的组学数据,建立海量生物组学大数据储存、整合与挖掘分析研究体系,发展组学大数据系统构建、挖掘与分析的新技术、新方法,建设组学大数据汇交、应用与共享平台。
近日,中国科学院北京基因组研究所生命与健康大数据中心团队题为“The BIG Data Center: from deposition to integration to translation”的研究论文被国际学术期刊《核酸研究》(Nucleic Acids Research)在线发表。该研究成果的发表是国内首次以数据中心为模式,整体发布我国生命组学数据资源建设情况,标志着生命与健康大数据中心建设取得实质性重要进展,也标志着我国建设综合性基因组数据资源获得国际同行认可。
生命与健康大数据中心建成面向国家大数据发展战略的多层次生物组学数据资源系统,包括基于高通量测序的原始组学数据归档库(Genome Sequence Archive,GSA),围绕国家重要战略生物资源的基因组组数据库(Genome Warehouse,GWH),基于测序数据的基因表达数据库(Gene Expression Nebulas,GEN),基于中国人群以及国家重要物种群体的基因组变异数据库(Genome Variation Map,GVM),基于全基因组DNA甲基化图谱的表观基因组数据库(Methylation Bank,MethBank)以及基于大众审编(Community Curation)的生命科学维基知识库(Science Wikis),初步形成我国生命与健康数据汇交与共享平台,具备可服务于全球的基因组数据共享网络。
生命与健康大数据中心章张研究员、赵文明高级工程师以及肖景发研究员为本文共同通讯作者。该研究得到中国科学院战略性先导科技专项、中国科学院国际大科学计划、国家863项目、国家973项目、国家自然基金项目、中国科学院百人计划等项目基金的资助。
论文链接:http://nar.oxfordjournals.org/content/early/2016/11/28/nar.gkw1060.full
(据中国科学院北京基因组研究所)
原创文章,如若转载,请注明出处。