学科发展2035
随着生命科学的蓬勃发展,我国产出的生物数据呈爆发式增长态势。国内一些优秀的生物信息团队在近些年纷纷脱颖而出,在机遇与挑战并存的生物大数据时代,已经形成有一定研究基础和特色的数据资源。尤其是近年来,国家部署一系列数据中心的建设,已经形成多个具有一定国际竞争力的支撑公益性科学研究的国家级中心和平台。
面对我国生物大数据安全、共享和利用存在的问题和挑战,几代科学家一直呼吁建设我国自己的生物信息中心,这引起了国家层面的高度重视。我国陆续出台了《科学数据管理办法》《国家健康医疗大数据标准、安全和服务管理办法》《中华人民共和国人类遗传资源管理条例》。 2019 年 11 月 13 日,经中央机构编制委员会批准,中央机构编制委员会办公室发文,在中国科学院北京基因组研究所加挂“国家生物信息中心”(China National Center for Bioinformation, CNCB)牌子,整合中国科学院和全国优势力量,建设国家生物信息中心,它主要承担我国生物信息大数据的统一汇交、集中存储、安全管理、开放共享,以及前沿交叉研究和转化应用等工作。截至 2020 年 10 月,根据其官网信息,国家生物信息中心已经为国内外 270 多个单位提供免费
数据管理服务,用户提交的数据量超过 6280TB,建设形成有组学原始数据
尤其值得注意的是,在 2019 年新冠疫情暴发伊始,国家生物信息中心快速组建科研攻关团队,于 2020 年 1 月 22 日正式发布 2019 新型冠状病毒信息库( RCoV19)( Zhao et al., 2020)。该信息库是全球第一个公开发布的针对新冠病毒的专业库,整合了来自德国全球流感共享数据库( Global Initiative on Sharing All Influenza Data, GISAID)、美国国家生物技术信息中心等机构公开发布的新冠病毒核苷酸和蛋白质序列数据、元信息、学术文献等信息,开展了病毒基因组数据质控、整合分析及其变异动态监测等多方位研究,现在已经成为全球最大、数据最全的新冠病毒库( Song et al., 2020)。根据官网信息,截至 2020 年 10 月 26 日, RCoV19 已经收录全球范围内产出的 161 014个新冠病毒基因组序列,为全球 175 个国家和地区提供数据服务,累计数据下载超过 1.69 亿次,为全球抗疫提供重要数据资源和共享平台,获得国内外重要机构和组织的肯定和认可。
2019 年 6 月,科学技术部、财政部联合发布了《科技部 财政部关于发布国家科技资源共享服务平台优化调整名单的通知》,公布了不同学科领域的 20 个国家科学数据中心。其中,国家基因组科学数据中心( National Genomics Data Center, NGDC)依托中国科学院北京基因组研究所(国家生物信息中心)建设,共建单位包括中国科学院上海营养与健康研究所和中国科学院生物物理研究所( CNCB-NGDC Members & Partners, 2022)。
国家基因组科学数据中心是针对我国基因组数据“存管用”的实际需求及“数据孤岛”“数据主权”等重大问题而组建的,围绕人、动物、植物、微生物等基因组数据,重点开展基因组科学数据管理,建立基因组数据资源体系与开放共享平台,开展数据服务、数据管理、数据挖掘、技术研发等工作,提供基因组科学数据统一存储、整合挖掘、共享应用的一站式数据服务。目前,国家基因组科学数据中心已经拥有自主知识产权的组学数据汇交、管理与共享系统, 2018~2020 年连续三年被生物信息学领域国际权威期刊《核酸研究》称为“全球主要生物数据中心”之一。
深圳国家基因库由深圳华大生命科学研究院(原深圳华大基因研究院)组建,于 2016 年 9 月正式运营,主要涵盖“三库两平台”,即生物信息数据库、多样性生物样本和物种遗传资源库和生物活体库,以及数字化平台、合成与编辑平台( Chen et al., 2020)。
中国科学院生物物理研究所健康大数据研究中心主要开展的是大数据分析和疾病研究。该研究所与中国科学院计算技术研究所共同开发和维护的非编码 RNA 数据库( NONCODE)是国际上较有影响力的非编码 RNA 综合数据平台( Zhao et al., 2016),该中心是国家生物信息中心建设单位之一和国家基因组科学数据中心的成员单位。
该中心致力于微生物信息资源的电子化和网络信息共享,建立了全球微生物菌种目录、全球保藏中心名录等一系列微生物专业数据库( Wu and Ma,2019),是世界微生物数据中心新的主持单位。 2019 年 6 月,国家微生物科学数据中心落户中国科学院微生物研究所。
中国科学院上海营养与健康研究所生物医学大数据中心(原隶属于中国科学院—马普学会计算生物学伙伴研究所)成立于 2016 年,承担了国家科技重大专项、地方政府科技专项等生物医学大数据共享平台建设项目,是国家生物信息中心建设单位之一和国家基因组科学数据中心的成员单位,建设的国家组学数据百科全书( NODE)是国家生物医学数据共享汇交技术平台之一。
该中心成立于 2002 年,是上海市指定的科技计划数据汇交管理机构,建立和完善了基因组功能注释、生物芯片数据分析和蛋白质组数据分析技术平台,并建立了人类疾病相关基因的高通量生物信息学筛选技术体系。其主要数据库有肝细胞癌预后分子标志物数据库( dbPHCC)( Ouyang et al., 2016)、人类癌症蛋白质组变异数据库( CanProVar)( Zhang et al., 2017)等。
该中心下设生物信息平台,主要对蛋白质组数据进行采集、处理PG电子通信和标准化,为中心管理实验技术平台的数据统计解释提供信息支持,同时提供主要的生物信息和蛋白质数据公共资源,其中最重要的是蛋白质组整合资源库( Integrated Proteome Resources, iProX, )。 iProX 是一个蛋白质组数据资源共享系统,目的是支撑中国人类蛋白质组计划( Chinese Human Proteome Project, CNHPP)和促进蛋白质数据共享,该数据库具有提交功能( Chen et al., 2022)。
该平台于 2004 年正式运营,承担国家科技重大专项、科技计划、重大公益专项等人口健康领域科学数据汇交、数据加工、数据存储、数据挖掘和数据共享任务,服务于科技创新、政府管理决策、医疗卫生事业的发展。
本文摘编自《中国生物信息学2035发展战略》,编委会主任为中国科学院院士陈润生,标题和内容有调整。
科学人文在线,与您共同关注科技史、科技哲学、科技前沿与科学传播,关注人类社会的可持续发展,创造有价值的阅读!欢迎点赞、转发、留言讨论,我们将每月选取互动活跃、留言精彩的读者给与赠书奖励,公号对话框输入“赠书”,可了解赠书活动详情。联系邮箱:
转载说明:申请转载请在文末留言或邮件联系,转载时请完整保留文章出处说明,未经同意不允许修改、删减文章,不允许添加与文章内容无关的信息及广告。
21 世纪是生命科学蓬勃发展的时期,日益增长的生命科学与医学研究领域及其相关产业的大数据催生了生物信息学的快速发展。《中国生物信息学 2035 发展战略》面向 2035 年探讨了国际生物信息学的前沿发展趋势,深入阐述了生物信息学所涵盖的不同研究分支的发展历史、国内基础、发展态势,凝练了生物信息学的发展思路和发展方向,并提出了我国相应的发展领域和政策建议。
本书为相关领域战略与管理专家、科技工作者、企业研发人员及高校师生提供了研究指引,为科研管理部门提供了决策参考,也是社会公众了解生物信息学发展现状及趋势的重要读本。
陈润生,1941年6月18日出生,天津人,生物信息学家,中国科学院PG电子通信院士,国际欧亚科学院院士,中国科学院生物物理研究所研究员、博士生导师。
经查,刘艳红丧失理想信念,背弃初心使命,执纪违纪,执法违法,罔顾中央八项规定精神,违规收受礼品,接受可能影响公正执行公务的宴请;
日方声称中国战机“异常接近”日本巡逻机,外交部回应:日舰机抵近侦察中国正常军事活动,是造成海空安全风险的根源。(剪辑:辛乐)
中考分数线要大降了! #家庭教育 #父母课堂 #父母必看系列 #智慧父母 #中考
湖南省卫健委回应:认定刘翔峰涉嫌严重违法!湘雅二医院罗帅宇事件仍在调查,警方介入罗帅宇举报医疗腐败。(剪辑:祁泉)
报道称,这是一个百分之百违反常理的投资计划,除了台湾毫无反抗接受美国敲诈外,很难有其他恰当的形容词了。
新余市民政局原二级调研员李文涉嫌严重违纪违法,目前正接受新余市纪委监委纪律审查和监察调查。
14日下午到夜间雷阵雨来袭,夜间中雨伴随雷电,局地可能出现大到暴雨,伴有短时强降水、6-7级短时大风,降雨后半夜结束。
据中央纪委国家监委网站6月13日通报,中国地震局地球物理研究所二级研究员滕云田涉嫌严重违纪违法,目前正接受中央纪委国家监委驻应急管理部纪检监察组纪律审查和湖北省荆门市监察委员会监察调查。