数据中心|科学数据共享 让科技创新和经济发展比翼齐飞

2019年 , 科技部和有关部门立足前期工作基础 , 在高能物理、基因组、气象、地震、海洋等领域组建了20个国家科学数据中心 。 在实现数据共享、支撑科技创新、加强国际合作方面 , 这些数据中心成为了重要的基础设施和载体 。
近日 , 高能同步辐射光源(HEPS)首台科研设备开始安装 , 国家高能物理科学数据中心为高能光源研究开发的科学数据管理服务系统也取得重要进展 。 科学数据管理服务系统的测试平台开始运行 , 实现了从数据获取、传输、分析、长期保存到成果发布的全生命周期的数据服务 。
2019年 , 科技部和有关部门立足前期工作基础 , 在高能物理、基因组、气象、地震、海洋等领域组建了20个国家科学数据中心 。 在实现数据共享、支撑科技创新、加强国际合作方面 , 国家高能物理科学数据中心、国家对地观测科学数据中心、国家地球系统科学数据中心、国家海洋科学数据中心、国家冰川冻土沙漠科学数据中心等成为了重要的基础设施和载体 。
工作前移打通数据共享堵点
科学数据共享是我国国家科技创新体系建设的重要内容 , 也是大数据时代科技创新和经济社会发展的重要基础 。
在高能物理领域 , 大部分项目涉及国家重大科技基础设施及大型实验 。 这些项目往往周期很长 , 并且数据量巨大 , 需要进行大规模的数据共享传输和数据处理 。
国家高能物理科学数据中心在项目建设之初就开始参与数据产生、数据处理、数据汇交与共享、软件工具等方面的设计和规划 , 与科学家(数据生产者和数据用户)共同协商确定数据的格式、存储访问模式以及数据长期保存的策略、数据共享的机制等 , 同时根据数据使用特点设计和建立数据处理所需的计算资源平台以及数据传输共享所需的高速网络链路 。 工作的前移 , 确保了科学项目从一开始就将数据生产、数据汇交和数据服务形成一个整体 。
2019年度 , 国家高能物理科学数据中心在专家委员会指导下 , 组织高能物理领域相关学科专家 , 对比国际相关数据中心的发展方向 , 根据国内高能物理领域实验装置特性 , 评估并建设国家高能物理科学数据中的数据资源目录体系 。 数据资源包含了高能物理数据、中子科学数据、光子科学数据、天体物理数据4个主要部分 。 根据合作组研究统计 , 国家高能物理科学数据中心直接或间接服务科研机构和团队来自74个国家 , 超过1000家 , 为发现迄今为止人类观测到能量最高的光子、破解快速射电暴的起源之谜及新材料研发等提供了重要支撑 。
与此同时 , 国家高能物理科学数据中心与国内外同行合作 , 建立了分布式的数据管理和共享系统 。 针对大型强子对撞机LHC的实验数据 , 与国际上100多个数据中心联合建立了数据网格 。
为科学研究提供充足“粮食”
为提升科学数据资源和共享服务能力 , 建立科学数据共享的可持续发展机制 , 为科学研究提供基础支撑 , 科学数据中心作为公益性的国家级科学大数据设施按不同领域陆续成立 。
国家地球系统科学数据中心主要为地球系统科学的基础研究和学科前沿创新提供科学数据支撑和数据服务 。 截至2020年12月底 , 国家地球系统科学数据中心已开放共享数据集3.6万余个 , 数据资源量超过2.14PB , 为9935个重大科研项目/课题提供了数据服务 。
从服务的科研产出来看 , 数据开放共享主要服务于科研项目(课题)、学术论文、专著与图集等 , 也包含支撑软件著作权专利、获奖、标准规范等相关成果 。 如2018—2019年期间 , 中国工程院刘旭院士的科研团队面向两山理论实践、发展环境综合治理等区域关键问题开展战略研究 , 国家地球系统科学数据中心持续跟踪项目进展 , 协助团队完成构建生态资源资产核算指标体系等研究 , 支撑项目出版专著5部 。