加快打造原始创新策源地,加快突破关键核心技术,努力抢占科技制高点,为把我国建设成为世界科技强国作出新的更大的贡献。

——习近平总书记在致中国科学院建院70周年贺信中作出的“两加快一努力”重要指示要求

面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,率先实现科学技术跨越发展,率先建成国家创新人才高地,率先建成国家高水平科技智库,率先建设国际一流科研机构。

——中国科学院办院方针

首页 > 新闻中心 > 综合新闻

《自然》社论:数据超载时代来临

发布时间:2009-07-31 【字体: 】【打印】 【关闭

     7月30日出版的《自然》杂志刊登社论——《信息超载》(Information overload),社论说,美国国家科学院7月22日发布报告称,应对千千G(petabyte)科研数据的时代已经到来。而对于每位研究人员来说,要确保其研究数据的真实性与精确性。
    
     人类基因组谱近30亿碱基对的解析曾花了人类超过十年的时间,但是今天高效的基因测序机器可以在一周之内完成同样的工作。与此同时,美国斯隆数字巡天探测中心的天文学家自2000年以来已经完成了宇宙绘图任务的25%,获得了超过两亿个天体的数据。而预计于2015年完成的智利大口径全景巡天望远镜(LSST)可以在一晚时间内获得与之等量的数据。
    
     统计数据说明在许多科研领域存在类似情况。这是科研界的利好消息,数据过剩总好于数据匮乏。但是忧虑依然。因为数据产生的速度远远高于数据处理能力和处理策略演进的速度,如期刊编辑要面对诸如图像处理、原始数据保存等问题,需要确保海量数据存储和运算法则、数据共享的持续。
    
     2006年,包括《自然》在内的多家期刊邀请美国国家科学院关注这一问题,相关研究报告7月22日出炉。报告基于三个原则,即诚信(integrity)、开放获取(access)和管理(stewardship)。
    
     integrity要求研究人员保证数据的真实性与精确性,他们必须遵循其研究领域的专业标准,研究机构则要求提供培训来实现这一原则。
    
     access意味着其他人可以核查数据精确与否,并进行验证分析,以及将之作为前期研究基础。除非当事人有特别的理由,否则应该及时使其数据开放获取。
    
     stewardship是数据长期存储的需要。科学界的协会与社团应该规定数据存储的标准,期刊需要在数据存储和规则传播方面做出努力。数据专家需要扮演管家的角色,研究人员也应该给数据专家更多的支持。
    
     这份报告承认,基于数据的复杂性,他们只是提供了总体性看法,而非确定的解决方案。科研机构、社团和科学协会应该依据各自的属性来找到解决途径,投资人需要加大对数据存储的投资,而科研单位需要保证面向公众的数据准确。