摘要:
[目的/意义]分析世界范围内海量科学数据特征,为科学数据的有效利用和管理提供参考。[研究设计/方法]采集DataCite中14,835,029条科学数据元数据,基于统计分析、社会网络分析、文本分析等方法,从时间、空间、主题、作者、版本、使用等维度对科学数据的现状特征进行分析。[结论/发现] 科学数据呈指数增长态势;理工科数据占据主体,人文社科数据异军突起;数据中心两极分化严重;欧美国家占据开放数据优势;我国数据中心建设滞后于学者需求;不同学科作者合作差异显著;数据集版本数量遵从幂律分布;数据开放共享助力提升学者影响力。[创新/价值]从多个视角对现有海量科学数据全貌特征深入挖掘,总结优秀数据中心实践经验,探讨我国科学数据管理发展路径。