摘要:
本文研究了基于综述型文献的跨学科领域信息源信息抽取、聚合与可视化方法,结合实例从高质量的综述型文献中抽取信息源信息,构建了“机器学习”跨学科领域信息源地图。首先,在对搜集文献预处理的基础上,识别篇章关系,构建辅助词典;使用词典及辅助词典进行分词、完成实体识别和词性标注等工作;结合一定的语法逻辑规则,实现句子级的抽取和信息源数据抽取;对多篇文献中相同信息源信息进行整合;最后,利用D3工具绘制信息源地图,从时间和来源两个维度对跨学科领域高价值信息源进行导航。实验证明上述方法取得了较好的效果,信息抽取的查全率和查准率较高,有助于跨学科领域科研人员快速了解领域发展过程、高价值信息源、涉及学科及不同学科的研究方向特征。