图书情报知识 ›› 2023, Vol. 40 ›› Issue (4): 32-40.doi: 10.13366/j.dik.2023.04.032
• 学术聚焦(1)· 人工智能生成内容(AIGC)治理 • 上一篇 下一篇
莫祖英, 盘大清, 刘欢, 赵悦名
MO Zuying PAN Daqing LIU Huan ZHAO Yueming
摘要: [目的/意义] 探讨AIGC中存在的各种虚假信息类型及其特征,对理解虚假信息产生的根源、减少AIGC中虚假信息的生成具有积极作用。[研究设计/方法] 采用数据测试实验方法,立足于信息质量视角,通过采集AIGC系统一手的测试数据和收集二手的AIGC虚假信息来剖析AIGC虚假信息类型及特征;以人工智能语言模型的信息生成过程为着力点,探析AIGC中虚假信息生成的根源。[结论/发现] AIGC虚假信息主要包括事实性虚假和幻觉性虚假两种类型,事实性虚假信息主要集中在数据错误、作者作品错误、客观事实错误、编程代码错误、机器翻译错误五个方面,而幻觉性虚假信息主要集中在虚假新闻事件、虚假学术信息、虚假健康信息和偏见与歧视方面;AIGC虚假信息产生的根源与大规模语言模型、预训练数据集和人工标注三个要素有关。[创新/价值] 采用了数据测试实验方法,并辅以二手数据的收集,全面分析了各种AIGC虚假信息的类型,并根据生成机理与表现形式将其划分为事实性虚假信息和幻觉性虚假信息,为AIGC虚假信息的进一步研究提供了理论基础。