图书情报知识 ›› 2025, Vol. 42 ›› Issue (1): 89-100.doi: 10.13366/j.dik.2025.01.089
• 学术聚焦(2)·生成式人工智能训练数据的合理使用 • 上一篇 下一篇
戴文怡, 肖冬梅
DAI Wenyi, XIAO Dongmei
摘要: [目的/意义]目前生成式人工智能训练数据的著作权风险颇受世人关注,有必要在深度解析具体风险的基础上提出著作权合规方案,为相关义务主体提供合规指引。[研究设计/方案]依据我国著作权相关制度,按照“是否落入著作权控制范围-是否构成合理使用”的判断流程,对数据输入、模型训练和内容输出阶段的使用行为及其著作权风险进行分析。[结论/发现]模型训练阶段不存在著作权侵权风险,数据输入阶段存在复制权侵权风险,内容输出阶段存在复制权、改编权、保护作品完整权、信息网络传播权、广播权等侵权风险。故服务提供者兼模型训练者需做好利用公共领域作品和著作权保护期限内作品的著作权合规;单纯的服务提供者则需做好模型开发阶段延续风险防范和提供服务阶段的著作权合规。[创新/价值]具体分析生成式人工智能训练数据的著作权风险,并提出生成式人工智能训练数据著作权合规的方案,为相关企业、机构等开展模型训练和对外服务活动提供著作权合规指引。