图书情报知识 ›› 2025, Vol. 42 ›› Issue (1): 78-88.doi: 10.13366/j.dik.2025.01.078
• 学术聚焦(2)·生成式人工智能训练数据的合理使用 • 上一篇 下一篇
魏远山
WEI Yuanshan
摘要: [目的/意义]生成式人工智能(GenAI)训练数据包含大量尚处保护期的作品,明确是否应为机器学习设置合理使用规则,有助于化解GenAI训练数据的著作权法争议。[研究设计/方法]以类型化视角审视表达型和非表达型机器学习,以是否符合“未经许可利用作品训练GenAI构成侵权→遵循授权使用规则阻碍技术进步→其他简化授权机制无法适用”的逻辑来确定是否设置合理使用规则。[结论/发现]作为非表达型机器学习的输入和训练阶段是“非作品性使用”,因不构成侵权自然无为其设置合理使用规则的必要;作为表达型机器学习的输出阶段是“作品性使用”,但因GenAI向公众开放前后所处场景有异,应作类型化分析。在未向公众开放时,GenAI输出结果主要用于验证模型训练情况,可被定性为合理使用;在向公众开放后,若输出结果对作品表达改动幅度超越改编行为范畴则属正当使用,反之则构成侵权。因输出阶段构成侵权不会阻碍GenAI技术发展,故无需为其设置合理使用规则。[创新/价值]与既有研究不同的分析方法和研究结论,对AI从业者和法律工作者探讨GenAI训练数据的著作权法问题具有启示作用,也对丰富和深化现有研究有益。