图书情报知识 ›› 2024, Vol. 41 ›› Issue (6): 141-154,165.doi: 10.13366/j.dik.2024.06.141
赵又霖1,2 ,庞航远1 ,石燕青3
ZHAO Youlin1,2 ,PANG Hangyuan1 ,SHI Yanqing3
摘要: [目的/意义] 融合包含丰富个体情感、行为和交互信息的社会感知数据和发布者先验知识有助于提高虚假健康信息识别精度。[研究设计/方法] 基于社会感知数据,综合历史信息文本描述发布者对待检测信息的先验知识,并融合发布者先验知识,从发布者特征、内容特征和接收者行为特征3个维度提取健康信息特征;同时,建立健康信息画像,并基于Stacking集成学习模型构建虚假健康信息识别模型FHIR_SSD&PPK。[结论/发现] FHIR_SSD&PPK模型识别虚假健康信息的效果最好,准确率为92.35%;发布者特征的特征重要度占比总和最高,为51.59%,其中发布者先验知识特征的特征重要度为44.01%,并且与未考虑发布者先验知识的模型相比,F1值提升2.26%,说明本文提出的发布者先验知识是构建识别模型的关键特征。[创新/价值] FHIR_SSD&PPK模型融合社会感知数据和发布者先验知识,基于Stacking集成学习模型识别虚假健康信息,在细粒度和深度上对虚假健康信息识别研究进行了优化。