Generalizing to the Future Mitigating Entity Bias in Fake News Detection

论文:Generalizing to the Future:Mitigating Entity Bias in Fake News Detection
代码:https://github.com/ictmcg/endef-sigir2022
会议:SIGIR 2022
飞书:https://zlc6vppbrn.feishu.cn/docx/doxcnGnsfAAZXGYBUlKaqWYX4mg

任务

现有的假新闻检测方法忽略了真实数据中的非预期实体偏差,严重影响了模型对未来数据的泛化能力。 例如,2010-2017年,包含“唐纳德·特朗普”实体的97%的新闻在我们的数据中是真实的,但这一比例在2018年降至仅33%。 这将导致在前一个场景中训练的模型很难推广到后一个场景,因为它倾向于预测关于唐纳德·特朗普的新闻是真实的,以降低训练损失。

本文提出了一个实体去偏框架(ENDEF),该框架从因果角度出发,通过减轻实体偏差,虚假新闻检测模型推广到未来数据中。

方法(模型)


基于实体、新闻内容和新闻真实性之间的因果关系图,分别对训练过程中各个原因(实体和内容)的贡献进行建模。 在推理阶段,我们去除实体的直接影响,以减轻实体偏差。

数据集

性能水平

结论

在中英文数据集上进行的大量离线实验表明,该框架在很大程度上提高了基本假新闻检测器的性能,在线测试也验证了其在实际应用中的优越性。

是第一个明确提高假新闻检测模型对未来数据泛化能力的工作。