Automatically Learning Data Augmentation Policies for Dialogue Tasks

论文：Automatically Learning Data Augmentation Policies for Dialogue Tasks

代码：https://github.com/WolfNiu/AutoAugDialogue

任务

AutoAugment算法主要应用在CV领域，本文调整AutoAugment算法应用在对话任务上。

自动数据增强（AutoAugment）通过使用目标任务上的采样策略的性能奖励训练的控制器搜索最佳扰动策略，从而减少data-level模型的偏差。

本文调整了AutoAugment，以自动发现自然语言处理（NLP）任务的effective perturbation policies(有效扰动策略)，如对话生成。

还探索了以目标任务的源输入为条件的控制器，因为某些策略可能不适用于不包含该策略所需语言特征的输入。

方法（模型）

从一个原子操作池开始，对对话任务的源输入进行微妙的语义保护性扰动（例如，不同的POS-标签类型的停顿词、语法错误和意译）。

接下来，允许控制器通过搜索这些原子操作的各种组合的空间来学习更复杂的增强策略。

数据增强策略：

下图中，第一个操作（Paraphrase, 2, 0.7）以0.7的概率对输入进行两次转述；第二个操作（Grammar Errors, 1, 0.4）以0.4的概率插入一个语法错误。因此，每个子策略最多可能有4个结果。这种修改为模型提供了一个更大的操作组合空间，使其有可能学习到更复杂和细微的增强策略。