HOLE

Holographic Embeddings of Knowledge Graphs

基于向量的循环相关

任务

  • 提出全息嵌入(holographic embeddings,HOLE)来学习整个知识图的组成向量空间表示。
  • 在组合向量空间模型的框架内研究从知识图谱学习的问题。

方法(模型)

compositional vector space models

  1. 组合向量空间模型

:特征函数

◦ :复合算子,从嵌入$\mathbf{e}_s$,$\mathbf{e}_o$创建$(s,o)$的复合向量表示。

  1. 通过最大限度地减少(正则化)logistic损失来实现最好地解释数据集的实体和关系的表示。

对于关系数据,最小化 logistic 损失具有额外的优势,它可以帮助为复杂的关系模式找到低维的嵌入。

  1. KGs只存储正确三元组,这种情况下可以使用 pairwise ranking loss。

例如将现有三元组的概率排序为高于不存在三元组的概率。

d+,d−:表示存在和不存在的三元组的集合。

$\eta_j>0$:指定边距的宽度。

Holographic Embeddings(HOLE)

为了将张量积的表达能力与TransE的效率和简单性结合起来,使用向量的循环相关来表示实体对。

在HOLE中,不只是存储关联,而是学习能最好地解释所观察到数据的嵌入。

1. 复合算子

$\mathbf{*}$:表示循环相关

  1. 三元组的概率模型

使用复合算子相对于卷积的优点

  • Non-commutative:对建模有向图的非对称性很有必要。
  • Similiarity Component:对实体相似性的关系建模有帮助。
  1. SGD

    使用随机梯度下降

$\mu$:学习率

  1. 方法
  • 把实体和关系都表示为向量。给定一个事实$(h,r,t)$,首先使用循环相关操作将实体表示形式组成$h*t∈R$。

  • 然后将组合向量与关系表示形式匹配,以对事实进行评分。

数据集

  • WN18
  • FB15K

性能水平

公平起见,评价时使用相同的损失和优化方法对参与比较的模型重新训练。

image-20201020191901057

Filter:由于对于给定的 predicate-object,测试集中可以存在多个正确的三元组,因此从$R_p(s^{‘},o)=1$ and $ s\neq s^{‘}$的排序中删除所有实例,只考虑测试实例在所有错误实例中的排序。同理从$R_p(s,o^{‘})=1$ and $ o\neq o^{‘}$的排序中删除所有实例。

  • 在WN18数据集的测试中,HOLE的表现都最为出色。
  • 在FB15k数据集表现也优于其他模型,但是效果不是很显著。

image-20201020193457298

  • 与Rescal相比,HOLE的参数减少很多。尽管embedding的维数d比rescal的大,但由于其存储复杂度仅线性地依赖于d,所以总体参数数目显著减少。

image-20201020193748054

$locatedIn(c,r)$:c:countries(国家),r:regions(地区)。

$locatedIn(c,s)$:s:subregions(次区域)。

  1. 任务S1

    设置:对于test/valid中,只将$locatedIn(c,r)$的countries设置为missing。

    性能:丢失的三元组几乎可以完美预测。

  2. 任务S2

    设置:将$locatedIn(c,s)$中countries和subregions设置为missing。

    性能:相对于其他数据集表现最好。

  3. 任务S3

    设置:将$locatedIn(n,r)$中countriesn的neighbors,regions设置为missing。

    性能:预测难度最大,但相对于其他数据集表现较好。

RESCAL和ER-MLP较差的结果很可能是过拟合导致。

结论

  • HOLE 它利用向量的循环相关性来创建二元关系数据的组合表示。通过使用相关性作为组合算子,可以捕获丰富的交互,同时保持高效的计算,易于训练,并可扩展到非常大的数据集。
  • 循环相关对成对的相互作用进行压缩。因此,HolE对每个关系只需要$O(d)$参数,并且循环相关是不符合交换律的,即$ht$不等于$th$。所以HolE能够对不对称关系进行建模

思考

  1. 循环相关的优势:

image-20201020202711290

  • 与张量积相比,循环相关具有不增加复合表示的维数的重要优点。
  • 空间复杂度在实体表示的维度d中是线性的,运行时复杂度在d中是对数线性的。对总体参数的数量和运行效率都有显著影响。
  • 组合表示与其构成的表示具有相同的维数。