Point Transformer –ICCV2021

论文：Point Transformer
作者单位：牛津大学, 港中文(贾佳亚等), Intel Labs

transformer应用到了点云任务处理中。为点云设计了自注意力层，并使用它们来构造诸如语义场景分割，object part分割和对象分类等任务的自注意力网络。

attention层设计：

这里的y是输出的feature，ϕ、ψ、α都是逐点特征变换的一种方式（比如mlp），δ是一个位置编码函数，ρ是正则化函数，简单来说，x_i是点i的feature向量，先通过特征变换将点i和点j（Xj是Xi的邻域上的点，而非全局的，目的是减少计算量）的特征得到，这里的β是关系函数，通过这个函数得到两个点特征之间的关系，也就是建立每个点特征之间的关系，然后加上位置编码函数δ，γ是映射函数，也就是映射到某一维度而用。在这基础上就可以设计这里的重点，Point transformer层了

输入是(x,p)也就是每个点的位置信息，首先通过两个线性函数编码不同主次点的特征向量（也就是得到前面的key向量），再用一个MLP得到位置函数，也就是前面的查询向量），两者结合得到relation关系，然后再用一个线性函数得到它的值向量，将relation和值向量结合，也就是前面说的对于每个点既关注它的和其他点之间的语义关系，也关注它和其他点之间的位置关系，最后输出y作为点云处理结果。

位置函数也就是计算查询向量的那个函数：