清华计图胡事民团队的这篇注意力机制的综述火了！-微财商

清华计图胡事民团队的这篇注意力机制的综述火了！

发布时间：2021-12-02 12:41 来源：IT之家阅读量：6118 会员投稿

清华计图胡事民团队的这篇注意力机制的综述火了！

在上周的 arXiv 上，这是最热的一篇论文。

推特以及 GitHub 上也有不低的热度。

而这篇论文引用近 200 篇内容，对计算机视觉领域中的各种注意力机制进行了全面回顾。

在大量调查之后，论文将注意力机制分为多个类别，GitHub 还给出了各类别下提到内容的 PDF 下载文件:

现在，就来一起看看这篇论文。

文章主要内容

论文首先将基于注意力的模型在计算机视觉领域中的发展历程大致归为了四个阶段:

同时，注意力机制也被分为了通道注意，空间注意，时间注意，分支注意，以及两个混合类别:

针对不同类别，研究团队给出了其代表性方法和发展背景:

通道注意力

在深度神经网络中，不同特征图的不同通道常代表不同对象。

而通道注意力作为一个对象选择过程，可以自适应地重新校准每个通道的权重，从而决定关注什么。

因此，按照类别和出版日期将代表性通道关注机制进行分类，应用范围有分类，语义分割，实例分割，风格转换，动作识别。

其中，代表 Channel—wise product，强调重要通道，捕捉全局信息。

空间注意力

空间注意力可以被看作是一种自适应的空间区域选择机制。

其应用范围比通道注意力多出了精细分类和图像字幕。

时间注意力

时间注意力可以被看作是一种动态的时间选择机制，决定了何时进行注意，因此通常用于视频处理。。

分支注意力

分支注意可以被看作是一种动态的分支选择机制，通过多分支结构决定去注意什么。

通道空间注意力

通道和空间结合的注意力机制可以自适应地选择重要的对象和区域，由残差注意力网络开创了这一内容。九，要进一步突出学科基础，抓基础学科，抓学科基础，进一步抓重点学科，抓重点学科方向，突出高度和影响力。

在残差注意力之后，为了有效利用全局信息，后来的工作又相继引入全局平均池化，引入自注意力机制等内容。

时空注意力

时空注意力机制可以自适应地选择重要区域和关键帧。