论文标题: Revisiting Global Statistics Aggregation for Improving Image Restoration
论文链接:https://arxiv.org/abs/2112.04491
作者单位:旷视科技
github地址:https://github.com/megvii-research/TLC
沿整个空间维度聚合的全局空间统计数据广泛用于高性能图像恢复器。例如,HINet 采用的实例归一化 (IN) 中的均值、方差,以及应用于 MPRNet 的 Squeeze and Excitation (SE) 中的全局平均池化(即均值)。本文首先表明,在训练/测试阶段分别在基于补丁/基于整个图像的特征上聚合的统计数据可能分布非常不同,并导致图像恢复器的性能下降。它已被以前的作品广泛忽视。为了解决这个问题,我们提出了一种简单的方法,即测试时间本地统计转换器(TLSC),它仅在测试时间将统计聚合操作的区域从全局替换为本地。无需重新训练或微调,我们的方法显着提高了图像恢复器的性能。特别是,通过将带有 TLSC 的 SE 扩展到最先进的模型,MPRNet 在 GoPro 数据集上的 PSNR 提高了 0.65 dB,达到了 33.31 dB,超过了之前的最佳结果 0.6 dB。此外,我们简单地将 TLSC 应用于高级视觉任务,即语义分割,并取得了有竞争力的结果。进行了大量的数量和质量实验,以证明 TLSC 解决了边际成本问题,同时获得了显着收益。
训练和测试的统计分布:
应用场景:
1、Extending TLC to SE Block
2、Extending TLC to IN
3、Extending to transposed self-attention