# 1.TORCH.NN.FUNCTIONAL.INTERPOLATE

torch.nn.functional.interpolate(input, size=None, scale_factor=None, mode='nearest', align_corners=None, recompute_scale_factor=None, antialias=False)

将输入input上采样或下采样到指定的size或缩放因子上scale_factor

resize使用的算法由mode参数决定,mode默认为nearest, 可选参数有nearest/linear(3D Inputs-only)/bilinear/bicubic(4D Inputs-only)/trilinear(5D Inputs-only)/area/nearest-exact

支持输入input为3/4/5维数据,输入数据维度的顺序为mini-batch x channels x [optional depth] x [optional height] x width

  • 参数
    • input:输入向量
    • size(int or Tuple[int] or Tuple[int, int] or Tuple[int, int, int])输出数据的空间尺度
    • mode (str) :采样算法
    • align_corners:输出的结果是否角对齐,对插值后的边的处理方式有所不同,参考一文看懂align_corners (opens new window)
    • recompute_scale_factor:是否重新计算scale_factor,默认None,选择特定的插值方式时可用

align_cornersFalseTrue时输出的对比:

# 2.示例

import torch
import torch.nn.functional as F

t = torch.tensor([[1,2,3],[4,5,6],[7,8,9]], dtype=torch.float).reshape(1,1,3,3)
print(t)
it0 = F.interpolate(t, mode = 'bilinear', scale_factor=2)
print(it0)

it1 = F.interpolate(t,  mode = 'bilinear', scale_factor=2, align_corners=True)
print(it1)

import cv2
t = t.squeeze().cpu().numpy().astype(np.float32)
img = cv2.resize(t, (6,6), interpolation=cv2.INTER_LINEAR)
print(f"opencv: \n{img}")

可以看到OpenCV中的resize函数与设置Pytorchalign_corners=False时的输出是相同的。

(adsbygoogle = window.adsbygoogle || []).push({});

# 参考资料