PyTorch Error in rnn.pack_padded_sequence()

An PyTorch Error

在使用 GPU 训练模型时，PyTorch 代码中包含 nn.utils.rnn.pack_padded_sequence() 方法：

pack_wemb = nn.utils.rnn.pack_padded_sequence(wemb, length, batch_first=True, enforce_sorted=False)

遇到了以下错误：

RuntimeError: 'lengths' argument should be a 1D CPU int64 tensor, but got 1D cuda:0 Long tensor

导致这个错误的原因是：PyTorch 1.6 及以后的版本对 Bi-LSTM 进行了升级/改动。因此，只有 PyTorch 1.5（包含）以前的版本能够正常使用。

解决方法

根据报错信息，我们最直接能想到的方法是 将 PyTorch Tensor 移动到 CPU device 中，即 length.cpu() 或者 length.to("cpu")：

# Debug Issue: https://github.com/pytorch/pytorch/issues/43227
pack_wemb = nn.utils.rnn.pack_padded_sequence(wemb, length.cpu(), batch_first=True, enforce_sorted=False)

此外，还可以将 PyTorch 进行降级，从而解决这个问题（但是不推荐这样做）。

参考

文档信息

本文作者：Bookstall
本文链接：https://bookstall.github.io/fragment/2023-02-20-pytorch-rnn-pack-padding-issue/
版权声明：自由转载-非商用-非衍生-保持署名（创意共享3.0许可证）

Search

Table of Contents