[人工智能] pytorch迁移GPU遇到的BUG整理

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> pytorch迁移GPU遇到的BUG整理 -> 正文阅读

[人工智能]pytorch迁移GPU遇到的BUG整理

CPU跑的好好的，迁移到GPU后，BUG一个接着一个
Expected object of device type cuda but got device type cpu for argument
Expected object of backend CUDA but got backend CPU for sequence element 0 in sequence argument at position #1 ‘tensors’
以上都是输入数据或者变量的问题，仔细检查代码、padding时的变量是否迁移等，查不出可以debug，就是慢…
除了这些 https://www.jb51.net/article/213830.htm
还有模型新建的内部张量（模型迁移了，内部张量就会迁移）
但是我自己改了模型，遇到数据类型不匹配的问题
Input type (torch.cuda.FloatTensor) and weight type (torch.FloatTensor) should be the same
排查后发现是构建模型时用到字典dict 不会自动迁移到GPU
以前的写法：

self.d_tempconv = {}
for window_size in self.window_sizes:
      self.d_tempconv[window_size] = TemporalConvoluation(self.cov_dim, self.mem_dim, window_size)  
tempconv = self.d_tempconv[window_size](input)

修改后

self.d_tempconv = {}
for window_size in self.window_sizes:
       self.d_tempconv[window_size] = TemporalConvoluation(self.cov_dim, self.mem_dim, window_size)  
self.d_tempconv_new = nn.ModuleDict({str(key):value for key,value in self.d_tempconv.items()})
tempconv = self.d_tempconv_new[str(window_size)](input)