[开发工具] Pycharm 调试debug torch.distributed.launch

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 开发工具 -> Pycharm 调试debug torch.distributed.launch -> 正文阅读

[开发工具]Pycharm 调试debug torch.distributed.launch

整理一下怎么用pycharm来调试torch.distributed.launch

我在服务器用的是sh?./train.sh，但是我需要在pycharm中查看变量，调试我的程序。

我的train.sh内容如下：

#!/bin/bash
PORT=${PORT:-29530}
python3 -m torch.distributed.launch --nproc_per_node=4 --master_port=$PORT\
                train.py --model DDRNet --out_stride 8 \
                --max_epochs 600 --val_epochs 10 --batch_size 64 --lr 0.01 --optim sgd --loss ProbOhemCrossEntropy2d \
                --base_size 512 --crop_size 512  --tile_hw_size 512,512 \
                --root '../../datasets' --dataset ChestLine --gpus_id 0,1,2,3 \
                --lab_name 'AdaptiveMin_inp512e600'

问题转化为：我需要debug模式运行train.py ，一般情况下，参数添加在pycharm的运行配置中，这很简单，但是这里train.py前面还有 torch.distributed.launch --nproc_per_node=4 --master_port=$PORT这些东西，查了一下相关问题，亲测后，整理解决方案如下文。