| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> Python知识库 -> 如何在pycharm中运行/调试torch分布式训练 -> 正文阅读 |
|
[Python知识库]如何在pycharm中运行/调试torch分布式训练 |
https://zhuanlan.zhihu.com/p/144815822 这个链接的确帮到我了,开心!!!! 简单描述下,一般的分布式训练的命令行长这样: python3 -m torch.distributed.launch \ --nproc_per_node=4 \ --nnodes=1 \ --node_rank=0 \ --master_addr="localhost" \ --master_port=12346 \ --use_env main.py --data-path --epochs 1 --batch-size 8 那么就可以把它看成两部分: 1.运行分布式训练对torch.distributed.launch.py,并设置具体运行参数: torch.distributed.launch \ --nproc_per_node=4 \ --nnodes=1 \ --node_rank=0 \ --master_addr="localhost" \ --master_port=12346 \ 2.网络自己的参数设置,并运行网络main.py,也许你是train.py,总之就是正常需要运行的文件名。 ?--use_env main.py --data-path --epochs 1 --batch-size 8 首先建立软连接: ln -s /home/lmk/.conda/envs/imgnetmodel/lib/python3.8/site-packages/torch/distributed/ yourprogram ? 以上命令没有直接链接launch.py而是它的父目录distributed,是因为这样比较容易知道launch.py是一个软链接,不与项目中的其他文件混淆。 设置Pycharm运行参数打开Pycharm,依次点击Run->Edit Configurations?进入参数配置界面 ? 只需要配置Script path为launch.py路径;Parameters为launch.py运行参数,参考命令行调用的方法,具体如下。 python3 -m torch.distributed.launch(删去) \ --nproc_per_node=4 \ --nnodes=1 \ --node_rank=0 \ --master_addr="localhost" \ --master_port=12346 \ --use_env main.py --data-path --epochs 1 --batch-size 8 好了~~~可以愉快哒玩耍啦~~~ ? |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 | -2024/12/26 3:08:00- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |
数据统计 |