IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 系统运维 -> GPU服务器使用docker进行用户隔离 -> 正文阅读

[系统运维]GPU服务器使用docker进行用户隔离

研发需求

研发组内各人共用一台服务器,但是均需要root权限
下面记录一台ubuntu机器从初始化到最终提供上述服务的关键步骤

挂载硬盘

参考:

https://www.cnblogs.com/mumuzifeng/p/13963043.html

安装docker

参考:

https://www.runoob.com/docker/ubuntu-docker-install.html

安装nvidia docker

参考:

https://zhuanlan.zhihu.com/p/88351963?from_voters_page=true

迁移docker

参考:

https://blog.csdn.net/u011420410/article/details/99845765

测试yolov5

报错:

ImportError: libgthread-2.0.so.0: cannot open shared object file: No such file or directory解决方法

解决:

apt-get update
apt-get install libglib2.0-dev
apt-get install libsm6
apt-get install git

报错:

ERROR: Unexpected bus error encountered in worker. This might be caused by insufficient shared memory (shm).

参考:

https://felaim.blog.csdn.net/article/details/109318772?spm=1001.2101.3001.6650.1&utm_medium=distribute.pc_relevant.none-task-blog-109318772-blog-101209718-2%7Edefault%7ECTRLIST%7ERate-1.pc_relevant_paycolumn_v3&depth_1-utm_source=distribute.pc_relevant.none-task-blog-109318772-blog-101209718-2%7Edefault%7ECTRLIST%7ERate-1.pc_relevant_paycolumn_v3&utm_relevant_index=1

build镜像

FROM pytorch/pytorch:1.11.0-cuda11.3-cudnn8-devel
RUN apt update && apt install -y openssh-server
RUN echo "PermitRootLogin yes" >> /etc/ssh/sshd_config
RUN echo "root:123" | chpasswd
RUN apt-get install -y vim
ADD init.sh /etc/profile.d/init.sh
ENTRYPOINT service ssh restart && bash

其中init.sh:

export PATH=/opt/conda/bin:$PATH

这里有个几个个细节:

  1. docker exec 进入容器和ssh进入容器都是root账号,echo $PATH 得到的内容却不一样,不知道是为何
  2. 无法通过systemctl启动ssh 只能写在ENTRYPOINT里,不知为何无法安装和使用systemctl
  3. 通过 ENV PATH=/opt/conda/bin:$PATH 修改容器内PATH无效,不知为何

添加账号并运行对应容器

TMPNAME=name1
TMPPORT1=20001
TMPPORT2=20002
docker run -idt --privileged=true --ipc=host --gpus all --name $TMPNAME -v /home/$TMPNAME:/root -p $TMPPORT1:22 -p $TMPPORT2:$TMPPORT2 pytorch/pytorch:1.11.0-cuda11.3-cudnn8-devel-ssh

登录指令:

ssh root@host -p 20001
  系统运维 最新文章
配置小型公司网络WLAN基本业务(AC通过三层
如何在交付运维过程中建立风险底线意识,提
快速传输大文件,怎么通过网络传大文件给对
从游戏服务端角度分析移动同步(状态同步)
MySQL使用MyCat实现分库分表
如何用DWDM射频光纤技术实现200公里外的站点
国内顺畅下载k8s.gcr.io的镜像
自动化测试appium
ctfshow ssrf
Linux操作系统学习之实用指令(Centos7/8均
上一篇文章      下一篇文章      查看所有文章
加:2022-04-29 12:31:28  更:2022-04-29 12:33:54 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/15 20:06:48-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码