IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 系统运维 -> 如何修改docker容器的shmsize共享内存大小 -> 正文阅读

[系统运维]如何修改docker容器的shmsize共享内存大小

报错原因

在跑train时提示如下

RuntimeError: DataLoader worker (pid 6209) is killed by signal: Bus error. 
It is possible that dataloader's workers are out of shared memory. 
Please try to raise your shared memory limit.

解决方法:

  1. 停止docker
// 停止docker服务
systemctl stop docker
  1. 找到要修改的容器ID
gpu@gpu-workstation:~$ docker ps -a
CONTAINER ID   IMAGE                 COMMAND                  CREATED         STATUS              PORTS                                                 NAMES
71050781f79d   kaggle                "--shm-size 8G"          5 minutes ago   Created             6006/tcp, 0.0.0.0:8890->8888/tcp, :::8890->8888/tcp   kaggle
485f0e25b37c   lab_vm                "jupyter notebook --…"   3 weeks ago     Up About a minute   6006/tcp, 0.0.0.0:8889->8888/tcp, :::8889->8888/tcp   lab_vm
209fad8c7a0d   ufoym/deepo:latest    "jupyter notebook --…"   3 weeks ago     Up 4 hours          6006/tcp, 0.0.0.0:8888->8888/tcp, :::8888->8888/tcp   recursing_golick
8dc30befdfa8   portainer/portainer   "/portainer"             3 weeks ago     Up 4 hours          0.0.0.0:8000->9000/tcp, :::8000->9000/tcp             portainerUI
gpu@gpu-workstation:~$ ^C
gpu@gpu-workstation:~$ docker inspect 485f0e25b37c | grep Id
        "Id": "485f0e25b37cbe2bc09312356e2ad23a63ae237f6ea74cf084e298a0f3fd5f55",

  1. 找到hostconfig.json文件
gpu@gpu-workstation:/$ cd /home/docker
gpu@gpu-workstation:/home/docker$ ls
buildkit  containers  image  network  overlay2  plugins  runtimes  swarm  tmp  trust  volumes
gpu@gpu-workstation:/home/docker$ cd containers
gpu@gpu-workstation:/home/docker/containers$ ls
209fad8c7a0db43a836c5a8e6835cfa4938be23f43884e1f34459d6d45d3970a  71050781f79d36864b2b7bb42dc2b60b17c5dc8eedce7426e96ad8ee1d4c546b
485f0e25b37cbe2bc09312356e2ad23a63ae237f6ea74cf084e298a0f3fd5f55  8dc30befdfa8c6b5606f3fa3f3d430af2b657817569c3ff0b2c888714b9ed719
gpu@gpu-workstation:/home/docker/containers/485f0e25b37cbe2bc09312356e2ad23a63ae237f6ea74cf084e298a0f3fd5f55$ ls
485f0e25b37cbe2bc09312356e2ad23a63ae237f6ea74cf084e298a0f3fd5f55-json.log  checkpoints  config.v2.json  hostconfig.json  hostname  hosts  mounts  resolv.conf  resolv.conf.hash

  1. 修改shmsize 为: ShmSize":8259460864
gpu@gpu-workstation:/home/docker/containers/485f0e25b37cbe2bc09312356e2ad23a63ae237f6ea74cf084e298a0f3fd5f55$ vim hostconfig.json


{"Binds":["dl-vol:/home/common-dir"],"ContainerIDFile":"","LogConfig":{"Type":"json-file","Config":{"max-file":"1","max-size":"50m"}},"NetworkMode":"default","PortBindings":{"8888/tcp":[{"HostIp":"","HostPort":"8889"}]},"RestartPolicy":{"Name":"no","MaximumRetryCount":0},"AutoRemove":false,"VolumeDriver":"","VolumesFrom":null,"CapAdd":null,"CapDrop":null,"CgroupnsMode":"host","Dns":[],"DnsOptions":[],"DnsSearch":[],"ExtraHosts":null,"GroupAdd":null,"IpcMode":"private","Cgroup":"","Links":null,"OomScoreAdj":0,"PidMode":"","Privileged":false,"PublishAllPorts":false,"ReadonlyRootfs":false,"SecurityOpt":null,"UTSMode":"","UsernsMode":"","ShmSize":8259460864,"Runtime":"nvidia","ConsoleSize":[0,0],"Isolation":"","CpuShares":0,"Memory":0,"NanoCpus":0,"CgroupParent":"","BlkioWeight":0,"BlkioWeightDevice":[],"BlkioDeviceReadBps":null,"BlkioDeviceWriteBps":null,"BlkioDeviceReadIOps":null,"BlkioDeviceWriteIOps":null,"CpuPeriod":0,"CpuQuota":0,"CpuRealtimePeriod":0,"CpuRealtimeRuntime":0,"CpusetCpus":"","CpusetMems":"","Devices":[],"DeviceCgroupRules":null,"DeviceRequests":null,"KernelMemory":0,"KernelMemoryTCP":0,"MemoryReservation":0,"MemorySwap":0,"MemorySwappiness":null,"OomKillDisable":false,"PidsLimit":null,"Ulimits":null,"CpuCount":0,"CpuPercent":0,"IOMaximumIOps":0,"IOMaximumBandwidth":0,"MaskedPaths":["/proc/asound","/proc/acpi","/proc/kcore","/proc/keys","/proc/latency_stats","/proc/timer_list","/proc/timer_stats","/proc/sched_debug","/proc/scsi","/sys/firmware"],"ReadonlyPaths":["/proc/bus","/proc/fs","/proc/irq","/proc/sys","/proc/sysrq-trigger"]}


  1. 重启服务器,进入docker确认。
docker ps -aq | xargs -I {} docker start {}
root@485f0e25b37c:/# df
Filesystem     1K-blocks     Used Available Use% Mounted on
overlay        959862832 37967920 873066752   5% /
tmpfs              65536        0     65536   0% /dev
tmpfs           24633980        0  24633980   0% /sys/fs/cgroup
shm              8065880        0   8065880   0% /dev/shm
/dev/sda2      959862832 37967920 873066752   5% /home/common-dir
tmpfs           24633980       12  24633968   1% /proc/driver/nvidia
udev            24588824        0  24588824   0% /dev/nvidia0
tmpfs           24633980        0  24633980   0% /proc/asound
tmpfs           24633980        0  24633980   0% /proc/acpi
tmpfs           24633980        0  24633980   0% /proc/scsi
tmpfs           24633980        0  24633980   0% /sys/firmware
  系统运维 最新文章
配置小型公司网络WLAN基本业务(AC通过三层
如何在交付运维过程中建立风险底线意识,提
快速传输大文件,怎么通过网络传大文件给对
从游戏服务端角度分析移动同步(状态同步)
MySQL使用MyCat实现分库分表
如何用DWDM射频光纤技术实现200公里外的站点
国内顺畅下载k8s.gcr.io的镜像
自动化测试appium
ctfshow ssrf
Linux操作系统学习之实用指令(Centos7/8均
上一篇文章      下一篇文章      查看所有文章
加:2021-10-30 12:50:22  更:2021-10-30 12:50:45 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/15 22:50:24-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码