Nvidia CUDA开发环境 Docker容器启用显卡

Nvidia CUDA开发环境 Docker容器启用显卡 1.准备docker>19.03 环境,配置好nvidia-container-toolkit 2.确定本机已安装的显卡驱动版本,匹配需要的容器版本 3.Pull基础docker镜像,可以从官方或者dockerhub下载 https://ngc.nvidia.com/catalog/containers/nvidia:cuda/tags https://gitlab.com/nvidia/container-images/cuda cuda10-py36-conda的Dockerfile FROM nvidia/cuda:10.0-cudnn7-devel-ubuntu18.04 MAINTAINER Limc #close frontend ENV DEBIAN_FRONTEND noninteractive # add cuda user # –disabled-password = Don’t assign a password # using root group for OpenShift compatibility ENV CUDA_USER_NAME=cuda10 ENV CUDA_USER_GROUP=root # add user RUN adduser –system –group –disabled-password –no-create-home –disabled-login $CUDA_USER_NAME RUN adduser $CUDA_USER_NAME …

[docker]升级docker19.03使用nvidia-container-toolkit

升级docker19.03使用nvidia-container-toolkit docker升级到19.03以后,nvidia将提供原生的显卡支持,只需要安装 nvidia-container-toolkit工具包即可, 不再像使用nvidia-docker/2那样复杂配置,而且不支持用docker-compose 安装步骤 1.确认本机nvidia驱动安装正确,cuda和cudnn配置正常,官方文档说可以不需要在host配置cuda, 2.安装docker,可以参考,主要安装19.03以后的版本 https://docs.docker.com/engine/install/ubuntu/ 3.添加nvidia-docker的源 curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \ sudo apt-key add – distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \ sudo tee /etc/apt/sources.list.d/nvidia-docker.list sudo apt-get update 4.使用以下命令安装nvidia-container-toolkit,重启docker sudo apt-get install -y nvidia-container-toolkit #restart docker sudo systemctl restart docker 5.如果本机已安装nvidia-docker2,可以单独完成安装nvidia-container-toolkit,且相互不影响, 官方虽然已经宣布nvidia-docker2 deprecated了,但是继续使用是没问题的 使用上的主要区别 使用nvidia-container-toolkit #使用nvidia-container-toolkit docker run –gpus …

H3C 华三交换机配置物理隔离端口

对于只需要经过uplink连接外网,不需要跟交换机内其他端口交换的端口,可以通过隔离端口组方式实现二层物理隔离。 VLAN-1020 10.20.0.0/16 eg1/0/17-eg1/0/18 access 注意: 1.一个端口只能加入到一个端口隔离组 2.不会隔离经由trunk/uplink的交换 1.创建端口隔离组 # 切换系统视图 sys # 创建物理隔离端口组 [H3C] port-isolate group 1 #切换到GigabitEthernet1/0/17 [H3C] interface GigabitEthernet 1/0/17 #加入端口隔离组1 [H3C-GigabitEthernet1/0/17]port-isolate enable group 1 #打开端口 [H3C-GigabitEthernet1/0/17]undo shutdown #完成 [H3C-GigabitEthernet1/0/17]quit #切换到GigabitEthernet1/0/18 [H3C] interface GigabitEthernet 1/0/18 #加入端口隔离组1 [H3C-GigabitEthernet1/0/18]port-isolate enable group 1 #打开端口 [H3C-GigabitEthernet1/0/18]undo shutdown #完成 [H3C-GigabitEthernet1/0/18]quit 2.管理 #查看端口隔离组 [H3C] display port-isolate group 1

[CENTOS]使用cosfs挂载腾讯云COS到VPS服务器上

[CENTOS]使用cosfs挂载腾讯云COS到VPS服务器上 事前准备 1.准备好用于挂载的Bucket,配置好权限 2.获得可以用于挂载Bucket,accesskey和secret 腾讯官方Cosfs的地址 https://github.com/tencentyun/cosfs/ 1.下载cosfs的安装包 Wget https://github.com/tencentyun/cosfs/releases/download/v1.0.14/cosfs-1.0.14-centos7.0.x86_64.rpm 2.本地安装 sudo yum localinstall cosfs-1.0.14-centos7.0.x86_64.rpm 3.配置访问 将Bucket名称以及具有此Bucket访问权限的AccessKeyId/AccessKeySecret信息存放在/etc/passwd-cosfs文件中。注意这个文件的权限必须正确设置,建议设为640。 echo my-bucket:my-access-key-id:my-access-key-secret > /etc/passwd-cosfs chmod 640 /etc/passwd-cosfs 4.将Bucket挂载到指定目录。 # 读取 Cosfs my-bucket my-mount-point -ourl=my-cos-endpoint # 777权限方式 Cosfs my-bucket my-mount-point -ourl=my-cos-endpoint -oallow_other 5.卸载已挂载的磁盘 fusermount -u my-mount-point 几个坑 1.如果当远程硬盘用,允许非Root用户和其他用户读写,需要加-oallow_other, 2.cosfs 会扫描cos里面的文件内容,如果文件比较多,还是避免ls,find之类的操作。 3.不建议使用fstab方式开机启动,可能会让你的vps无法重启 参考 https://cloud.tencent.com/document/product/436/6883

[CENTOS]使用ossfs挂载aliyun OSS到VPS服务器

[CENTOS]使用ossfs挂载aliyun OSS到VPS服务器 事前准备 1.准备好用于挂载的Bucket,配置好权限 2.获得可以用于挂载Bucket,accesskey和secret 1.下载安装ossfs安装包 wget http://gosspublic.alicdn.com/ossfs/ossfs_1.80.6_centos7.0_x86_64.rpm 2.本地安装 sudo yum localinstall ossfs_1.80.6_centos7.0_x86_64.rpm 3.配置访问 将Bucket名称以及具有此Bucket访问权限的AccessKeyId/AccessKeySecret信息存放在/etc/passwd-ossfs文件中。注意这个文件的权限必须正确设置,建议设为640。 echo my-bucket:my-access-key-id:my-access-key-secret > /etc/passwd-ossfs chmod 640 /etc/passwd-ossfs 4.将Bucket挂载到指定目录。 # 非共享 ossfs my-bucket my-mount-point -ourl=my-oss-endpoint # 777权限方式,非root用户可以用 ossfs my-bucket my-mount-point -ourl=my-oss-endpoint -o allow_other 5.卸载已挂载的 fusermount -u my-mount-point 几个坑 1.如果要支持写入,并且控制文件权限,用户必须对Bucket有完全控制权限,否则下次挂载以后权限配置丢失。 2.如果当远程硬盘用,允许非Root用户和其他用户读写,需要加-o allow_other, 3.大文件上传会在OSS Bucket存储碎片,尽量减少大文件的传送,内网再快也是有延迟的。 4.流方式或者低级别的磁盘读写会直接卡死OSS,比如dd命令。毕竟不是真硬盘。 5.ossfs 会扫描oss里面的文件内容,如果文件比较多,还是避免ls,find之类的操作。 6.不建议使用fstab方式开机启动,可能会让你的vps无法重启 参考 https://help.aliyun.com/document_detail/153892.html?spm=a2c4g.11186623.6.750.2b03142bM5YPG3

H3C华三交换机配置Vlan,使用简单的单臂模式

H3C华三交换机配置Vlan,使用简单的单臂模式 VLAN配置一览 VLAN-1 0.0.0.0/0 default VLAN-10 10.0.0.0/8 eg1/0/23 eg1/0/24 trunk uplink bridge-aggregation VLAN-31 172.16.0.0/16 eg1/0/1-eg1/0/4 access VLAN-32 172.17.0.0/16 eg1/0/5-eg1/0/8 access VLAN-410 192.168.100.0/24 eg1/0/9-eg1/0/12 access VLAN-420 192.168.200.0/24 eg1/0/13-eg1/0/16 access VLAN-999 10.0.99.0/24 eg1/0/22 access manage 1.创建链路汇聚上行口 # 切换系统视图 sys # 创建链路汇聚接口,id=1 [H3C] interface bridge-aggregation 1 # 设置汇聚类型为动态, mode默认为static [H3C-Bridge-Aggregation1] link-aggregation  mode static | dynamic # 设置为trunk上行主干 [H3C-Bridge-Aggregation1] port link-type …

H3C 华三交换机配置光口双线链路聚合

两台H3C华三交换机交换机配置双线链路聚合 链路模式 Switch-A Switch-B 0.事前准备 准备好串口转RJ45连接线,连接电脑与交换机的console口 1.使用串口软件连接到交换机的console口 连接参数可以参考交换机的说明书,H3C的参数如下: 波特率(Baud rate) = 9600 数据位(Data) = 8bits 校验位(Parity) =None 停止位(Stop) = 1bit 流 控(Flow control) = 0 连接软件可以用HyperTerminal、TeraTerm 2.在交换机Switch-A上完成命令,uplink用的物理端口为ge1/0/25和ge1/0/26 # 切换系统视图 sys # 创建链路汇聚接口,id=1 [H3C] interface bridge-aggregation 1 # 设置汇聚类型为动态, mode默认为static [H3C-Bridge-Aggregation1] link-aggregation  mode static | dynamic # 设置为trunk上行主干 [H3C-Bridge-Aggregation1] port link-type trunk # 设置允许所有vlan上行 [H3C-Bridge-Aggregation1] port trunk permit …