基本情况

服务器目前拥有两台GPU,分别为:
GPU0-RTX3090 24G
GPU1-泰坦 12G


使用前请务必检查服务器负载,因为使用人数较少不进行个人资源限制。

因管理员太菜,容器出现问题修不了,只能删机重来(甚至删机命令都是百度的),请务必明确自己发出的每一条指令,备份好自己的重要数据,不要当做存储!

1
nvidia-smi

服务器通过 docker 进行虚拟化和管理,所以容器中只保留

/home/ubuntu

目录内的文件。也就是说,自己安装的软件和这个目录之外的东西都不会进行保留!

容器已经内置了 nvidia 驱动、cuda、conda,除非明确知道自己需要做什么!明确知道自己敲入的每一条命令的后果!不要!不要!不要对GPU驱动和网络配置进行任何调整!

如有问题,请联系现任管理员

连接方式

  • 公网连接

    1、下载zerotier,不需要注册,直接下载客户端!加入网络:【联系管理员获取】

    2、联系管理员同意授权网络

    3、通过 SSH 进行连接,访问192.168.67.100:<管理员授权的端口>利用用户名 (默认为 ubuntu)及密码登录,传输文件不要使用 sftp 直接传数据集或者大文件(线路优化使用了流量转发做优化,线路流量挺贵的,钱包顶不住),公共数据集请使用 wget 等从网络直连下载(也就是先存个网盘或者找到下载链接,然后直接下载到服务器)

使用建议

  • 服务器内置了miniconda,可以直接使用conda创建python环境,使用方法请自行搜索或者查看本人可能不太及时更新的博客
  • 服务器内置了tmux,使用tmux可以保持进程,防止ssh断连导致的程序终端,具体使用方法参考百度。

— 下面内容仅供管理员参考记录 —

容器部署:

使用了: https://github.com/gezp/docker-ubuntu-desktop 项目进行部署。
Docker 默认镜像版本为:

1
docker pull gezp/ubuntu-desktop:22.04-cu11.7.1

复制模板文件:

1
cp -r /home/wsh/dockermnt/template /home/wsh/dockermnt/wush

启动 docker:

1
docker run -d --restart=always --name 容器名 --privileged --cap-add=SYS_PTRACE --gpus all --cpus="4" -m="8g" --shm-size=1024m -e USER=ubuntu -e PASSWORD=password -v /home/wsh/dockermnt/容器名/home:/home/ubuntu -p XXX:22 gezp/ubuntu-desktop:22.04-cu11.7.1

所有人配置保存

1
# 加密内容,请查看私有仓库

—下面内容已被弃用 —

宿主机 LXD 设置

  • 添加清华镜像站
1
sudo lxc remote add tuna-images https://mirrors.tuna.tsinghua.edu.cn/lxc-images/ --protocol=simplestreams --public

创建镜像

  • lxc launch <镜像源>:<镜像名> <容器名>
1
lxc launch tuna-images:ubuntu/22.04 user
  • 进入容器并修改密码
1
lxc exec user bash

此方法进入为root用户,其中内置一个ubuntu用户

1
2
passwd root
passwd ubuntu
  • 安装openssh便于用户访问
1
apt-get install openssh-server
  • 注意首次进入系统请先安装显卡驱动!!!**
1
2
3
sudo apt-get update
sudo apt-get install wget
wget https://cn.download.nvidia.com/XFree86/Linux-x86_64/535.104.05/NVIDIA-Linux-x86_64-535.104.05.run --no-check-certificate