Cloud 常用命令
Contents
Google cloud 操作
增加 ssh key
ssh-keygen # -t rsa -b 4096 -C account_name
# copy the content in *.pub to google cloud user keys.VM 相关
创建和删除 VM
在 web 界面中按步骤操作即可。
注意:
- 在高级选项中的 availability policies,课选择 spot。可大幅减少计算成本。 使用 Admin 创建的 image,可以使用 NFS,已有 environment。
登录 VM
使用 gcloud 登录较为方便,命令如下
gcloud compute ssh --zone "us-central1-c" "xux-a100-test" --project "pi-xin"关闭 VM
有时候 A100 80G 的 GPU 无法在界面中关闭,这时候需要在命令行中关闭。
sudo shutdown nowNFS 相关
加载 NFS
使用 Saif 的 image,可自动加载 NFS
使用 Saif 创建的 NFS,可以长期保存计算数据和环境
需要使用 Saif 的 image 来创建 instance
创建 instance 后,需要运行 shell 命令来加载 instance
sudo /scratch/ADMIN/enviornment.sh
# then type the current username上传和下载文件
rsync -a -e “ssh -i path_private_key” path_or_dic_local username@address:path_or_dic_remote Buckets 相关
创建和删除 Buckets
在 web 界面按步骤操作即可。
上传数据到 buckets
使用 gsutil 操作较为方便,命令如下
gsutil -m cp -r Petase-gen gs://xux-bucket在 VM 中加载(mount) bucket
gcsfuse xux-bucket mount-empty-dir/卸载(unmount) bucket
fusermount -u mount-empty-dir/向 bucket 中写入文件
是的说法删除 bucket 中的文件
是的说法布置Conda 环境
安装 Mambaforge
mamba 远远快于 conda。mambaforge 是 miniconda 的替代品。
# wget https://github.com/conda-forge/miniforge/releases/latest/download/Mambaforge-Linux-x86_64.sh
bash Mambaforge-Linux-x86_64.sh创建 conda 环境
mamba env create -f environment.ymlGoogle Colab 使用
Google Colab 是谷歌提供的免费计算资源,使用 Google Cloud 来进行计算。
它会有默认的部署环境,通常是 python 3.10。常用的机器学习依赖包都已经安装好。
线下部署 Google Colab 环境,需要有一个相似的环境,会比较容易实现。
链接 Google Drive
from google.colab import drive
drive.mount('/content/drive')AWS 操作
从 AWS 下载数据
# example
aws s3 cp s3://BUCKET/ folder --exclude "*" --include "2018-02-06*" --recursive
# folder download
aws s3 cp --recursive s3://nanopore-human-wgs/rna/Multi_Fast5/ ./
# single document download
aws s3 cp s3://nanopore-human-wgs/rna/fastq/NA12878-cDNA_All_Guppy_4.2.2.fastq.gz ./
Xiaopeng Xu