人工智能(AI)的迅猛发展正深刻影响着学术界和工业界。AI技术的进步依赖于处理海量数据和复杂模型的能力,因此,高性能计算(HPC)平台成为推动AI研究和应用的关键工具。尽管HPC在技术上提供了强大的支持,其使用的复杂性却给学术研究人员和工业从业者带来了挑战。许多研究人员和工程师面临着平台配置繁琐、资源调度复杂以及编程模型不友好的问题,这些因素可能延缓AI项目的开发进程。
SCOW(Super Computing On Web)是一个基于Web的超算门户和管理系统,旨在解决这些使用障碍。通过SCOW,超算用户无需安装任何软件,只需使用现代浏览器即可高效利用超算资源完成计算任务。用户可以通过网页界面进行作业提交、文件管理、终端调用、用户管理等多项操作,极大降低了使用门槛。
本教程通过一系列在SCOW上运行AI的案例,帮助用户快速掌握在HPC环境中进行AI学习和研究的方法,助力学术界和工业界更高效地利用高性能计算资源。
下面我们首先介绍如何在 SCOW 平台上申请计算资源,然后通过简单案例 Tutorial 0 介绍如何在 SCOW 平台上进行计算,最后是 AI 相关的教程介绍。
1. 登陆
登陆后显示 dashboard 界面:

其中 “shell” 可用于打开联网的命令行窗口。
“交互式应用” 可以打开桌面窗口、Matlab、RStudio、Jupyter notebook、Jupter Lab 等交互式应用。
“文件管理” 可用于管理、上传、下载文件。
我们的教程是使用 Jupyter Lab 运行的,所以需要在 “交互式应用” 中创建 Jupter Lab 应用。但在创建 Jupter Lab 应用之前,需要先在 “shell” 中安装 jupyter,才能成功创建。
2. 安装 Conda

在联网的命令行运行下面命令安装 conda
# 1. 获得最新的miniconda安装包;
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
# 2. 安装到自己的HOME目录下software/miniconda3中,这个目录在安装前不能存在,否则会报错;
sh Miniconda3-latest-Linux-x86_64.sh -b -p ${HOME}/software/miniconda3
# 3. 安装成功后可以删除安装包,节省存储空间
rm -f Miniconda3-latest-Linux-x86_64.sh
# 4. 将环境变量写入~/.bashrc文件中;(下面这句话,添加到~/.bashrc文件中)
export PATH=${HOME}/software/miniconda3/bin:$PATH
# 5. 退出重新登录或者执行以下命令,即可导入 conda 环境
source ~/.bashrc
# 6. 检查是否安装成功
conda --version创建conda环境并安装 Jupyter
conda create -n tutorial0 python
conda activate tutorial0
pip install notebook jupyterlab3. 创建 Jupyter Lab 应用
点击 dashboard 上的 “交互式应用”,点击 “创建应用”, 点击 “JupyterLab”,填写相应的资源,点击最下方的 “提交”,进行创建。


创建成功后显示 “Running”,点击 “连接” 进入

1. 获取教程所需文件
wget https://www.pkuscow.com/tutorial/scow/tutorial.tar.gz
tar -xzf tutorial.tar.gz2. 运行 Tutorial 0
在所下载的教程文件夹中打开 tutorial/Tutorial0_hello_world/tutorial0_hello_world.ipynb 文件。可以看到文件中有 markdown 单元格和 python 代码单元格。用鼠标点击选中单元格后,“Ctrl + Enter” 可运行单元格,markdown 在运行后起到渲染的效果,python 会在下方输出结果。注意:苹果电脑使用的快捷键会有所不同。

3. Jupyter Lab 中使用命令行
除了在 SCOW 中使用 shell 外,还可以使用 Jupyter Lab 提供的命令行终端。

部分集群中, 数据和模型已经提前下载好在公用存储下:
数据
/lustre/public/tutorial/data
模型
/lustre/public/tutorial/models
如果您所用的集群中不含上述目录,则需按后续教程中的提示进行下载
教程目前由 10 个独立的案例构成:
作者: 黎颖; 龙汀汀
联系方式: yingliclaire@pku.edu.cn; l.tingting@pku.edu.cn
测试由 褚苙扬(cly2412307718@stu.pku.edu.cn)同学完成