新建一个普通任务,调整好任务参数(包括CPU、GPU和内存数量),将运行的指令设置为 sleep infinity ,并使用SSH拓展服务(参考“高级进阶技巧”中的“如何使用SSH 拓展功能”)。这个任务作业会无限期睡眠,但是由于此任务会占用GPU,为了最大化利用集群的计算资源,请在调试结束后停止该作业,管理员会定期检查此类调试任务。

使用命令行进行调试

image.png
在得到SSH的登录信息后,复制红框中的命令,在终端中(Windows的Powershell或者LInux的任意终端)输入复制的命令并且按回车即可登录到容器中。
image.png
之后,即可以使用ipdb或者其他调试工具在命令行中进行调试。

使用VSCode进行调试

前期准备:
A. 安装VSCode,并在插件市场中安装 Remote-SSH插件
B. 在Chrome中安装Tampermonkey插件程序,然后安装OpenPAI的增强脚本
image.png
安装完成之后,在OpenPAI的任务详情页将会新增一个Open in OpanPAI按钮(如上图),点击该按钮会在在VSCode中打开远程开发窗口。之后的调试步骤就和正常的VSCode调试没有任何区别。
image.png