要让pytorch模型在昇腾卡上的容器内执行,需要以下几个条件:
以上几个步骤只要有一环做错,最后的模型部署都无法完成。
要让模型在容器内跑起来,不必在容器外安装CANN驱动。但在容器内得安装CANN驱动也行。
本文会围绕第二点说明,如何选取正确版本的CANN驱动并安装。在安装好npu驱动后,还需要安装CANN-toolkit、CANN-kernels包,安装方式最好下载.run包并执行。CANN有三种系列,对外社区版,对外商业版,对内版。
从昇腾官网进入CANN链接,
来到CANN页面,如图选社区版或商用版。
点"社区版"会跳到下图页面。社区版的版号一般带有alpha1
、beta1
之类的字样。
点"商业版"会跳到下图页面。商业版的版号可以是7.0.0、7.0.RC1之类的。
你要找的安装包需要:
符合条件的例子比如Ascend-cann-toolkit_7.0.0_linux-aarch64.run
、Ascend-cann-kernels-910b_7.0.0_linux.run
。把它们下载后就可以安装到镜像了。
对内版的CANN包在CMC网站搜索。该网站外部不可访问,只能内部访问。
安装CANN包的指令并不复杂,如果是run包的话执行它即可,但要附带参数。有两份教程可供参考,读者可以选择与自己CANN包对应的版本:
参考命令如下:
chmod +x Ascend-cann-toolkit_7.0.RC1_linux-aarch64.run
./Ascend-cann-toolkit_7.0.RC1_linux-aarch64.run --install --install-for-all --quiet