Error

An error occurred.

Sorry, the page you are looking for is currently unavailable.
Please try again later.

If you are the system administrator of this resource then you should check the error log for details.

Faithfully yours, nginx.

帮助文档(华北一、二)
  • 1. 检查GPU设备

    $ yum install pciutils

    $ sudo lspci | grep NVIDIA                                  

    3D controller: NVIDIA Corporation Device 1b38 (rev a1) 表示为P40

    2. 获取CUDA网络源,并配置

    NVidia官方源地址:

    http://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/

    $ wget http://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/cuda-repo-rhel7-8.0.61-1.x86_64.rpm

    $ rpm -Uvh cuda-repo-rhel7-8.0.61-1.x86_64.rpm

    注:安装nvidia驱动需要kernel-devel包,安装方法如下:

    $ wget http://vault.centos.org/7.0.1406/updates/x86_64/Packages/kernel-devel-3.10.0-123.4.4.el7.x86_64.rpm

    $ wget http://vault.centos.org/7.0.1406/updates/x86_64/Packages/kernel-headers-3.10.0-123.4.4.el7.x86_64.rpm

    $ rpm -Uvh kernel-devel-3.10.0-123.4.4.el7.x86_64.rpm

    $ rpm -Uvh kernel-headers-3.10.0-123.4.4.el7.x86_64.rpm

    3. 安装 cuda 8.0

    $ yum install cuda-8-0

    3.1 查看驱动状态

    $ sudo nvidia-smi

    看到如下输出表示GPU驱动正常:

    4. 测试GPU基本功能(可选)

    4.1 增加LD path

    $ export LD_LIBRARY_PATH="/usr/local/cuda-7.5/lib64:/usr/lib64/:$LD_LIBRARY_PATH"

    4.2 安装cuda examples

    $ cd /usr/local/cuda/bin

    $ sh cuda-install-samples-8.0.sh ~/cuda-test/

    $ cd ~/cuda-test/NVIDIA_CUDA-8.0_Samples

    $ make

    $ ./bin/x86_64/linux/release/deviceQuery 获取设备状态

    $ ./bin/x86_64/linux/release/bandwidthTest 测试设备带宽

    Note: 如果编译过程发现lnvcuvid的错误,可以执行:

    $ find . -type f -execdir sed -i 's/UBUNTU_PKG_NAME = "nvidia-367"/UBUNTU_PKG_NAME = "nvidia-375"/g' '{}' \    

    其中nvidia-375是当前安装的驱动的版本。

    5. 安装cudnn

    (选装,注:不同AI框架对cudnn的版本支持不同)

    5.1  https://developer.nvidia.com/cudnn 下载cudnn软件包。需要注册nvidia账号后才能下载。

    注意:CentOS 下载 cuDNN v5.1 Library for Linux

    5.2 安装(案例使用cudnn5.1, 因为TensorFlow目前仅支持5.1

    $ tar -zxf cudnn-8.0-linux-x64-v5.1.tgz

    (解压的路径可以自由选择,一般是/usr/lib下面,这边假设为<CUDNN_INSTALL_PATH>

    $ export LD_LIBRARY_PATH=:$LD_LIBRARY_PATH

    6.其他

    nvidia-smi 发现 GPU使用率100%

    这个问题是系统读取gpu状态信息不准确导致,执行下列命令可更正,让系统读取命令正确。

    # nvidia-smi -pm 1

     



文档是否已解决您的问题?

  已解决   未解决

如您有其它疑问,您也可以与我们技术专家联系探讨。

联系技术专家