X86 Linux PCのGPUDirect RDMA、ドライバのビルドの問題

X86 Linux PCのGPUDirect RDMA、ドライバのビルドの問題

以下のリンクに記載されているようにGPUDirect RDMAを実行しようとしています。私はQuadro M4000 GPUとCUDA 12.0ツールバーを含むX86 Linux PCを使用しています。ドライバの構築とCUDAプログラミングの実行中に、次のエラーが発生します。

GPUDirect_RDMA

カーネルモジュールを構築するためにコマンドを実行すると、./build-for-pc-native.sh次のエラーが発生します。

Building modules, stage 2.
** MODPOST 1 modules**
**FATAL: parse error in symbol dump file
scripts/Makefile.modpost:92: recipe for target ‘__modpost’ failed
make[2]: *** [__modpost] Error 1
Makefile:1678: recipe for target ‘modules’ failed
make[1]: *** [modules] Error 2
make[1]: Leaving directory ‘/usr/src/linux-headers-5.4.0-136-generic’
Makefile:19: recipe for target ‘modules’ failed
make: *** [modules] Error 2**

上記のエラーを防ぐためにコマンドを実行し、モジュールを./build-for-any-no-cuda-native.shビルドしてロードしました。ところで、client-applications/./build-for-pc-native.shユーザアプリケーションに対してコマンドを実行すると、エラーが再び発生します。

make: Nothing to be done for ‘default’

上記のgithubリンクで提供されているデータアクセステストを実行すると、このエラーは無視され、コマンドを実行してもエラーは表示されません./rdma-malloc。ただし、このコマンドを実行すると、./rdma-cuda次のエラーが発生します。

ioctl(PIN_CUDA src) failed: ret=-1 errno=22.

この操作を再実行したときにset leds testコマンドを実行しましたが、./set-leds 7エラーが発生しました。

open() failed: Permission denied

ただし、コマンドの前にこの単語を使用するとsudoエラーは発生しません。

上記のエラーの原因と発生原因をご存知ですか?このトピックに答えてください。

ベストアンサー1

おすすめ記事