NVIDIA CUDA Compiler
作者 | NVIDIA |
---|---|
種別 | コンパイラ |
ライセンス | プロプライエタリソフトウェア |
公式サイト |
docs |
Nvidia CUDA コンパイラ (NVCC)は、CUDAとの使用を目指したNVIDIAによるプロプライエタリコンパイラである。CUDAコードは、CPUとGPUの両方で動作する。NVCCはCPUとGPUを分離し、ホストコード(CPU上で実行される部分のコード)をGCC、Intel C++ Compiler、あるいはMicrosoft Visual CのようなC言語コンパイラへ転送する。そして、デバイスコード(GPU上で実行する部分)をGPUへ転送する。デバイスコード(PTX)は、さらにGPU固有のバイナリコードへコンパイルされる。NVCCはLLVMに基づいている[1]。NVIDIAが提供した資料に従うと、nvccはバージョン7.0でC++11標準と少数のC99の機能によって定義される多くの言語構造をサポートしている。バージョン9.0においてC++14標準由来のより多くの言語構造がサポートされている[2]。
CUDAの言語拡張(.cu)を含んでいるあらゆるソースファイルは、nvccでコンパイルされる。NVCCは、コンパイラドライバであり、全ての必要なツールとcudacc、g++、clなどのようなコンパイラによって動作する。NVCCは、C code(CPUコード)、PTX(GPU擬似アセンブラ)、あるいはオブジェクトコード(GPUで直接実行可能)のいずれも出力できる。C codeは、CPU用のコードなので、他のツールを使ってアプリケーション(CPU用コードで書かれている)の他の部分と一緒にコンパイル・リンクされなければならない。CUDAコードを含んだ実行ファイルは、CUDAコアライブラリ(cuda)とCUDAランタイムライブラリ(cudart)を必要とする。
他の広く使われているライブラリは以下のものがある。
- CUBLAS: BLAS の実装
- CUFFT: FFT の実装
- CUDPP (Data Parallel Primitives): 並列プログラミングで使用する Reduction, Scan, Sort
- Thrust: 並列プログラミングで使用する Reduction, Scan, Sort
関連項目
[編集]出典
[編集]- ^ “CUDA LLVM Compiler”. NVIDIA Corporation. Apr 6, 2016閲覧。
- ^ https://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#c-cplusplus-language-support
- David B. Kirk, and Wen-mei W. Hwu. Programming massively parallel processors: a hands-on approach. Morgan Kaufmann, 2010.
- Nvidia Documentation on nvcc. http://docs.nvidia.com/cuda/cuda-compiler-driver-nvcc/
- CUDPP. http://gpgpu.org/developer/cudpp