CUDA

CUDA の Texture Memory で float3 のような3要素の型は fetch できない

試した環境 Microsoft Visual Studio Community 2019 Version 16.8.6 NVIDIA CUDA 11.0 本題 CUDA の Texture Memory は int4 や float2 のような 1,2,4 要素の整数型と単精度浮動小数点型が利用できます。 逆に言うと float3 のような3要素の型は使えません…

__constant__ で宣言した構造体の変数を初期化する場合は初期化子リストか constexpr で宣言した変数を使用する【CUDA】

試した環境 Microsoft Visual Studio Community 2019 Version 16.8.3 NVIDIA CUDA 11.0 本題 先に試したコードを載せます。 #include "cuda_runtime.h" #include "device_launch_parameters.h" #include <stdio.h> struct Point { int x; int y; }; __constant__ Poin</stdio.h>…

__constant__ で宣言した変数はホスト側で参照できない【CUDA】

試した環境 Microsoft Visual Studio Community 2019 Version 16.8.3 NVIDIA CUDA 11.0 本題 __constant__ で宣言した変数はデバイス側の変数ですが、ホスト側で使用するグローバル変数のような初期化の書き方ができます。 だからと言ってホスト側で直接参照…

Visual Studio の CUDA 11.0 Runtime プロジェクトのデフォルトソースコード実行時に addWithCuda failed! と出るときは Code Generation の値を確認する

試した環境 Microsoft Visual Studio Community 2019 Version 16.8.3 NVIDIA CUDA 11.0 GeForce GTX 750 本題 Visual Studio の CUDA 11.0 Runtime プロジェクトのデフォルトソースコードで、ビルドは通ったものの実行時に以下のメッセージが表示されました…