CUDA入門・初心者向けの記事です。

【CUDA】CUDA 11.0 のインストールと設定方法
CUDA 11.0のダウンロードからインストール、設定までを行い、
実際にコーディングできるようになるまでの環境の作成方法を説明します。(11.1も同様)

【CUDA】最適化テクニック
高速化の手法として、1Threadごと1Byteづつ処理しているものを、4Byteまとめて処理するものがあるので解説します。

【CUDA】Grid,Block,Thread,Warpについて
Grid,Block,Thread,Warp(グリッド、ブロック、スレッド、ワープ)の関係について解説していきます。

【CUDA】マルチGPUで高速化する
処理性能を上げるためマルチGPU化したい場合、次の方法で使用するGPUを指定することができます。

【CUDA】シェアードメモリの使用方法
GPUのメモリの種類で、シェアードメモリ(SharedMemory/共有メモリ)というものがあります。
最適化をするなら必須の要素なので、ぜひ使い方を覚えましょう。

【CUDA】テクスチャメモリの使用方法 その2
テクスチャメモリ(TextureMemory)の使用方法のパターンその2を解説します。
こちらで解説する方法だと、動的にテクスチャのオブジェクトを生成したり、その他の設定ができます。

【CUDA】テクスチャメモリの使用方法 その1
テクスチャメモリ(TextureMemory)の解説を行います。
スレッド内で連続したメモリ領域にアクセスした場合、 キャッシュが効くので グローバルメモリよりも高速化できる可能性があります。

【CUDA】ブロック・スレッドを2次元で使う
CUDAのスレッドは2次元で持つことができるので、その使い方の解説をします。

【CUDA】ストリームを使いこなして高速化する
GPUで複数処理をしたい場合、ストリーム(Stream)を利用すると効率的に処理をさせることができます。
この記事では、ストリームの特徴や使い方について解説します。

【CUDA】NsightのTimelineの使い方
CUDAでコーディングをしているとき、GPUで何が起きているか判らないですよね。
そんなときは、Nsightというツールを使って処理の解析をしましょう。