プログラミング

CUDA入門

【CUDA】最適化テクニック

高速化の手法として、1Threadごと1Byteづつ処理しているものを、4Byteまとめて処理するものがあるので解説します。
2019.09.22
CUDA入門

【CUDA】Grid,Block,Thread,Warpについて

Grid,Block,Thread,Warp(グリッド、ブロック、スレッド、ワープ)の関係について解説していきます。
2019.09.22
C++

【CUDA】マルチGPUで高速化しよう

処理性能を上げるためマルチGPU化したい場合、次の方法で使用するGPUを指定することができます。
2019.09.22
スポンサーリンク
CUDA入門

【CUDA】シェアードメモリの使用方法

GPUのメモリの種類で、シェアードメモリ(SharedMemory/共有メモリ)というものがあります。 最適化をするなら必須の要素なので、ぜひ使い方を覚えましょう。
2019.09.22
CUDA入門

【CUDA】テクスチャメモリの使用方法 その2

テクスチャメモリ(TextureMemory)の使用方法のパターンその2を解説します。 こちらで解説する方法だと、動的にテクスチャのオブジェクトを生成したり、その他の設定ができます。
2019.09.22
CUDA入門

【CUDA】テクスチャメモリの使用方法 その1

テクスチャメモリ(TextureMemory)の解説を行います。 スレッド内で連続したメモリ領域にアクセスした場合、 キャッシュが効くので グローバルメモリよりも高速化できる可能性があります。
2019.09.22
CUDA入門

【CUDA】ブロック・スレッドを2次元で使う

CUDAのスレッドは2次元で持つことができるので、その使い方の解説をします。
2019.04.14
CUDA入門

【CUDA】ストリームを使いこなして高速化しよう

GPUで複数処理をしたい場合、ストリーム(Stream)を利用すると効率的に処理をさせることができます。 この記事では、ストリームの特徴や使い方について解説します。
2019.09.22
CUDA入門

【CUDA】NsightのTimelineで処理を解析しよう!

CUDAでコーディングをしているとき、GPUで何が起きているか判らないですよね。 そんなときは、Nsightというツールを使って処理の解析をしましょう。
2019.09.22
CUDA入門

【CUDA】ページロックメモリ(Page-Lockedメモリ)について

GPUにデータを転送するとき、ページロック(Page-Locked)がされているかどうかで速度が大幅に変わります。 ロックのやり方や、特性について解説していきます。
2019.09.22