CUDA by exampleを読んだときのメモ:第4章「Parallel Progmramming in CUDA C」(書きかけ)

4.1 4章の目的

  • いかにしてCUDAは並列に処理するか
  • CUDA Cで並列codeを書いてみる

4.2 CUDA並列プログラミング

  • __global__を入れれば動くには動くが、それだけではGPUを生かし切れていない
  • ベクトル(一次元配列)同士の和
  • CPUでは具体的にこうやって処理
  • GPUではこうなっている
  • ブロック辺りのスレッド数を1にした例で解説
  • Julia SetをGPUで書いてみる
4.2.1 ベクトルの和

4.3 4章のまとめ

  • 複数のblockを設定して並列codeを書いた