アセンブラの敷居を一気に下げた「読み物」

- 作者: 坂井弘亮
- 出版社/メーカー: 秀和システム
- 発売日: 2017/09/15
- メディア: 単行本
- この商品を含むブログ (2件) を見る
とにかくとっきにくいアセンブラ、技術書を読もうにも上手く進まない。そんな場合はこの読み物(技術書ではない)が最高の入り口になると思います。分厚いですが、さくさく読めてしまうのが不思議です。読み物ですので、かなり自由に読めてしまいます。
C++の学習

- 作者: ロベール
- 出版社/メーカー: 毎日コミュニケーションズ
- 発売日: 2007/11/15
- メディア: 単行本(ソフトカバー)
- 購入: 26人 クリック: 25,357回
- この商品を含むブログ (127件) を見る
FortranからHPCに入った人は結構いらっしゃると思います
最初の一冊。

- 作者: ハーバート・シルト,柏原正三,トップスタジオ
- 出版社/メーカー: 翔泳社
- 発売日: 2007/12/06
- メディア: 大型本
- 購入: 1人 クリック: 23回
- この商品を含むブログ (15件) を見る
Cの変態(?)的な性質を整理するにはこちら。

- 作者: 前橋和弥
- 出版社/メーカー: 技術評論社
- 発売日: 2001/01/01
- メディア: 単行本
- 購入: 22人 クリック: 147回
- この商品を含むブログ (75件) を見る
C++もご一緒に。

C++クラスと継承完全制覇 (標準プログラマーズライブラリ)
- 作者: 矢沢久雄
- 出版社/メーカー: 技術評論社
- 発売日: 2002/09/01
- メディア: 単行本
- 購入: 3人 クリック: 92回
- この商品を含むブログ (32件) を見る

- 作者: ハーバート・シルト
- 出版社/メーカー: 翔泳社
- 発売日: 2015/11/25
- メディア: Kindle版
- この商品を含むブログを見る
基本を一通り仕上げるには。

- 作者: スティーブオウアルライン,Steve Oualline,望月康司,クイープ
- 出版社/メーカー: オライリージャパン
- 発売日: 2003/09/01
- メディア: 単行本
- 購入: 6人 クリック: 70回
- この商品を含むブログ (35件) を見る
CUDA5によるGPUプログラミングの書籍
CUDA5の書籍は、世界初だそうです。
目次見る限り、結構基本的なそれを扱っているようです。
CUDA5ならではの機能を盛り込んだ内容なのでしょうか?注目です。
注文したので、感想かメモを書く予定です。

GPUプログラミング入門 -CUDA5による実装 (KS情報科学専門書)
- 作者: 伊藤智義
- 出版社/メーカー: 講談社
- 発売日: 2013/04/23
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (1件) を見る
GTX Titanのnbody benchmark
とりあえずnbodyを。
float
[t_azu@linux]$ ./nbody -benchmark Run "nbody -benchmark [-numbodies=<numBodies>]" to measure perfomance. -fullscreen (run n-body simulation in fullscreen mode) -fp64 (use double precision floating point values for simulation) -hostmem (stores simulation data in host memory) -benchmark (run benchmark to measure performance) -numbodies=<N> (number of bodies (>= 1) to run in simulation) -device=<d> (where d=0,1,2.... for the CUDA device to use) -numdevices=<i> (where i=(number of CUDA devices > 0) to use for simulation) -compare (compares simulation results running once on the default GPU and once on the CPU) -cpu (run n-body simulation on the CPU) -tipsy=<file.bin> (load a tipsy model file for simulation) > Windowed mode > Simulation data stored in video memory > Single precision floating point simulation > 1 Devices used for simulation GPU Device 0: "GeForce GTX TITAN" with compute capability 3.5 > Compute 3.5 CUDA device: [GeForce GTX TITAN] 14336 bodies, total time for 10 iterations: 30.587 ms = 67.193 billion interactions per second = 1343.858 single-precision GFLOP/s at 20 flops per interaction
double
[t_azu@linux]$ ./nbody --benchmark -fp64 Run "nbody -benchmark [-numbodies=<numBodies>]" to measure perfomance. -fullscreen (run n-body simulation in fullscreen mode) -fp64 (use double precision floating point values for simulation) -hostmem (stores simulation data in host memory) -benchmark (run benchmark to measure performance) -numbodies=<N> (number of bodies (>= 1) to run in simulation) -device=<d> (where d=0,1,2.... for the CUDA device to use) -numdevices=<i> (where i=(number of CUDA devices > 0) to use for simulation) -compare (compares simulation results running once on the default GPU and once on the CPU) -cpu (run n-body simulation on the CPU) -tipsy=<file.bin> (load a tipsy model file for simulation) > Windowed mode > Simulation data stored in video memory > Double precision floating point simulation > 1 Devices used for simulation GPU Device 0: "GeForce GTX TITAN" with compute capability 3.5 > Compute 3.5 CUDA device: [GeForce GTX TITAN] 14336 bodies, total time for 10 iterations: 103.493 ms = 19.858 billion interactions per second = 595.751 double-precision GFLOP/s at 30 flops per interaction
GTX Titan注文、近日中に届く様子
届き次第、nbodyくらいは数字を出します。手元にPCI-Express2.0環境しか無いのはちょっと残念ですが。
GeForce GTX Titanの倍精度は1.3TFLOPS、単精度では4.5TFLOPS
The GeForce Titan will churn out single precision performance 4.5 TFlops and 1.3 TFlops double precision.
これが本当ならすごい話ですね。