2010-02-01から1ヶ月間の記事一覧

FORTRANでの並列計算:同じ人が著者に入っている教科書を読む(書きかけ)

著者が同じ本を読むことは、理解を助ける有効な手段だと思います。 並列計算法入門 並列計算法入門 (計算力学レクチャーシリーズ)作者: 樫山和男,牛島省,西村直志,日本計算工学会出版社/メーカー: 丸善発売日: 2003/09/01メディア: 単行本購入: 2人 クリック…

GPGPUはPCI Expressがボトルにネックになるから並列計算には無理、というお話しについて

複数nodeを抱えるような並列計算で、一昔前のPCクラスタや小規模PCクラスタでよくある仕様で、PCI経由でEthernetでnode間を接続してしまうと(そしてnode間にそれなりの通信量がある場合)、node間通信もボトルネックになってしまうわけで、それは速度だけ見…

FORTRANの人がGPGPUを使って性能を出すために必要なこと

FORTRANからCUDAを呼ぶ2にあるやり方で、あと残り二つになりました。 CUDAで(FORTRANに比べて)性能が出せそうな(且つ、FORTRANでボトルネックとなっているならなお良い)部分をCUDA化し、GPGPUで計算させる CPUとGPGPUの間での通信量を出来る限り少なく…

CUDA本の充実を願う

フィックスターズの人にCUDAの解説書を書いて欲しい、と思う今日この頃。OpenCL本だけじゃなくて。 アスキドットテクノロジーズの解説記事が良くまとまっていたので。もう一回載せます。ASCII .technologies ( アスキードットテクノロジーズ ) 2009年 12月号…

FortranからCUDAを呼ぶその2:CUDAをFortranから呼び出してみる

CUDAを呼び出してみます。題材とさせて貰うのは、GPGPU 勉強会 - CUDA Samplesの配列の足し算/最低限 GPGPUです。 vecadd_v1.cu→「vecadd_v1_CUDA.cu, vecadd_v1_main.f90」へと書き換えました。以下code例です。 vecadd_v1_CUDA.cu #include <stdio.h> // 配列の足し</stdio.h>…

FortranからCUDAを呼ぶその1:C言語をFortranから呼び出してみる

CUDAを呼び出す前に、C言語を呼び出してみます。題材とさせて貰うのは、GPGPU 勉強会 - CUDA Samplesの配列の足し算/C言語による例です。 vecadd.c→「vecadd_C.c, vecadd_main.f90」へと書き換えました。以下code例です。 vecadd_C.c #include <stdio.h> // 配列の足</stdio.h>…

CUDAに将来はあるのか

方法その1をとる、と書いておきながら何ですが。これは要するにnvidia(�Fermi)の将来でもあるのですが。Fortranの人が一生懸命(?)CUDA勉強しても無駄(?)になるかもしれません。 あんまり将来のこと考えすぎても何も出来なくなるのですが、無理のない…

Fortranの人のためのCUDA

FortranからCUDAへの置き換え|株式会社EASIZE NVIDIAのCUDAアーキテクチャGPUにおけるFortranサポート

Fortranの人がCUDAの恩恵を受けるには

3つの方法があります。 真面目に(?)CUDA Cで書く CUDA化されたライブラリをFortranから呼ぶ PGI Fortranコンパイラを使う コンパイラ指示行挿入によるプログラミング(PGIアクセラレータ) 明示的にCUDA APIを使った、いわゆるCUDA Fortran どれもこれも実…

SofTekのPGI Fortranのサイトから

わかりやすかったので紹介。 マルチコアCPU上の並列化手法、その並列性能と問題点 メインメモリとCPU間のスループットが実効性能に与える影響については、以下のサイトも詳しく解説しています。 HPCテクノロジーズ/STREAMベンチマークテストによるXeon(R) (N…

GTX240bandwidthTest

そしてロープロファイルGT240のbandwidthTestも。 Device 0: GeForce GT 240 Quick Mode Host to Device Bandwidth, 1 Device(s), Paged memory Transfer Size (Bytes) Bandwidth(MB/s) 33554432 5298.8 Device to Host Bandwidth, 1 Device(s), Paged memor…

ロープロファイルのGT240のdevicequery

そしてdeviceQueryを。 Device 0: "GeForce GT 240" CUDA Driver Version: 3.0 CUDA Runtime Version: 3.0 CUDA Capability Major revision number: 1 CUDA Capability Minor revision number: 2 Total amount of global memory: 1073545216 bytes Number of…

ロープロファイルのGT240でCUDA

LEADTEK ビデオカード WinFast GT240 1GB DDR3 LP WFGT240-1GD3LP出版社/メーカー: LEADTEK発売日: 2009/11/18メディア: Personal Computersこの商品を含むブログを見るロープロファイルのGT240でもCUDAを使うことにしました。基本、ロープロファイルである…

GT240のbandwidthTest

$ bandwidthTest Running on...... device 0:GeForce GT 240 Quick Mode Host to Device Bandwidth for Pageable memory. Transfer Size (Bytes) Bandwidth(MB/s) 33554432 5256.1 Quick Mode Device to Host Bandwidth for Pageable memory. Transfer Size …

CUDAの勉強でよく行くウェブサイトまとめ

お世話になっている/いたサイトです。順不同。 CUDA全般 技術ブログ - トータル・ディスクロージャ・サイト(事実をありのままに) NVIDIAフォーラム Learn More about CUDA - NVIDIA GPGPU 勉強会 - FrontPage tips : tips/02.プログラミングなど/GPGPU/CUD…

GT240のdevicequery

195.30 BETAの元でのGT240のdevicequery結果です。 Device 0: "GeForce GT 240" CUDA Driver Version: 3.0 CUDA Runtime Version: 2.30 CUDA Capability Major revision number: 1 CUDA Capability Minor revision number: 2 Total amount of global memory:…

GT240でCUDA

諸事情でGTX260をCUDAに使えなくなってしまい、急遽GT240をCUDAの勉強用に使うことになりました。Compute capabilityが1.2なので、倍精度計算は出来ませんがしょうがないです。 linux x86_64用のドライバですが、nvidiaのサイトには用意されていないようで、…

GPUを2枚差す場合の注意

2枚のGPGPUを差し、1枚を表画用に、もう1枚をCUDAでの計算用にとする場合の設定について。xorg.confにてどちらのGPUを表画に使うかを指定する記述が必要です。 lspci -v |less としてBUSidを調べて、xorg.confに Busid "PCI:2:0:0" Driver "nvidia" などと記…

fortranの人がはじめるC言語2

やさしく学べるC言語入門―基礎から数値計算入門まで (UNIX & Information Science)作者: 皆本晃弥出版社/メーカー: サイエンス社発売日: 2004/09/01メディア: 単行本購入: 1人 クリック: 6回この商品を含むブログ (1件) を見る説明はあまり丁寧じゃない印象…

東京大学情報基盤センターによるGPGPU解説連載開始

全部で5回の連載予定で、第1回は「GPUとGPGPUの歴史と特徴」です。 これからの並列計算のためのGPGPU連載講座 (?) GPUとGPGPUの歴史と特徴 著者のサポートページ(?)はこちら スパコンニュース - Satoshi OHSHIMA's web site