2010-02-26から1日間の記事一覧

GPGPUはPCI Expressがボトルにネックになるから並列計算には無理、というお話しについて

複数nodeを抱えるような並列計算で、一昔前のPCクラスタや小規模PCクラスタでよくある仕様で、PCI経由でEthernetでnode間を接続してしまうと(そしてnode間にそれなりの通信量がある場合)、node間通信もボトルネックになってしまうわけで、それは速度だけ見…

FORTRANの人がGPGPUを使って性能を出すために必要なこと

FORTRANからCUDAを呼ぶ2にあるやり方で、あと残り二つになりました。 CUDAで(FORTRANに比べて)性能が出せそうな(且つ、FORTRANでボトルネックとなっているならなお良い)部分をCUDA化し、GPGPUで計算させる CPUとGPGPUの間での通信量を出来る限り少なく…