2012-01-01から1年間の記事一覧
CUDA5から、nvprofというコマンドラインで使えるプロファイラが登場しました。これまでにもコマンドラインのプロファイラはありましたが、ちょっと使いにくかった。結果を解釈するのに一段階思考する必要がありました。 GUIのプロファイラはちょっと重かった…
ELSA GT640 LPを注文しました。 C.C2.1のそれ(Fermiの廉価版)ですが、CUDAコアが384あって、SMが8個、メモリが1Gあるのでテスト環境としては十分だと思います。bandwidthtestとnbodyくらいは載せます。余力があればSTREAMベンチもやります。
The Portland Group | Support | User Forumによると、13.0かららしい。 CC3.x and CUDA 5 support will be available in the 13.0 release due out shortly. For testing purposes our rcfiles (and thus the help messages) got updated early. Publicly t…
Video: Timelapse of Jaguar Turning into Titan | insideHPC.com うん、これは面白い(Cray X1があるらしいが、一回見ただけではよくわからない)。 Crayの特徴のあの美しい絵は、ラッピングかと思っていたけどシートを筐体の前に掛けていたんですね。絵に…
NVIDIA、オープンサイエンス向け世界最速の スーパーコンピューターを支える 上記リンク先から、気になる部分を以下に。 理論ピークが20PFLOPS越え。 「18,688個のNVIDIA Tesla K20 GPU アクセラレーター」なので、K20は理論で1.17FLOPSなので(Tesla K20 GP…
CUDA Downloads | NVIDIA Developer Zone dynamic parallelismはコンピュートケイパビリティーが3.5以上(現状、K20のみ)で有ることが必要。7月頃に発表された資料の通り。
lessでfortranソースコードを表示するとき、ソースコードに色つけ(シンタックスハイライトというやつですね)する方法をまとめます。プリプロセッサを使用する際に用いる大文字の拡張子、CUDA Fortranで用いる拡張子のfortranソースコードでも使える方法で…
GK104はグラフィックまたは単精度演算向けで、コンシューマ(ゲーマーなど)または石油探査などが対象。GTX680、K10などが相当する。それに続いて発表されたGK110はHPC用途も含まれる。K20が相当する。 K10はリリース済み。K20はこれから。 Fermiと違うのは…
[t_azu@linux bandwidthTest]$ optirun ../../bin/linux/release/bandwidthTest [bandwidthTest] starting... ../../bin/linux/release/bandwidthTest Starting... Running on... Device 0: GeForce GT 520M Quick Mode Host to Device Bandwidth, 1 Device(…
Numerical Methods for Fluid Dynamics: With Applications to Geophysics (Texts in Applied Mathematics)
major revisionが出ています。序文によると、Chapter2が加わってその他の章に加筆したよう。Numerical Methods for Fluid Dynamics: With Applications to Geophysics (Texts in Applied Mathematics)作者: Dale R. Durran出版社/メーカー: Springer発売日: …
Numerical Methods for Wave Equations in Geophysical Fluid Dynamics (Texts in Applied Mathematics)作者: Dale R. Durran出版社/メーカー: Springer発売日: 1998/11/25メディア: ハードカバーこの商品を含むブログを見る別名「Durranの黄色い本」。読み…
single [t_azu@machine]$ optirun nbody -benchmark [nbody] starting... Run "nbody -benchmark [-n=<numBodies>]" to measure perfomance. -fullscreen (run n-body simulation in fullscreen mode) -fp64 (use double precision floating point values for simulatio</numbodies>…