アセンブラの敷居を一気に下げた「読み物」

大熱血! アセンブラ入門作者: 坂井弘亮出版社/メーカー: 秀和システム発売日: 2017/09/15メディア: 単行本この商品を含むブログ (2件) を見るこれで即実戦を戦えると思ってはいけないと思います。 とにかくとっきにくいアセンブラ、技術書を読もうにも上手く…

C++の学習

ロベールのC++入門講座作者: ロベール出版社/メーカー: 毎日コミュニケーションズ発売日: 2007/11/15メディア: 単行本(ソフトカバー)購入: 26人 クリック: 25,357回この商品を含むブログ (127件) を見る

FortranからHPCに入った人は結構いらっしゃると思います

最初の一冊。 独習C 第4版作者: ハーバート・シルト,柏原正三,トップスタジオ出版社/メーカー: 翔泳社発売日: 2007/12/06メディア: 大型本購入: 1人 クリック: 23回この商品を含むブログ (15件) を見る Cの変態(?)的な性質を整理するにはこちら。 C言語ポ…

CUDA5によるGPUプログラミングの書籍

CUDA5の書籍は、世界初だそうです。 目次見る限り、結構基本的なそれを扱っているようです。 CUDA5ならではの機能を盛り込んだ内容なのでしょうか?注目です。 注文したので、感想かメモを書く予定です。GPUプログラミング入門 -CUDA5による実装 (KS情報科学…

GTX Titanのnbody benchmark

とりあえずnbodyを。 float [t_azu@linux]$ ./nbody -benchmark Run "nbody -benchmark [-numbodies=<numBodies>]" to measure perfomance. -fullscreen (run n-body simulation in fullscreen mode) -fp64 (use double precision floating point values for simulation</numbodies>…

GTX Titan注文、近日中に届く様子

届き次第、nbodyくらいは数字を出します。手元にPCI-Express2.0環境しか無いのはちょっと残念ですが。

GeForce GTX Titanの倍精度は1.3TFLOPS、単精度では4.5TFLOPS

NVIDIA GeForce Titan Final Specifications Confirmed, Launching Next Week The GeForce Titan will churn out single precision performance 4.5 TFlops and 1.3 TFlops double precision. これが本当ならすごい話ですね。

GeFoce Titanの倍精度は196GFLOPS、単精度では4TFLOPS越え

Nvidia GeForce Titan Launches February 18th, 2013: Loses to GTX 690, AMD HD 7990 - Bright Side Of News* 倍精度がちょっと寂しい感じがしますが、K20に向けてのテスト用と考えれば問題ないと思います。CUDA 5の機能をフルに使えるかについては情報が入…

NsightをPGI CUDA Fortran Linux Workstationで利用するためのメモ(書きかけ)

インストールしたときのメモ CUDA 5.0のtoolkitをインストールし、パスを通す nsightとたたけばEclipseベースのNsightの画面が立ち上がる 「Help」->「Install New Software」 「Add」で以下のレポジトリを追加 http://download.eclipse.org/releases/juno …

NsightとPGI CUDA Fortran

NsightはEclipseベースなので、PGI CUDA FortranがEclipseに対応している必要があります。PGIのフォーラムには、Photranを使えばいいとあります。 Eclipse support(2012年のPGIフォーラムでの投稿) Eclipse support(2011年のPGIフォーラムでの投稿) Phot…

PGI 13.1がリリースされました

Linux版からまずはリリースになりました。これからダウンロードします。感想書く予定です。 ダウンロードしながらリリースノートを読む CUDA5.0対応になった 標準はCUDA4.2 分割コンパイルに対応(このあたりはCUDA5.0の機能) 単一のホストまたはプログラム…

GK110ベースのGeForce「GeForce Titan」

これによると899ドルとか。 NVIDIA to Name GK110-based Consumer Graphics Card "GeForce Titan" | techPowerUp 出荷数も限定のようです。dynamic parallerismなどのCUDA5以降の機能を使えるのでしょうか? Titanという名前には、HPCでの用途もある程度は意…

PGI13.1は開発途中(PGIフォーラムから)

The Portland Group | Support | User Forum Sorry, it's been delayed due to some unforeseen issues. We're working hard to get these issue resolved and hopefully will have 13.1 out shortly. 13.1からCUDA5.0対応になるはず。期待して待ちましょう。

Programming Massively Parallel Processors, Second Edition

nvidia公式のCUDA解説本。初版にかなり加筆並びに修正が入っています。殆ど別の本になっています。 GPUの進化にキャッチアップしていきたい人は、迷わずチェックする価値があると思います。 12月中旬に、amazon.comで注文して、数日前に届きました。予約注文…

ELSA GT640 LP CUDAの基本性能(bandwidthtest, nbody)

bandwidthtest [t_azu@linux]$ ./bandwidthTest [CUDA Bandwidth Test] - Starting... Running on... Device 0: GeForce GT 640 Quick Mode Host to Device Bandwidth, 1 Device(s) PINNED Memory Transfers Transfer Size (Bytes) Bandwidth(MB/s) 33554432…

CUDA Fortranの基本を解説するエントリ:NVIDIA developer zoneから

Blog Tags = CUDA Fortran | NVIDIA Developer Zone 内容は基本的なことで、平易かつ実例と共にわかりやすいのでおすすめです。自分が抑えていなかった事柄がさらっと書かれていたりしていて、そういう意味でも役に立ちました。 最新のエントリで一部画像の…

CUDA5のnvprofプロファイラをPGI CUDA Fortranで使う

CUDA5から、nvprofというコマンドラインで使えるプロファイラが登場しました。これまでにもコマンドラインのプロファイラはありましたが、ちょっと使いにくかった。結果を解釈するのに一段階思考する必要がありました。 GUIのプロファイラはちょっと重かった…

CUDA, ロープロファイル対応でスリムPCに, なるべくCUDAコア等のリソースが充実した物を、ということで

ELSA GT640 LPを注文しました。 C.C2.1のそれ(Fermiの廉価版)ですが、CUDAコアが384あって、SMが8個、メモリが1Gあるのでテスト環境としては十分だと思います。bandwidthtestとnbodyくらいは載せます。余力があればSTREAMベンチもやります。

PGIは13.0からCUDA5.0対応とのこと

The Portland Group | Support | User Forumによると、13.0かららしい。 CC3.x and CUDA 5 support will be available in the 13.0 release due out shortly. For testing purposes our rcfiles (and thus the help messages) got updated early. Publicly t…

松岡先生のTwitterにTitan導入ビデオが

Video: Timelapse of Jaguar Turning into Titan | insideHPC.com うん、これは面白い(Cray X1があるらしいが、一回見ただけではよくわからない)。 Crayの特徴のあの美しい絵は、ラッピングかと思っていたけどシートを筐体の前に掛けていたんですね。絵に…

ついにTitanが起動、K20で20PFLOPS越え

NVIDIA、オープンサイエンス向け世界最速の スーパーコンピューターを支える 上記リンク先から、気になる部分を以下に。 理論ピークが20PFLOPS越え。 「18,688個のNVIDIA Tesla K20 GPU アクセラレーター」なので、K20は理論で1.17FLOPSなので(Tesla K20 GP…

CUDA 5 リリースノートから

CUDA Downloads | NVIDIA Developer Zone dynamic parallelismはコンピュートケイパビリティーが3.5以上(現状、K20のみ)で有ることが必要。7月頃に発表された資料の通り。

less表示でソースコード(拡張子.F90, .f90, .cuf, .CUF, etc.)に色を付ける

lessでfortranソースコードを表示するとき、ソースコードに色つけ(シンタックスハイライトというやつですね)する方法をまとめます。プリプロセッサを使用する際に用いる大文字の拡張子、CUDA Fortranで用いる拡張子のfortranソースコードでも使える方法で…

GK110についてまとめとメモ(書きかけ)

GK104はグラフィックまたは単精度演算向けで、コンシューマ(ゲーマーなど)または石油探査などが対象。GTX680、K10などが相当する。それに続いて発表されたGK110はHPC用途も含まれる。K20が相当する。 K10はリリース済み。K20はこれから。 Fermiと違うのは…

GT520M bandwidthtest

[t_azu@linux bandwidthTest]$ optirun ../../bin/linux/release/bandwidthTest [bandwidthTest] starting... ../../bin/linux/release/bandwidthTest Starting... Running on... Device 0: GeForce GT 520M Quick Mode Host to Device Bandwidth, 1 Device(…

Numerical Methods for Fluid Dynamics: With Applications to Geophysics (Texts in Applied Mathematics)

major revisionが出ています。序文によると、Chapter2が加わってその他の章に加筆したよう。Numerical Methods for Fluid Dynamics: With Applications to Geophysics (Texts in Applied Mathematics)作者: Dale R. Durran出版社/メーカー: Springer発売日: …

Numerical Methods for Wave Equations in Geophysical Fluid Dynamics (Texts in Applied Mathematics)

Numerical Methods for Wave Equations in Geophysical Fluid Dynamics (Texts in Applied Mathematics)作者: Dale R. Durran出版社/メーカー: Springer発売日: 1998/11/25メディア: ハードカバーこの商品を含むブログを見る別名「Durranの黄色い本」。読み…

GT520M nbody benchmark 単精度と倍精度

single [t_azu@machine]$ optirun nbody -benchmark [nbody] starting... Run "nbody -benchmark [-n=<numBodies>]" to measure perfomance. -fullscreen (run n-body simulation in fullscreen mode) -fp64 (use double precision floating point values for simulatio</numbodies>…

Kevin Dowd著 ハイ・パフォーマンス・コンピューティング第3章を読んだときのメモ(書きかけ)

CPU性能の進化とメモリアクセス速度のそれには開きがある その開きから生じる諸問題を解決する方法は メモリシステムの個々のコンポーネントが個々のアクセス要求にて高速に処理できるようにする 高速メモリ部分を活かすために、低速メモリ部分を定期的にア…

2 RISCコンピュータ

CISCが普通だった時代から、RISCへと変わってきた。RISCは高速実行を目指すために、高機能な命令セットをあきらめたのだ。 2.1 なぜCISCか 最初はCISCがRISCに比べて正しい方向だった。 2.1.1 時間と空間 2.2 最高クロックの達成 2.2.1 パイプライン パイプ…