1.1 パフォーマンスを追及する理由 1.2 パフォーマンスの測定 1.3 次のステップ この興味深いゲームに参加するのに必要なことは コンピュータアーキテクチャの変遷の基本的な知識 特定のマシンでうまく動かすには、プログラムをどう改良すべきかの理解 ベン…
7.1 はじめに 前章では、命令セットとオペランドという、プロセッサの二つの重要な側面について考えた。 汎用プロセッサにおいて、これらがどれだけ適用できるか示していく。 7.2 中央処理装置
2.3.1 SIMDとMIMD 2.3.2 並列計算機のメモリ構造としくみ 計算機機アーキテクチャの発展の歴史はメモリとの苦闘の歴史、並列性の普及の歴史 共有メモリ型計算機 分散メモリ型計算機 分散共有メモリ型計算機 2.4.4 高性能計算機の遣いやすさと最高性能の意味 …
2.2.2 ベクトル計算機の性能を決める要因 クロックサイクルタイム以外の要因について。以下の8つがある。 ベクトルレジスタの大きさと数 主記憶の大きさ 主記憶への同時アクセスパスの本数 ベクトル演算器の数 チェインニング機能 間接アドレッシング機能、…
スーパーコンピューティング (計算力学とCAEシリーズ) 三好ら著(第2章:高性能計算機の構造としくみ)を読んだときのメモ(書きかけ)
スーパーコンピューティング (計算力学とCAEシリーズ)作者: 三好俊郎,吉田有一郎,坂田信二,斉藤直人出版社/メーカー: 培風館発売日: 2001/12メディア: 単行本この商品を含むブログを見る 目次 スーパーコンピューティングの環境 高性能計算機の構造としくみ …
ハイ・パフォーマンス・コンピューティング―RISCワークステーションで最高のパフォーマンスを引き出すための方法 (A nutshell handbook)作者: ケビンダウド,Kevin Dowd,久良知真子出版社/メーカー: インターナショナルトムソンパブリッシング発売日: 1994/07…
並列システムのアーキテクチャについて述べ、これらの上でのプログラミングの技法を概観する。 2.2 ハードウェア 2.1.1 Flynnの分類 命令ストリームの数とデータストリームの数で分類 SIMD MIMD 2.1.2 古典的フォンノイマンマシン CPUとメインメモリに分類さ…
MPI並列プログラミング作者: P.パチェコ,Peter S. Pacheco,秋葉博出版社/メーカー: 培風館発売日: 2001/07メディア: 単行本購入: 1人 クリック: 13回この商品を含むブログ (7件) を見るMPIの基礎の基礎からの解説本では無いです。簡単なMPIプログラミングを…
第9回先進スーパーコンピューティング環境研究会(ASE 研究会)実施報告から。 2011-02-17に、Dr. Osni Marquesが講演。 エクサスケールへのシナリオ。先進科学研究プログラム(ASCR)とその人員、研究、計画について。 背景として、中国のスパコン情勢。 発…
6.1 はじめに 本章では、命令について細かく焦点を当てる すなわち、命令の表現方法とオペランドの指定の仕方について述べる オペランドの形式はプログラマにとって重要 命令表現がどのようにオペランド形式を決定するのかを理解する 6.2 0, 1, 2, 3-アドレ…
C:\ProgramData\NVIDIA Corporation\NVIDIA GPU Computing SDK 3.2\C\bin\win64\Release >nbody.exe -benchmark -fp64 Run "nbody -benchmark [-n=<numBodies>]" to measure perfomance. -fullscreen (run n-body simulation in fullscreen mode) -fp64 (use double pre</numbodies>…
C:\ProgramData\NVIDIA Corporation\NVIDIA GPU Computing SDK 3.2\C\bin\win64\Release >nbody.exe -benchmark Run "nbody -benchmark [-n=<numBodies>]" to measure perfomance. -fullscreen (run n-body simulation in fullscreen mode) -fp64 (use double precision</numbodies>…
GAINWARD GeForce GTX580 GPU搭載 GTX580 1536MB DVI DISPLAY PORT出版社/メーカー: Gainwardメディア: Personal Computersこの商品を含むブログを見るベンチマークのデータを見ると、GTX480比で結構な性能向上があるようです。CUDAでどの程度違うか楽しみで…
MSIのOC版GTS450での計測です。 $ /home/t_azu/NVIDIA_GPU_Computing_SDK/C/bin/linux/release/nbody -benchmark Run "nbody -benchmark [-n=<numBodies>]" to measure perfomance. -fullscreen (run n-body simulation in fullscreen mode) -fp64 (use double precisio</numbodies>…
Parallen NsightはCUDA Cのみ対応ではなく、CUDA Fortranにも対応しています。正確には、PGI Accelerator Visual FortranがParallel Nsightに対応しています。 PGI | Products | PGI Visual Fortran CUDA Fortranでの開発にとっては、大きな助けになりますね…
CUDA by Example 汎用GPUプログラミング入門作者: Jason Sanders,Edward Kandrot,株式会社クイープ出版社/メーカー: インプレス発売日: 2011/02/14メディア: 単行本(ソフトカバー)購入: 1人 クリック: 36回この商品を含むブログ (11件) を見る注文しました…
はじめてのCUDAプログラミングよりも基礎的な本。CUDAのセットアップから書いてあります。計算機の知識がまだ乏しい人でも大丈夫な本だと思います。windowsでの使用方法が詳しく書かれているので、手持ちのwindowsでとりあえずCUDAを試してみたい、という人…
CUDAで並列計算する基礎はここまで学んだが、CUDAには他にも特徴がある。 二つの特徴を本章では学ぶ。 GPGPUには、いくつか等別なメモリ領域がある。その内の一つ、コンスタントメモリ。加えて、CUDAイベントでパフォーマンスを計測する方法を学ぶ。 6.1 6章…
$ /home/t_azu/NVIDIA_GPU_Computing_SDK/C/bin/linux/release/nbody -benchmark Run "nbody -benchmark [-n=<numBodies>]" to measure perfomance. -fullscreen (run n-body simulation in fullscreen mode) -fp64 (use double precision floating point values for si</numbodies>…
$ /home/t_azu/NVIDIA_GPU_Computing_SDK/C/bin/linux/release/nbody -benchmark -fp64 Run "nbody -benchmark [-n=<numBodies>]" to measure perfomance. -fullscreen (run n-body simulation in fullscreen mode) -fp64 (use double precision floating point values </numbodies>…
プロセッサを支える技術 ??果てしなくスピードを追求する世界 (WEB+DB PRESS plus)作者: Hisa Ando出版社/メーカー: 技術評論社発売日: 2011/01/06メディア: 単行本(ソフトカバー)購入: 22人 クリック: 250回この商品を含むブログ (54件) を見る一言で言う…
第7章 GPGPUと超並列処理 7.1 GPGPUのしくみ 3DグラフィックスとGPU ― 大量の計算が必要 GPU GPUシステム GPUからGPGPUへ 「超並列SIMDプロセッサ」としてのGPGPU AMD HD 5870 GPU NVIDIA Fermi GPU 「超マルチスレッドプロセッサ」としてのGPGPU GPGPUのメ…
http://www.pgroup.com/support/downloads.php CUDA Fortranのプログラミングガイドもver11.0になっている様子 http://www.pgroup.com/doc/pgicudaforug.pdf
5.1 はじめに 前章では、プログラム可能なプロセッサが用いるフェッチ-実行サイクルを説明した プロセッサが実行できる演算群に焦点を当てる これまでのコンピュータアーキテクトが選んだアプローチの説明、それぞれの利点と欠点 5.2 計算能力、便利さ、コス…
基本的な事項をわかりやすく書いた本だと思います。コンピュータアーキテクチャのエッセンス (IT Architects Archiveシリーズ)作者: ダグラス・E・カマー,Douglas E. Comer,鈴木貢,中條拓伯,仲谷栄伸,並木美太郎出版社/メーカー: 翔泳社発売日: 2007/06/01メ…
CUDAプログラミングに役に立つと思います。並行コンピューティング技法 ―実践マルチコア/マルチスレッドプログラミング作者: Clay Breshears,千住治郎出版社/メーカー: オライリージャパン発売日: 2009/12/21メディア: 大型本購入: 12人 クリック: 598回この…
この章ではテクスチャメモリについて学ぶ。コンスタントメモリと同様、読み込み専用のメモリであり、あるケースにおいて、メモリトラフィックを減らしてパフォーマンスを向上させる。 元来はグラフィックのアプリに対してのそれであったが、数値計算にも有用…
Programming Massively Parallel Processors: A Hands-on Approachを翻訳したものです。CUDAプログラミング実践講座 ? 超並列プロセッサにおけるプログラミング手法作者: David B. Kirk,Wen-men W. Hwu,加藤諒,(株)Bスプラウト出版社/メーカー: ボーンデジ…