2011-01-01から1年間の記事一覧
CPU性能の進化とメモリアクセス速度のそれには開きがある その開きから生じる諸問題を解決する方法は メモリシステムの個々のコンポーネントが個々のアクセス要求にて高速に処理できるようにする 高速メモリ部分を活かすために、低速メモリ部分を定期的にア…
CISCが普通だった時代から、RISCへと変わってきた。RISCは高速実行を目指すために、高機能な命令セットをあきらめたのだ。 2.1 なぜCISCか 最初はCISCがRISCに比べて正しい方向だった。 2.1.1 時間と空間 2.2 最高クロックの達成 2.2.1 パイプライン パイプ…
1.1 パフォーマンスを追及する理由 1.2 パフォーマンスの測定 1.3 次のステップ この興味深いゲームに参加するのに必要なことは コンピュータアーキテクチャの変遷の基本的な知識 特定のマシンでうまく動かすには、プログラムをどう改良すべきかの理解 ベン…
7.1 はじめに 前章では、命令セットとオペランドという、プロセッサの二つの重要な側面について考えた。 汎用プロセッサにおいて、これらがどれだけ適用できるか示していく。 7.2 中央処理装置
2.3.1 SIMDとMIMD 2.3.2 並列計算機のメモリ構造としくみ 計算機機アーキテクチャの発展の歴史はメモリとの苦闘の歴史、並列性の普及の歴史 共有メモリ型計算機 分散メモリ型計算機 分散共有メモリ型計算機 2.4.4 高性能計算機の遣いやすさと最高性能の意味 …
2.2.2 ベクトル計算機の性能を決める要因 クロックサイクルタイム以外の要因について。以下の8つがある。 ベクトルレジスタの大きさと数 主記憶の大きさ 主記憶への同時アクセスパスの本数 ベクトル演算器の数 チェインニング機能 間接アドレッシング機能、…
スーパーコンピューティング (計算力学とCAEシリーズ) 三好ら著(第2章:高性能計算機の構造としくみ)を読んだときのメモ(書きかけ)
スーパーコンピューティング (計算力学とCAEシリーズ)作者: 三好俊郎,吉田有一郎,坂田信二,斉藤直人出版社/メーカー: 培風館発売日: 2001/12メディア: 単行本この商品を含むブログを見る 目次 スーパーコンピューティングの環境 高性能計算機の構造としくみ …
ハイ・パフォーマンス・コンピューティング―RISCワークステーションで最高のパフォーマンスを引き出すための方法 (A nutshell handbook)作者: ケビンダウド,Kevin Dowd,久良知真子出版社/メーカー: インターナショナルトムソンパブリッシング発売日: 1994/07…
並列システムのアーキテクチャについて述べ、これらの上でのプログラミングの技法を概観する。 2.2 ハードウェア 2.1.1 Flynnの分類 命令ストリームの数とデータストリームの数で分類 SIMD MIMD 2.1.2 古典的フォンノイマンマシン CPUとメインメモリに分類さ…
MPI並列プログラミング作者: P.パチェコ,Peter S. Pacheco,秋葉博出版社/メーカー: 培風館発売日: 2001/07メディア: 単行本購入: 1人 クリック: 13回この商品を含むブログ (7件) を見るMPIの基礎の基礎からの解説本では無いです。簡単なMPIプログラミングを…
第9回先進スーパーコンピューティング環境研究会(ASE 研究会)実施報告から。 2011-02-17に、Dr. Osni Marquesが講演。 エクサスケールへのシナリオ。先進科学研究プログラム(ASCR)とその人員、研究、計画について。 背景として、中国のスパコン情勢。 発…
6.1 はじめに 本章では、命令について細かく焦点を当てる すなわち、命令の表現方法とオペランドの指定の仕方について述べる オペランドの形式はプログラマにとって重要 命令表現がどのようにオペランド形式を決定するのかを理解する 6.2 0, 1, 2, 3-アドレ…
C:\ProgramData\NVIDIA Corporation\NVIDIA GPU Computing SDK 3.2\C\bin\win64\Release >nbody.exe -benchmark -fp64 Run "nbody -benchmark [-n=<numBodies>]" to measure perfomance. -fullscreen (run n-body simulation in fullscreen mode) -fp64 (use double pre</numbodies>…
C:\ProgramData\NVIDIA Corporation\NVIDIA GPU Computing SDK 3.2\C\bin\win64\Release >nbody.exe -benchmark Run "nbody -benchmark [-n=<numBodies>]" to measure perfomance. -fullscreen (run n-body simulation in fullscreen mode) -fp64 (use double precision</numbodies>…
GAINWARD GeForce GTX580 GPU搭載 GTX580 1536MB DVI DISPLAY PORT出版社/メーカー: Gainwardメディア: Personal Computersこの商品を含むブログを見るベンチマークのデータを見ると、GTX480比で結構な性能向上があるようです。CUDAでどの程度違うか楽しみで…
MSIのOC版GTS450での計測です。 $ /home/t_azu/NVIDIA_GPU_Computing_SDK/C/bin/linux/release/nbody -benchmark Run "nbody -benchmark [-n=<numBodies>]" to measure perfomance. -fullscreen (run n-body simulation in fullscreen mode) -fp64 (use double precisio</numbodies>…
Parallen NsightはCUDA Cのみ対応ではなく、CUDA Fortranにも対応しています。正確には、PGI Accelerator Visual FortranがParallel Nsightに対応しています。 PGI | Products | PGI Visual Fortran CUDA Fortranでの開発にとっては、大きな助けになりますね…
CUDA by Example 汎用GPUプログラミング入門作者: Jason Sanders,Edward Kandrot,株式会社クイープ出版社/メーカー: インプレス発売日: 2011/02/14メディア: 単行本(ソフトカバー)購入: 1人 クリック: 36回この商品を含むブログ (11件) を見る注文しました…
はじめてのCUDAプログラミングよりも基礎的な本。CUDAのセットアップから書いてあります。計算機の知識がまだ乏しい人でも大丈夫な本だと思います。windowsでの使用方法が詳しく書かれているので、手持ちのwindowsでとりあえずCUDAを試してみたい、という人…
CUDAで並列計算する基礎はここまで学んだが、CUDAには他にも特徴がある。 二つの特徴を本章では学ぶ。 GPGPUには、いくつか等別なメモリ領域がある。その内の一つ、コンスタントメモリ。加えて、CUDAイベントでパフォーマンスを計測する方法を学ぶ。 6.1 6章…
$ /home/t_azu/NVIDIA_GPU_Computing_SDK/C/bin/linux/release/nbody -benchmark Run "nbody -benchmark [-n=<numBodies>]" to measure perfomance. -fullscreen (run n-body simulation in fullscreen mode) -fp64 (use double precision floating point values for si</numbodies>…
$ /home/t_azu/NVIDIA_GPU_Computing_SDK/C/bin/linux/release/nbody -benchmark -fp64 Run "nbody -benchmark [-n=<numBodies>]" to measure perfomance. -fullscreen (run n-body simulation in fullscreen mode) -fp64 (use double precision floating point values </numbodies>…
プロセッサを支える技術 ??果てしなくスピードを追求する世界 (WEB+DB PRESS plus)作者: Hisa Ando出版社/メーカー: 技術評論社発売日: 2011/01/06メディア: 単行本(ソフトカバー)購入: 22人 クリック: 250回この商品を含むブログ (54件) を見る一言で言う…
第7章 GPGPUと超並列処理 7.1 GPGPUのしくみ 3DグラフィックスとGPU ― 大量の計算が必要 GPU GPUシステム GPUからGPGPUへ 「超並列SIMDプロセッサ」としてのGPGPU AMD HD 5870 GPU NVIDIA Fermi GPU 「超マルチスレッドプロセッサ」としてのGPGPU GPGPUのメ…