2011-01-01から1年間の記事一覧

Kevin Dowd著 ハイ・パフォーマンス・コンピューティング第3章を読んだときのメモ(書きかけ)

CPU性能の進化とメモリアクセス速度のそれには開きがある その開きから生じる諸問題を解決する方法は メモリシステムの個々のコンポーネントが個々のアクセス要求にて高速に処理できるようにする 高速メモリ部分を活かすために、低速メモリ部分を定期的にア…

2 RISCコンピュータ

CISCが普通だった時代から、RISCへと変わってきた。RISCは高速実行を目指すために、高機能な命令セットをあきらめたのだ。 2.1 なぜCISCか 最初はCISCがRISCに比べて正しい方向だった。 2.1.1 時間と空間 2.2 最高クロックの達成 2.2.1 パイプライン パイプ…

1 ハイパフォーマンスコンピューティングとは

1.1 パフォーマンスを追及する理由 1.2 パフォーマンスの測定 1.3 次のステップ この興味深いゲームに参加するのに必要なことは コンピュータアーキテクチャの変遷の基本的な知識 特定のマシンでうまく動かすには、プログラムをどう改良すべきかの理解 ベン…

Kevin Dowd著 ハイ・パフォーマンス・コンピューティング第1・2章を読んだときのメモ(書きかけ)

コンピュータアーキテクチャのエッセンスを読んだときのメモ:第7章 マイクロコード、保護、およびプロセッサモード

7.1 はじめに 前章では、命令セットとオペランドという、プロセッサの二つの重要な側面について考えた。 汎用プロセッサにおいて、これらがどれだけ適用できるか示していく。 7.2 中央処理装置

2.3 並列計算機

2.3.1 SIMDとMIMD 2.3.2 並列計算機のメモリ構造としくみ 計算機機アーキテクチャの発展の歴史はメモリとの苦闘の歴史、並列性の普及の歴史 共有メモリ型計算機 分散メモリ型計算機 分散共有メモリ型計算機 2.4.4 高性能計算機の遣いやすさと最高性能の意味 …

2.1 計算機の内部構造に関する用語

2.2.2 ベクトル計算機の性能を決める要因 クロックサイクルタイム以外の要因について。以下の8つがある。 ベクトルレジスタの大きさと数 主記憶の大きさ 主記憶への同時アクセスパスの本数 ベクトル演算器の数 チェインニング機能 間接アドレッシング機能、…

スーパーコンピューティング第2章を読んだときのメモ(書きかけ))

スーパーコンピューティング (計算力学とCAEシリーズ) 三好ら著(第2章:高性能計算機の構造としくみ)を読んだときのメモ(書きかけ)

スーパーコンピューティング (計算力学とCAEシリーズ) 三好 俊郎 (著), 吉田 有一郎 (著), 坂田 信二 (著), 斉藤 直人 (著)

スーパーコンピューティング (計算力学とCAEシリーズ)作者: 三好俊郎,吉田有一郎,坂田信二,斉藤直人出版社/メーカー: 培風館発売日: 2001/12メディア: 単行本この商品を含むブログを見る 目次 スーパーコンピューティングの環境 高性能計算機の構造としくみ …

ハイ・パフォーマンス・コンピューティング : RISCワークステーションで最高のパフォーマンスを引き出すための方法 Kevin Dowd著 ; 久良知真子訳

ハイ・パフォーマンス・コンピューティング―RISCワークステーションで最高のパフォーマンスを引き出すための方法 (A nutshell handbook)作者: ケビンダウド,Kevin Dowd,久良知真子出版社/メーカー: インターナショナルトムソンパブリッシング発売日: 1994/07…

第2章 並列コンピューティング概観

並列システムのアーキテクチャについて述べ、これらの上でのプログラミングの技法を概観する。 2.2 ハードウェア 2.1.1 Flynnの分類 命令ストリームの数とデータストリームの数で分類 SIMD MIMD 2.1.2 古典的フォンノイマンマシン CPUとメインメモリに分類さ…

MPIの教科書、MPI並列プログラミングを読む

MPI並列プログラミング作者: P.パチェコ,Peter S. Pacheco,秋葉博出版社/メーカー: 培風館発売日: 2001/07メディア: 単行本購入: 1人 クリック: 13回この商品を含むブログ (7件) を見るMPIの基礎の基礎からの解説本では無いです。簡単なMPIプログラミングを…

第9回ASE研究会実施報告を読んだときのメモ

第9回先進スーパーコンピューティング環境研究会(ASE 研究会)実施報告から。 2011-02-17に、Dr. Osni Marquesが講演。 エクサスケールへのシナリオ。先進科学研究プログラム(ASCR)とその人員、研究、計画について。 背景として、中国のスパコン情勢。 発…

コンピュータアーキテクチャのエッセンスを読んだときのメモ:第6章 オペランドアドレッシングと命令表現

6.1 はじめに 本章では、命令について細かく焦点を当てる すなわち、命令の表現方法とオペランドの指定の仕方について述べる オペランドの形式はプログラマにとって重要 命令表現がどのようにオペランド形式を決定するのかを理解する 6.2 0, 1, 2, 3-アドレ…

倍精度

C:\ProgramData\NVIDIA Corporation\NVIDIA GPU Computing SDK 3.2\C\bin\win64\Release >nbody.exe -benchmark -fp64 Run "nbody -benchmark [-n=<numBodies>]" to measure perfomance. -fullscreen (run n-body simulation in fullscreen mode) -fp64 (use double pre</numbodies>…

単精度

C:\ProgramData\NVIDIA Corporation\NVIDIA GPU Computing SDK 3.2\C\bin\win64\Release >nbody.exe -benchmark Run "nbody -benchmark [-n=<numBodies>]" to measure perfomance. -fullscreen (run n-body simulation in fullscreen mode) -fp64 (use double precision</numbodies>…

GTX580購入しました

GAINWARD GeForce GTX580 GPU搭載 GTX580 1536MB DVI DISPLAY PORT出版社/メーカー: Gainwardメディア: Personal Computersこの商品を含むブログを見るベンチマークのデータを見ると、GTX480比で結構な性能向上があるようです。CUDAでどの程度違うか楽しみで…

GTS450 nbody

MSIのOC版GTS450での計測です。 $ /home/t_azu/NVIDIA_GPU_Computing_SDK/C/bin/linux/release/nbody -benchmark Run "nbody -benchmark [-n=<numBodies>]" to measure perfomance. -fullscreen (run n-body simulation in fullscreen mode) -fp64 (use double precisio</numbodies>…

CUDA Fortran(Visual Fortran)でParallel Nsight

Parallen NsightはCUDA Cのみ対応ではなく、CUDA Fortranにも対応しています。正確には、PGI Accelerator Visual FortranがParallel Nsightに対応しています。 PGI | Products | PGI Visual Fortran CUDA Fortranでの開発にとっては、大きな助けになりますね…

CUDA by Exampleの日本語訳、汎用GPUプログラミング入門が発刊

CUDA by Example 汎用GPUプログラミング入門作者: Jason Sanders,Edward Kandrot,株式会社クイープ出版社/メーカー: インプレス発売日: 2011/02/14メディア: 単行本(ソフトカバー)購入: 1人 クリック: 36回この商品を含むブログ (11件) を見る注文しました…

CUDA高速GPUプログラミング入門

はじめてのCUDAプログラミングよりも基礎的な本。CUDAのセットアップから書いてあります。計算機の知識がまだ乏しい人でも大丈夫な本だと思います。windowsでの使用方法が詳しく書かれているので、手持ちのwindowsでとりあえずCUDAを試してみたい、という人…

CUDA by Exampleを読んだときのメモ:第6章「Constant Memory and Events」(書きかけ)

CUDAで並列計算する基礎はここまで学んだが、CUDAには他にも特徴がある。 二つの特徴を本章では学ぶ。 GPGPUには、いくつか等別なメモリ領域がある。その内の一つ、コンスタントメモリ。加えて、CUDAイベントでパフォーマンスを計測する方法を学ぶ。 6.1 6章…

GT430の実効性能(単精度)をnbodyで計測

$ /home/t_azu/NVIDIA_GPU_Computing_SDK/C/bin/linux/release/nbody -benchmark Run "nbody -benchmark [-n=<numBodies>]" to measure perfomance. -fullscreen (run n-body simulation in fullscreen mode) -fp64 (use double precision floating point values for si</numbodies>…

倍精度で計測

$ /home/t_azu/NVIDIA_GPU_Computing_SDK/C/bin/linux/release/nbody -benchmark -fp64 Run "nbody -benchmark [-n=<numBodies>]" to measure perfomance. -fullscreen (run n-body simulation in fullscreen mode) -fp64 (use double precision floating point values </numbodies>…

Hisa Andoさんの「プロセッサを支える技術」が刊行

プロセッサを支える技術 ??果てしなくスピードを追求する世界 (WEB+DB PRESS plus)作者: Hisa Ando出版社/メーカー: 技術評論社発売日: 2011/01/06メディア: 単行本(ソフトカバー)購入: 22人 クリック: 250回この商品を含むブログ (54件) を見る一言で言う…

「プロセッサを支える技術」第7章「GPGPUと超並列処理」目次

第7章 GPGPUと超並列処理 7.1 GPGPUのしくみ 3DグラフィックスとGPU ― 大量の計算が必要 GPU GPUシステム GPUからGPGPUへ 「超並列SIMDプロセッサ」としてのGPGPU AMD HD 5870 GPU NVIDIA Fermi GPU 「超マルチスレッドプロセッサ」としてのGPGPU GPGPUのメ…