CUDA5のnvprofプロファイラをPGI CUDA Fortranで使う

CUDA5から、nvprofというコマンドラインで使えるプロファイラが登場しました。これまでにもコマンドラインのプロファイラはありましたが、ちょっと使いにくかった。結果を解釈するのに一段階思考する必要がありました。
GUIのプロファイラはちょっと重かったのでそこが不満でした。
nvprofは軽いし、使い方も簡単。コマンドラインプロファイラよりも高機能かつ出力もまとまっている。
PGI CUDA Fortranは現在CUDA5に対応していませんが、CUDA4.2ベースでのCUDA Fortranにて作成したバイナリでも問題なくnvprofは動作します。