”補正ピーク性能”("APP")
に関する技術的な注釈(CCL カテゴリー4)
APP(Adjusted Peak Performance)は”デジタルコンピュータ”が64
ビット以上の浮動小数点の加算、及び乗算を行なうときの補正されたピーク
速度である。
[本技術的注釈において使用する略語]
n ”デジタルコンピュータ”内のプロセッサの数
i プロセッサの番号(@,...n)
ti プロセッサのサイクル時間(ti=1/Fi)
Fi プロセッサの周波数
Ri 浮動小数点演算ピーク速度
Wi アーキテクチャ補正係数
APPは1秒間当たり1012回の補正された浮動小数点演算を単位とする加重
テラフロップス(WT)(Weighted TeraFLOPS)で表わされる。1秒間当たりの浮動
小数点演算の数の算出方法を次に示す。
(訳者注:テラフロップスとは、コンピュータの処理速度を表わす単位の一つで、
1秒間に1兆回の浮動小数点演算(実数計算)を実行できることを意味
する。FLOPSは'Floating point number Operations Per Second'の略
で1秒間に1回の計算ができる処理速度を表わし、テラ(Tera)は1兆
(10の12乗)を意味する接頭辞。スーパーコンピュータなど大規模なコ
ンピュータの性能指標として用いられることが多い。Wikipediaより)
[”APP”算出方法の概要]
1.各プロセッサiについて、”デジタルコンピュータ”内の各プロセッサの一
サイクルに実行される64ビット以上の浮動小数点演算の数のピーク値、
FPOiを決定する。
「注」FPOiを決定する際、64ビット以上の浮動小数点の加算及び/又は乗算の
み算入すること。全ての浮動小数点演算の数は一プロセッササイクル内の
演算の数でなければならず、複数のサイクルを必要とする演算の場合には
一サイクル当たりの数が端数になることもある。64ビット以上の浮動小
数点オペランド演算のできないプロセッサについては、実効演算速度Rは
ゼロとする。
2.各プロセッサについて、浮動小数点演算速度Rを計算する。
Ri=FPOi/ti.
3.APPを次の如く計算する。
APP=W1xR1+W2xR2+....+WnxRn.
4.”ベクタープロセッサ”の場合はWi=0.9,非”ベクタープロセッサ”の
場合は、Wi=0.3とする。
「注1」単一サイクルに加算と乗算のような複合演算(compound operations)を
実行するプロセッサについては、複数のプロセッサがあるものとみなし
各演算を算入する。
「注2」パイプライン処理できるプロセッサでは、実効演算速度Rはパイプライ
ンが一杯になった時のパイプライン速度と非パイプライン速度を比較し
早い方を採用する。
「注3」個々のプロセッサの演算速度Rは、複合体の”APP”が算出される前
に理論上可能な最大値で算出すること。コンピュータの製造者が、コン
ピュータのマニュアル又はパンフレットでコンカレント、並行動作、即
ち同時の動作又は実行を公表している場合には、同時動作があるものと
想定する。
「注4」APPを計算する時、入出力機能及び周辺機能(例えば、ディスク駆動
装置、通信制御装置及びビデオ表示装置)に限られたプロセッサを算入
してはならない。
「注5」”ローカルエリアネットワーク”、ワイドエリアネットワーク、入出力
共有のための接続器/接続装置、入出力制御装置により相互接続された
プロセッサ複合体及び”ソフトウェア”で実現されている通信接続の場
合、APP値に算入する必要はない。
「注6」APP値は次の(1)(2)について算出し算入されなければならない。
(1)集合により性能を向上するように特別に設計され、かつ同時動作が
可能なもののうち記憶装置を共有するプロセッサを含むプロセッサ
複合体、 又は
(2)特別に設計されたハードウェアを用いて同時動作させている複数の
記憶装置とプロセッサの複合体。
「注7」”ベクタープロセッサ”は、浮動小数点ベクトル(64ビット以上の
一次元アレイ)の計算を同時に複数個行なえる組み込み命令を有する
プロセッサであって、少なくとも2個のベクトル演算ユニットを持ち、
かつ、各々が少なくとも64ビットのベクターレジスターを8本以上持
つものと定義される。
以上