Der SEND-Befehl braucht intraplanar die Zeit
tS,intra und
interplanar
tS,inter. Die Zeit für die Umwandlung
Floating-Point-to-Integer wird mit tFIC und von
Integer-to-Floating-Point mit tIFC bezeichnet. Die arithmetischen
Operationen haben die Ausführungszeiten tFADD, tFSUB,
tFMULT, tFDIV, tFSQR und tFEXP. Der LOAD-Befehl hat die Zeit tLOAD. Jeder Befehl wird in einem
Takt abgearbeitet. Deshalb wird jede Operation durch eine abstrakte
Zeiteinheit beschrieben, sowohl für Kommunikationsbefehle als auch
für arithmetische Operationen. Es gilt
tS,intra = tS,inter =
tFADD = tFSUB = tFMULT = tFDIV = tFSQR = tFEXP =
tFTC = tITC = tLOAD = 1. Die Gesamtrechenzeit von Programm
(
) kann mit tges Takten genau angegeben
werden.
Der parallele Algorithmus ist dann von der Zeitkomplexität
T(n) =
O(tges) = O(n). Die serielle optimale Zeit ist
T*(n) =
O(n3), da jeder der n2 SPPE auf einer Ebene sequentiell
durchlaufen werden muß. Die Anzahl der insgesamt zu bewältigenden
Arbeitsschritte des Algorithmus ist von der Größenordunng
W(n) =
n2*(22+2n) = O(n3). Der parallele Algorithmus ist somit optimal.
Daß der Algorithmus auch streng optimal ist liegt daran, daß sich
wegen der beschränkten interplanaren Kommunikation kein schnelleres
Aufsummieren bewerkstelligen läßt. Erst wenn jeder Prozessor ohne
zusätzlichen Zeitaufwand Zugriff auf die Daten aller anderen
Prozessoren hätte, könnte man z.B. mit dem
Binärbaumparadigma2.1
die Zeit T(n) für die Summation von O(n) auf
senken.