next up previous contents index
Next: Korrelationsabbildungen Up: Das Back-to-front-Beleuchtungsmodell Previous: Absorptionskoeffizient

Leistungsbewertung

Der SEND-Befehl braucht intraplanar die Zeit tS,intra und interplanar tS,inter. Die Zeit für die Umwandlung Floating-Point-to-Integer wird mit tFIC und von Integer-to-Floating-Point mit tIFC bezeichnet. Die arithmetischen Operationen haben die Ausführungszeiten tFADD, tFSUB, tFMULT, tFDIV, tFSQR und tFEXP. Der LOAD-Befehl hat die Zeit tLOAD. Jeder Befehl wird in einem Takt abgearbeitet. Deshalb wird jede Operation durch eine abstrakte Zeiteinheit beschrieben, sowohl für Kommunikationsbefehle als auch für arithmetische Operationen. Es gilt tS,intra = tS,inter = tFADD = tFSUB = tFMULT = tFDIV = tFSQR = tFEXP = tFTC = tITC = tLOAD = 1. Die Gesamtrechenzeit von Programm ([*]) kann mit tges Takten genau angegeben werden.
\begin{align*}t_{ges} = & \ 4t_{S,intra} + (2+n)t_{S,inter} +
(2+n)t_{FADD} + 3...
...IV} + t_{FSQR} +
t_{FEXP} + t_{FTC} + t_{ITC} + t_{LOAD} = \ 22+2n
\end{align*}

Der parallele Algorithmus ist dann von der Zeitkomplexität T(n) = O(tges) = O(n). Die serielle optimale Zeit ist T*(n) = O(n3), da jeder der n2 SPPE auf einer Ebene sequentiell durchlaufen werden muß. Die Anzahl der insgesamt zu bewältigenden Arbeitsschritte des Algorithmus ist von der Größenordunng W(n) = n2*(22+2n) = O(n3). Der parallele Algorithmus ist somit optimal. Daß der Algorithmus auch streng optimal ist liegt daran, daß sich wegen der beschränkten interplanaren Kommunikation kein schnelleres Aufsummieren bewerkstelligen läßt. Erst wenn jeder Prozessor ohne zusätzlichen Zeitaufwand Zugriff auf die Daten aller anderen Prozessoren hätte, könnte man z.B. mit dem Binärbaumparadigma2.1 die Zeit T(n) für die Summation von O(n) auf $O(\log n)$ senken.


next up previous contents index
Next: Korrelationsabbildungen Up: Das Back-to-front-Beleuchtungsmodell Previous: Absorptionskoeffizient
Thomas Hoehn
1999-04-12