Auf einem 3D-Rechner mit n3 Prozessoren braucht man für den 1. und
2. Teil jeweils n Schritte für jede Achsenrichtung, insgesamt also
6n Schritte. Die Berechnung der absoluten Summenhäufigkeiten dauert
somit 6n*k Schritte, wenn alle k=gmax Grauwerte transformiert
werden. Im seriellen Fall benötigt man n3 Schritte, um die
absoluten Häufigkeiten (in einer Tabelle mit gmax Einträgen) zu
bestimmen, k weitere Schritte für die Berechnung der
Summenhäufigkeiten und nochmal n3 Schritte für die Berechnung
aller g*, insgesamt also 2n3+k Schritte.
Bei einem Datenvolumen mit der Ausdehnung n=256 und k=256Grauwerten für jeden Voxel ergibt sich im parallelen Fall
Schritte, im seriellen Fall dagegen
Schritte. Der parallele Algorithmus ist im
Verhältnis zum seriellen also etwa 85 mal schneller. Das ist nicht
viel, bei n3 mehr Prozessoren.
Setzt man gar k=65536 Grauwerte bei n=256, also Datenvolumen mit 2
Byte Information pro Grauwert, was durchaus üblich für CT- oder
MR-Datensätze ist, dann wird man im parallelen Fall sogar um den
Faktor
langsamer.
Wegen der schon bei k=256 Grauwerten geringen Leistungssteigerung gegenüber dem seriellen Fall und der Leistungsverschlechterung bei k=65536, wird auf eine Realisierung mit diesem Algorithmus für einen 3D-Rechner verzichtet.