Parallele Berechnung mehrerer Bytes = Streaming-Funktionen ala
3DNow!, MMX, SSE, AVX, FMA
Da kann man "gleichzeitig", in einem Thread, mit 128 Bit (z.B. 8 Byte) oder gar 256 Bit rechnen, also mit mindestens 2 Color-Dingern (a 4 Bytes) in einem Rutsch.