
Mit
Unicode werden nur die Codepunkte für die Zeichen definiert, wie sie dann dargestellt werden (fett usw.) ist eine andere Geschichte.
Unicode wurde auf etwas mehr als 1 Mio Codepunkte beschränkt, diese lassen sich auch mit UCS2 bzw. UTF-16 durch diesen Surrogate Spaß darstellen, von dort stammt ja die Begrenzung. Einen richtigen Grund immer mit 4 Byte zu arbeiten gibt es daher eigentlich nicht.