005
17.03.2004, 10:43 Uhr
virtual
Sexiest Bit alive (Operator)
|
Nee, UTF8 funktioniert so:
ein logische Zeichen besteht aus 1-N 8-Bit chars (wenn ich mich recht entsinne ist N<=3, meistens). Da ist dann durchaus genug platz für alles. Der Unterschied zwischen wchar_t und UTF8 codierten zeichenketten ist der, daß bei einem wchar_t ein logisches zeichen immer einem wchar_t entspricht, bei UTF8 kann ein logische Zeichen (zB ein chinesisches Schriftsymbol) in bis zu 3 Bytes codiert sein. Dies ist auch der eigentliche Nachteil von UTF8: Du kannst halt nicht mehr sagen: Der String ist X Zeichen lang, weil er X Bytes belegt. Da mußt Du dann spezielle Routinen verwenden. -- Gruß, virtual Quote of the Month Ich eß' nur was ein Gesicht hat (Creme 21) |