Delphi-Quellcode:
const
SomeStr2 = '\xc4\x80\xc4\x86Hallo';
begin
Utf8Buffer := TEncoding.UTF8.GetString(SomeStr2);
EncodedBufferStr := EncodeBytes(Utf8Buffer);
showmessage(EncodedBufferStr);
?? Absolut keine Ahnung sorry.
Da braucht man bestimmt eine Dekodierungsfunktion die das alles rückwärts macht aber wie bitte soll man aus \xc4\x80 ein Ā machen? Wenn ich \xc4\x80 in Bytes umwandle habe ich mehr als 1 Zeichen in dem Array. Insgesamt in dem Fall 8 lang ist das Array. Ich kann ja nicht einfach blind 8 Stellen auslesen. Da könnte auch \16 für ein Leerzeichen stehen wo ich weniger auslesen müsste.
Das ging wohl in die Hose. Ehrlich gesagt verstehe ich nicht einmal was ich da mache.
Ich dachte ich entferne alle \x-Vorkommen und jeweils die nächsten 2 Zeichen danach schreibe ich in ein TBytes-Array.
Delphi-Quellcode:
function DecodeBytes(const Buffer: TBytes): string;
var
idx: Integer;
skip: Integer;
counter: Integer;
begin
skip := 0;
counter := 0;
for idx := Low(Buffer) to High(Buffer) do
begin
if skip = 2 then
begin
Result[counter] := Chr(Buffer[idx]) + Chr(Buffer[idx + 1]);
Inc(counter);
end;
if Chr(Buffer[idx]) + Chr(Buffer[idx + 1]) = '\x' then
begin
skip := 2;
end
else
begin
skip := 0;
Result[counter] := Chr(Buffer[idx]);
Inc(counter);
end;
end;
end;
Das deprimiert mich gerade so sehr, dass ich Delphi und auch sonst alles mit Programmierung am liebsten nie wieder anfassen möchte.