Ik heb niet echt een idee waar te beginnen. Ondersteunt de Delphi RTL eigenlijk wel UTF-8?
Ik heb niet echt een idee waar te beginnen. Ondersteunt de Delphi RTL eigenlijk wel UTF-8?
D2007 VCL: utf8 (beperkt getest). Opvolger is volledig, ook mbcs naar verwachting.
Alle delphi versies vanaf 4 ondersteunen de boel wel natuurlijk wel lowlevel, maar niet in de VCL.
Werken aan Ansi support voor Windows is verspilde tijd, behalve voor historici.
Hm, volgens de roadmap is dat pas vanaf Tibur??n.
All methodologies are based on fear. -- Kent Beck.
Ik bedoelde met name het woud van if...then..else. Nl ook C heeft een case (switch..case).
Verder zitten er in die routine wat plekken waar een mogelijke unbounded string access zit. (dus s[x+1] zonder te checken of x<=length(s)).
En de #0 character beperking is ook niet netjes, al ben ik daar zelf ook niet helemaal vrij van.
Thaddy: ik ga onderzoeken wat FPC kan. Ik ga in ieder geval geen UTF8 routines voor Delphi maken.
Bovenstaande url is geupdate met meerdere updates en extensies. Als mensen willen helpen met unit test gevallen bedenken dan graag.
Thaddy: Kylix lijkt wel UTF-8 te ondersteunen overigens. FPC lijkt inmiddels Delphi te volgen. MBCS op windows en UTF-8 daarbuiten, en daarnaast conversie naar widestring op alle platforms.
Widestring wil ik wel proberen, maar dan moet je me een setje unit tests aanleveren die ik kan draaien in mijn locale.
Ik gooide vcl en rtl door elkaar. Komt voor...
De UTF8 ondersteuning zit overigens wel - en compleet - in de KOL controls (MCK) en aangezien ik thuis alleen kol ipv vcl gebruik verwar ik wel eens wat.
Werken aan Ansi support voor Windows is verspilde tijd, behalve voor historici.
Tiburon win32-unicode target (?) lijkt volgens Dirk's link widestrings, dus UTF16 te gebruiken.
Ik vraag me overigens af hoe mbcs +utf8 support uberhaubt zou kunnen coexisteren. (en btw w2000 ondersteunt geen UTF8 dacht ik)
Definitieve versie zoals ie in FPC ging (op wat renamen van resourcestrings na)
http://www.stack.nl/~marcov/scandate.zip
LxGoodies: die waar jij naar verwijst, daar staat "copyleft" onder, wat waarschijnlijk GPL betekent. Exit op licentie gronden dus
Ik zit nu wat dieper in UTF-8, en ik zie niet direct een beperking hier. De relatieve backwards compatibility zou deze routine gewoon laten werken?
There are currently 1 users browsing this thread. (0 members and 1 guests)
Bookmarks