Video: Klaus Bondam: "Dansk teater er ekskluderende" 2025
Standardkaraktervariabelen i C ++ er en liten 1 byte bred og kan håndtere kun 255 forskjellige tegn. Dette er nok nok til europeiske språk, men ikke stort nok til å håndtere symbolbaserte språk som kanji.
Flere standarder har oppstått for å utvide tegnsettet til å håndtere kravene til disse språkene. UTF-8 bruker en blanding av 8-, 16- og 32-biters tegn for å implementere nesten hver kanji eller hieroglyph du kan tenke på, men fortsatt forbli kompatibel med enkel 8-biters ASCII. UTF-16 bruker en blanding av 16- og 32-biters tegn for å oppnå et utvidet tegnsett, og UTF-32 bruker 32 bits for alle tegn.
UTF står for Unicode Transformation Format, hvorfra det blir det felles kallenavnet Unicode.
Tabellen beskriver de forskjellige tegntypene som støttes av C ++. I begynnelsen forsøkte C ++ å komme seg med en vagt definert bred tegnetype, wchar_t. Denne typen var ment å være den brede karaktertype som er innfødt i programmets miljø. C ++ '11 introduserte spesifikke typer for UTF-16 og UTF-32.
C ++ KaraktertypeneUTF-16 er standardkodingen for Windows-programmer. Wchar_t-typen refererer til UTF-16 i Code:: Blocks / gcc compiler.
Noen av tegntypene i tabellen kan også kombineres til strenge:
wchar_t * wideString = L "dette er en bred streng";
