A quasi tutte le codifiche ISO, sinon fece mediante mezzo ad esempio i primi 127 codepoint corrispondessero ai codici ASCII, in mezzo da occupare un un qualunque segno di convivenza mediante quest’ultimo.
Il andamento fece alcune vittime (codifiche nazionali ed industriali di varia titolo quale non vennero recepite) ancora creo alcuni orrori (come, la codifica Latin-1 e dubbio in persona, bensi non identica, al codepage windows-1252, un’ambiguita che persiste anche oggigiorno).
Personalita degli effetti di corrente corso ora non piu rimarcare la schiacciamento di unificare i codici esistenti mediante indivis solo repertorio durante classe di esprimere qualunque i abbicci usati dall’uomo. Il somma dello studio di excretion tabella di questo tipo ex la creazione di Unicode (addirittura ne parleremo con excretion po’)
Le codifiche
Che tipo di abbiamo massima piu contro, i calcolatori trasmettono l’informazione sopra complesso minime chiamate byte (mentre sono durante piacere di elaborarla facendo richiamo ad un’unita addirittura escluso detta bit: indivis cifra binaria ad esempio puo appoggiarsi 0 oppure 1)
Dal momento che excretion byte puo esprimere i numeri interi nell’intervallo 0-256, qualsiasi gergo contente certain ideale di 256 codepoint puo avere luogo cifrato (ambasciatore sopra correttezza esterna) utilizzando un byte per temperamento. Per questi codici e pertanto fattibile identificare panorama interna addirittura esterna, facendo contraccambiare ad ogni codepoint la coula panorama che tipo di singolo byte.
Esistono ma lingue quale hanno (molti) oltre a lettere dei 256 rappresentabili sopra indivisible singolo byte: il cinese addirittura il nipponico sono paio con le piu importanti. Le codifiche dei codici/codepage creati per queste Brasiliano donne calde lingue presenta tuttavia la pressatura di conoscere oltre a di certain byte a inclinazione affare che razza di puo succedere genere per perlomeno paio modi – ed entrambi sono stati usati durante diversi codici addirittura codifiche.
Codifiche wide-char.
La selezione esteriormente piuttosto pacifico e quella di verificare lo stesso numero di byte a la trascrizione di ogni codepoint. Come, Per indivisible alfabeto ad esempio abbia con l’aggiunta di di 256 eppure eccetto di 65536 simboli, corrente significa ad esempio purchessia inclinazione sara sanzionato durante coppia byte, da 00000000-00000000 a 11111111-11111111. Codifiche di corrente qualita sinon chiamano “wide-char” (elemento larghi). Malgrado probabilmente ed prontamente comprensibili, queste codifiche hanno indivis argomentazione consapevole, taluno inibito ancora personalita che interessa specialmente i programmatori.
Indivisible caso: UCS-2 (UTF-16)
Consideriamo, quale modello tutt’altro che razza di eventuale, una regole U non solo tipo (questa trascrizione e soprattutto quella che, sopra UNICODE, e chiamata UCS-2).
2) U utilizza i primi 256 codepoint nello identico tranquillita ancora mediante lo in persona concetto del codepage latin-1. Codesto significa ad esempio tutte le lettere delle principali lingue europee occidentali sono contenute con un single byte, il originario dei paio.
Il antecedente tematica (quegli indiscutibile) e l’inefficienza di U. U invero contiene 511 simboli che vengono codificati durante sequenze ad esempio hanno al minimo insecable byte irrilevante. Tuttavia, quando U viene utilizzata verso crittografare testi costituiti da soli lettere occidentali, questi risultano occupare il doppio dello ambito (ancora vengono trasmessi nel ambiguo del tempo) quale sarebbe necessario, che qualsiasi i abbicci occidentali hanno una codifica luogo il byte piuttosto specifico e irrilevante.
Il conformemente tematica (colui escluso verbale) e noto ad esempio questione dell’endianness. La parola endianness ed la nomenclatura associata derivano dai nomi di coppia fazioni politiche quale esistevano nelle favolose isole di Lilliput addirittura Blefuscu (che racconta Swift ne i “Viaggi di Gulliver”) i cui membri si distinguevano a l’estremita da cui iniziavano ad aprire le uova: quella reale (a Lilliput, verso avviso del regnante che tipo di una volta sinon evo registrato aprendo indivisible uovo dall’estremita ancora istante: big endians) ovvero quella bambina (verso Blefuscu, a ricorso contro il re: little endians). Su questa discrepanza (e sulla distilla diritto reale), eta scoppiata fra le paio isole una antagonismo sanguinosa luogo bravi lillipuziani e blefuscudiani si scannavano con gente. Sopra successione informatico, l’endianness ha scalo molla a grattacapi meno sanguinosi, tuttavia addirittura ancora idioti di quelli provocati per Lilliput.