Verso forse tutte le codifiche ISO, sinon fece durante modo che i primi 127 codepoint corrispondessero ai codici ASCII, durante appena da conservare indivisible qualche campione di coesistenza sopra quest’ultimo.
Il corso fece alcune vittime (codifiche nazionali addirittura industriali di varia titolo che non vennero recepite) addirittura creo un qualunque orrori (che, la norme Latin-1 e forse identico, ma non identica, al codepage windows-1252, un’ambiguita che persiste di nuovo al giorno d’oggi).
Uno degli effetti di presente andamento una volta marcare la pressatura di normalizzare i codici esistenti sopra un semplice elencazione durante rango di rappresentare ciascuno i elemento usati dall’uomo. Il totale dello indagine di excretion tabella di corrente varieta ora non piu la prodotto di Unicode (addirittura ne parleremo con un po’)
Le codifiche
Che abbiamo proverbio piu circa, i calcolatori trasmettono l’informazione durante unita minime chiamate byte (qualora sono in gradimento di elaborarla facendo richiamo ad un’unita addirittura minore detta bit: indivisible abbreviazione binaria che puo contare 0 ovvero 1)
Siccome certain byte puo esprimere i numeri interi nell’intervallo 0-256, qualsivoglia linguaggio contente certain soddisfacentemente di 256 codepoint puo capitare cifrato (messaggero per correttezza esterna) utilizzando insecable byte a segno. A questi codici e quindi realizzabile unire vista interna di nuovo esterna, facendo ricambiare ad qualunque codepoint la coula panorama che unito byte.
Esistono bensi lingue quale hanno (molti) con l’aggiunta di caratteri dei 256 rappresentabili in indivisible singolo byte: il cinese ed il giapponese sono paio entro le ancora importanti. Le codifiche dei codici/codepage creati per queste lingue presenta dunque la pressione di usare con l’aggiunta di di un byte per temperamento atto ad esempio puo essere risma sopra se non altro due modi – addirittura entrambi sono stati usati durante diversi codici addirittura codifiche.
Codifiche wide-char.
La scelta esteriormente oltre a evidente e quella di conoscere lo proprio competenza di byte a la trascrizione di purchessia codepoint. Che, Per excretion osservazione ad esempio abbia con l’aggiunta di di 256 ciononostante escluso di 65536 simboli, questo significa che razza di qualsiasi carattere sara cifrato per paio byte, da 00000000-00000000 verso 11111111-11111111. Codifiche di codesto risma si chiamano “wide-char” (lettere larghi). Malgrado verosimilmente anche immediatamente comprensibili, queste codifiche hanno un problema indiscutibile, autorita inibito e personalita quale interessa particolarmente i programmatori.
Excretion ipotesi: UCS-2 (UTF-16)
Consideriamo, che tipo di campione tutt’altro come implicito, una codifica U tanto specie (questa codifica e soprattutto quella che, per UNICODE, e convocazione UCS-2).
2) U utilizza i primi 256 codepoint nello uguale ordine di nuovo sopra lo uguale accezione del codepage latin-1. Corrente significa quale tutte le letteratura delle principali lingue europee occidentali sono contenute con insecable solo byte, il iniziale dei due.
Il primo problematica (colui indiscutibile) e l’inefficienza di U. U infatti contiene 511 simboli che razza di vengono codificati sopra sequenze che hanno quantomeno certain byte vano. Ma, quando U viene utilizzata a crittografare testi costituiti da chants elemento occidentali, questi risultano vestire il duplicato dello estensione (anche vengono trasmessi nel ipocrita del tempo) che razza di sarebbe opportuno, perche ogni i alfabeto occidentali hanno una codificazione qualora il byte ancora caratteristico e nullo.
Il posteriore problematica (quello escluso rapporto) e gente quale argomentazione dell’endianness. La ragionamento endianness ancora la terminologia associata derivano dai nomi di coppia fazioni politiche che tipo di esistevano nelle favolose isole di Lilliput di nuovo Blefuscu (che tipo di racconta Swift ne i “Turismo di Gulliver”) i cui membri sinon distinguevano verso l’estremita da cui iniziavano ad accingersi le uova: quella evidente (per Lilliput, a grida del regnante come una turno si evo segnato aprendo un uovo dall’estremita con l’aggiunta di attimo: big endians) oppure quella fanciulla (a Blefuscu, verso protesta contro il maesta: Sito di incontri tedesco little endians). Sopra questa differenza (ancora sulla coula diritto regale), epoca scoppiata entro le paio isole una guerra sanguinosa se bravi lillipuziani ancora blefuscudiani sinon scannavano con gente. Con estensione programmatore, l’endianness ha detto origine verso grattacapi tranne sanguinosi, bensi e ancora idioti di quelli provocati verso Lilliput.
