Unicode

Unicode es un universal codificación de caracteres estándar. Define la forma individual personajes están representados en archivos de texto, páginas weby otros tipos de documentos.

desemejante ASCII, que fue diseñado para representar solo caracteres ingleses básicos, Unicode fue diseñado para soportar caracteres de todos los idiomas alrededor del mundo. El conjunto de caracteres ASCII estándar solo admite caracteres 128, mientras que Unicode puede admitir aproximadamente caracteres 1,000,000. Mientras que ASCII solo usa uno byte para representar cada carácter, Unicode admite hasta 4 bytes para cada carácter.

Sin embargo, hay varios tipos diferentes de codificaciones Unicode UTF-8 y UTF-16 son los más comunes. UTF-8 se ha convertido en la codificación de caracteres estándar utilizada en Web y también es la codificación predeterminada utilizada por muchos programa. programas Si bien UTF-8 admite hasta cuatro bytes por carácter, sería ineficiente usar cuatro bytes para representar los caracteres utilizados con frecuencia. Por lo tanto, UTF-8 usa solo un byte para representar caracteres comunes en inglés. Los caracteres europeos (latinos), hebreos y árabes se representan con dos bytes, mientras que tres bytes se utilizan para los caracteres chinos, japoneses, coreanos y otros caracteres asiáticos. Los caracteres Unicode adicionales se pueden representar con cuatro bytes.

Inicio : Bits y Bytes : Definición Unicode

Unicode

TechLib - El Diccionario Informático Tech Lib

‹Unfriend | Unix ›