Inicio : Bits y Bytes : Definición Unicode

Unicode

Unicode es un universal codificación de caracteres estándar. Define la forma individual personajes están representados en archivos de texto, páginas weby otros tipos de documentos.

desemejante ASCII, que fue diseñado para representar solo caracteres ingleses básicos, Unicode fue diseñado para soportar caracteres de todos los idiomas alrededor del mundo. El conjunto de caracteres ASCII estándar solo admite caracteres 128, mientras que Unicode puede admitir aproximadamente caracteres 1,000,000. Mientras que ASCII solo usa uno byte para representar cada carácter, Unicode admite hasta 4 bytes para cada carácter.

Sin embargo, hay varios tipos diferentes de codificaciones Unicode UTF-8 y UTF-16 son los más comunes. UTF-8 se ha convertido en la codificación de caracteres estándar utilizada en Web y también es la codificación predeterminada utilizada por muchos programa. programas Si bien UTF-8 admite hasta cuatro bytes por carácter, sería ineficiente usar cuatro bytes para representar los caracteres utilizados con frecuencia. Por lo tanto, UTF-8 usa solo un byte para representar caracteres comunes en inglés. Los caracteres europeos (latinos), hebreos y árabes se representan con dos bytes, mientras que tres bytes se utilizan para los caracteres chinos, japoneses, coreanos y otros caracteres asiáticos. Los caracteres Unicode adicionales se pueden representar con cuatro bytes.

TechLib - El Diccionario Informático Tech Lib

Esta página contiene una definición técnica de Unicode. Explica en terminología informática lo que significa Unicode y es uno de los muchos términos informáticos en el diccionario TechLib.

Todas las definiciones en el sitio web de TechLib están escritas para ser técnicamente precisas pero también fáciles de entender. Si encuentra útil esta definición de Unicode, puede hacer referencia a ella utilizando los enlaces de citas anteriores.