Latín básico (bloque Unicode) - Basic Latin (Unicode block)
Controles C0 y latín básico | |
---|---|
Distancia | U + 0000..U + 007F (128 puntos de código) |
Plano | BMP |
Guiones |
Latín (52 caracteres) Común (76 caracteres) |
Alfabetos principales |
Inglés francés alemán español vietnamita |
Conjuntos de símbolos |
Números arábigos Puntuación |
Asignado | 128 puntos de código 33 Control o formato |
No usado | 0 puntos de código reservados |
Estándares de origen | ISO / IEC 8859 , ISO 646 |
Historial de versiones de Unicode | |
1.0.0 (1991) | 128 (+128) |
Nota : |
El bloque Basic Latin o C0 Controls y Basic Latin Unicode es el primer bloque del estándar Unicode , y el único bloque que está codificado en un byte en UTF-8 . El bloque contiene todas las letras y códigos de control de la codificación ASCII. Se extiende de U + 0000 a U + 007F, contiene 128 caracteres e incluye los controles C0 , ASCII puntuacion y símbolos , ASCII dígitos , tanto en el mayúsculas y minúsculas del alfabeto Inglés y un carácter de control .
El bloque de latín básico se incluyó en su forma actual a partir de la versión 1.0.0 del estándar Unicode, sin adición ni alteración del repertorio de caracteres. Su nombre de bloque en Unicode 1.0 era ASCII .
Tabla de personajes
- A La letra U + 005C (\) puede aparecer como un signo de Yen (¥) o Won (₩) en fuentes japonesas / coreanas confundiendo Unicode (especialmenteUTF-8) con un conjunto de caracteres heredado que reemplazó la barra invertida con estos signos.
Subtítulos
El bloque C0 Controls y Basic Latin contiene seis subtítulos.
Controles C0
Los controles C0 , denominados códigos de control C0 ASCII en la versión 1.0, se heredan de ASCII y otros esquemas de codificación de 7 y 8 bits. Los nombres de alias para los controles C0 se toman de la norma ISO / IEC 6429: 1992 .
Símbolos y puntuación ASCII
Este subtítulo se refiere a caracteres de puntuación estándar, operadores matemáticos simples y símbolos como el signo de dólar, el porcentaje, el signo comercial, el subrayado y la barra vertical.
Dígitos ASCII
El subtítulo de dígitos ASCII contiene los caracteres numéricos europeos estándar 1–9 y 0.
Alfabeto latino en mayúsculas
El subtítulo del alfabeto latino en mayúsculas contiene el alfabeto latino sin acento estándar de 26 letras en mayúscula .
Alfabeto latino en minúsculas
El subtítulo Alfabeto latino en minúsculas contiene el alfabeto latino estándar sin acento de 26 letras en minúscula .
Carácter de control
El subtítulo Carácter de control contiene el carácter "Eliminar".
Número de símbolos, letras y códigos de control
La siguiente tabla muestra el número de letras , símbolos y códigos de control en cada uno de los subtítulos del bloque Controles C0 y Latín básico.
Tipo de subpartida | Numero de simbolos | Gama de personajes |
---|---|---|
Controles C0 | 32 códigos de control | U + 0000 hasta U + 001F |
Símbolos y puntuación ASCII | 33 signos de puntuación y símbolos | U + 0020 a U + 002F, U + 003A a U + 0040, U + 005B a U + 0060 y U + 007B a U + 007E |
Dígitos ASCII | 10 dígitos | U + 0030 hasta U + 0039 |
Alfabeto latino en mayúsculas | 26 letras latinas sin acento en mayúscula. | U + 0041 hasta U + 005A |
Alfabeto latino en minúsculas | 26 letras latinas sin acento en minúscula. | U + 0061 hasta U + 007A |
Carácter de control | 1 código de control que contiene el carácter "Eliminar". | U + 007F |
Cuadra
C0 Controls y Basic Latin Official Unicode Consortium code chart (PDF) |
||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | mi | F | |
U + 000x | NUL | SOL | STX | ETX | EOT | ENQ | ACK | BEL | BS | HT | LF | Vermont | FF | CR | ASI QUE | SI |
U + 001x | DLE | DC1 | DC2 | DC3 | DC4 | NAK | SYN | ETB | PUEDEN | EM | SUB | ESC | FS | GS | RS | nosotros |
U + 002x | SP | ! | " | # | PS | % | Y | ' | ( | ) | * | + | , | - | . | / |
U + 003x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
U + 004x | @ | A | B | C | D | mi | F | GRAMO | H | I | J | K | L | METRO | norte | O |
U + 005x | PAG | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
U + 006x | ' | a | B | C | D | mi | F | gramo | h | I | j | k | l | metro | norte | o |
U + 007x | pag | q | r | s | t | tu | v | w | X | y | z | { | | | } | ~ | DEL |
Notas
|
Variantes
Varios de los caracteres están definidos para representarse como una variante estandarizada si van seguidos de indicadores de variante.
Se define una variante para un cero con un trazo diagonal corto: U + 0030 DIGIT ZERO, U + FE00 VS1 (0︀).
Doce caracteres (#, * y los dígitos) pueden ir seguidos de U + FE0E VS15 o U + FE0F VS16 para crear variantes de emoji . Son keycap caracteres base, por ejemplo # ️⃣ (U + 0023 NÚMERO DE SEÑAL T + T + FE0F VS16 20E3 COMBINA tecla clave que encierra). La versión VS15 es "presentación de texto" mientras que la versión VS16 es "estilo emoji".
U + | 0023 | 002A | 0030 | 0031 | 0032 | 0033 | 0034 | 0035 | 0036 | 0037 | 0038 | 0039 |
base | # | * | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
base + VS15 + tecla | # ︎⃣ | * ︎⃣ | 0︎⃣ | 1︎⃣ | 2︎⃣ | 3︎⃣ | 4︎⃣ | 5︎⃣ | 6︎⃣ | 7︎⃣ | 8︎⃣ | 9︎⃣ |
base + VS16 + tecla | # ️⃣ | * ️⃣ | 0️⃣ | 1️⃣ | 2️⃣ | 3️⃣ | 4️⃣ | 5️⃣ | 6️⃣ | 7️⃣ | 8️⃣ | 9️⃣ |
Historia
Los siguientes documentos relacionados con Unicode registran el propósito y el proceso de definir caracteres específicos en el bloque de latín básico:
Versión | Puntos de código finales | Contar | ID de UTC | ID de L2 | ID de WG2 | Documento |
---|---|---|---|---|---|---|
1.0.0 | U + 0000..007F | 128 | (estar determinado) | |||
UTC / 1999-013 | Karlsson, Kent (27 de mayo de 1999), Tildes y descomposiciones de micro signos | |||||
L2 / 99-176R | Moore, Lisa (1999-11-04), "Micro Sign Case Mappings", Actas de la reunión conjunta UTC / L2 en Seattle, 8-10 de junio de 1999 | |||||
L2 / 04-145 | Starner, David (2004-04-30), C con ejemplos de caracteres de trazo del informe BAE 1884 (Dorsey) | |||||
L2 / 04-202 | Anderson, Deborah (2004-06-07), Slashed C Feedback | |||||
N3046 | Suignard, Michel (22/02/2006), Mejora de la definición formal de los personajes de control | |||||
N3103 (pdf , documento ) | Umamaheswaran, VS (2006-08-25), "M48.33", Actas no confirmadas de la reunión 48 del GT 2, Mountain View, CA, EE. UU.; 2006-04-24 / 27 | |||||
L2 / 11-043 | Freytag, Asmus; Karlsson, Kent (2011-02-02), Propuesta para corregir errores e inconsistencias en ciertas asignaciones de propiedad para letras con superíndice y subíndice | |||||
L2 / 11-160 | PRI # 181 Cambio de categoría general de doce caracteres , 2011-05-02 | |||||
L2 / 11-261R2 |
Moore, Lisa (2011-08-16), "Consensus 128-C3", UTC # 128 / L2 # 225 Minutes , Acepte las recomendaciones de Ken Whistler en L2 / 11-281 sobre los alias de nombres para los caracteres de control con la adición de las abreviaturas BEL y NUL. |
|||||
L2 / 11-438 | N4182 | Edberg, Peter (2011-12-22), Secuencias de variación de Emoji (Revisión de L2 / 11-429) | ||||
L2 / 15-107 |
Moore, Lisa (2015-05-12), "Consensus 143-C5", UTC # 143 Minutos , agregue las 12 secuencias de teclas en emoji-data.txt como secuencias con nombre provisionales en Unicode 8.0. |
|||||
L2 / 15-268 | Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (30-10-2015), propuesta para representar la variante cero recortada del conjunto vacío | |||||
L2 / 15-301 | Pournader, Roozbeh (2015-11-01), Una propuesta para 278 secuencias de variación estandarizadas para emoji | |||||
L2 / 15-254 | Moore, Lisa (2015-11-16), "B.12.1.2 Propuesta para representar la variante cero recortada del conjunto vacío", UTC # 145 Minutos | |||||
L2 / 17-294 | N4914 | Lunde, Ken (2017-08-14), propuesta para agregar una secuencia de variación estandarizada para U + FF10 FULLWIDTH DIGIT CERO | ||||
Ver también
Referencias
- ^ "Base de datos de caracteres Unicode" . El estándar Unicode . Consultado el 9 de julio de 2016 .
- ^ "Versiones enumeradas del estándar Unicode" . El estándar Unicode . Consultado el 9 de julio de 2016 .
- ^ El estándar Unicode versión 1.0, volumen 1 . Addison-Wesley Publishing Company, Inc. 1990. ISBN 0-201-56788-1.
- ^ "3.8: Gráficos bloque por bloque" (PDF) . El estándar Unicode . versión 1.0. Consorcio Unicode .
- ^ Ordenando todo: ¿Cuándo una barra invertida no es una barra invertida?
- ^ a b c d e f g "Gráficos de código Unicode 6.2" (PDF) . El estándar Unicode . Consultado el 1 de abril de 2013 .
- ^ Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (30 de octubre de 2015). "L2 / 15-268: Propuesta para representar la variante cero recortada del conjunto vacío" (PDF) .
- ^ a b "Secuencias de variación de Emoji UTS # 51" . El Consorcio Unicode.
- ↑ Edberg, Peter (22 de diciembre de 2011). "L2 / 11-438: Secuencias de variación de Emoji (Revisión de L2 / 11-429)" (PDF) .
- ↑ Pournader, Roozbeh (1 de noviembre de 2015). "L2 / 15-301: Una propuesta para 278 secuencias de variación estandarizadas para emoji" (PDF) .
- ^ "UTR # 51: Unicode Emoji" . Consorcio Unicode. 2020-02-11.
- ^ "UCD: datos de Emoji para UTR # 51" . Consorcio Unicode. 2021-08-26.