Página de códigos 37 - Code page 37

EBCDIC 037
MIME / IANA IBM037
Alias cp037, ebcdic-cp-us, ebcdic-cp-ca, ebcdic-cp-wt, ebcdic-cp-nl, csIBM037
Clasificación EBCDIC
Transforma / Codifica ISO / IEC 8859-1
Otras codificaciones relacionadas EBCDIC 37-2 , 500 , 924 , 1047 , 1140

La página de códigos 37 ( CCSID 37; etiqueta IBM037), conocida como "EE.UU. / Canadá - CECP", es una página de códigos EBCDIC que se utiliza en mainframes de IBM. Se codifica la ISO / IEC 8859-1 repertorio de caracteres gráficos.

La página de códigos 37 es una de las páginas de códigos EBCDIC más utilizadas y con mejor soporte. Se utiliza como página de códigos de z / OS predeterminada en los Estados Unidos y otros países de habla inglesa. Se considera la página de códigos EBCDIC "requerida" para los Estados Unidos y también se utiliza en Australia , Nueva Zelanda , los Países Bajos , Portugal y Brasil , y en los sistemas ESA / 390 en Canadá , pero no en los sistemas AS / 400 canadienses , que utilice la página de códigos 500 en su lugar. Es una de las cuatro páginas de códigos EBCDIC (junto con 500, 875 y 1026) con datos de mapeo proporcionados por Microsoft al Consorcio Unicode , y una de las siete (junto con 273, 424, 500, 875, 1026 y 1140 ) compatibles con Python como estándar. .

Conjunto de caracteres

Página de códigos 37
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _MI _F
0_ NUL
0000
SOH
0001
STX
0002
ETX
0003
SEL
 
HT
0009
RNL
 
DEL
007F
GE
 
SPS
 
RPT
 
VT
000B
FF
000C
CR
000D
SO
000E
SI
000F
1_ DLE
0010
DC1
0011
DC2
0012
DC3
0013
res / enp
 
NL
0085
BS
0008
POC
 
PUEDE
0018
EM
0019
UBS
 
CU1
 
IFS
001C
IGS
001D
IRS
001E
ius / itb
001F
2_ DS
 
llamada de socorro
 
FS
 
WUS
 
byp / inp
 
LF
000A
ETB
0017
ESC
001B
SA
 
SFE
 
sm / sw
 
CSP
 
MFA
 
ENQ
0005
ACK
0006
BEL
0007
3_ SYN
0016
IR
 
PÁGINAS
 
TRN
 
Oficina nacional de normas
 
EOT
0004
SBS
 
ESO
 
RFF
 
CU3
 
DC4
0014
NAK
0015
SUB
001A
4_ SP
0020
NBSP
00A0
â
00E2
ä
00E4
à
00E0
á
00E1
ã
00E3
å
00E5
ç
00E7
ñ
00F1
¢
00A
.
002E
<
003C
(
0028
+
002B
|
007C
5_ &
0026
é
00E9
ê
00EA
ë
00EB
è
00E8
í
00ED
î
00EE
ï
00EF
ì
00EC
ß
00DF
!
0021
$
0024
*
002A
)
0029
;
003B
¬
00AC
6_ -
002D
/
002F
Â
00C2
Ä
00C4
À
00C0
Á
00C1
Ã
00C3
Å
00C5
Ç
00C7
Ñ
00D1
¦
00A6
,
002C
%
0025
_
005F
>
003E
?
003F
7_ ø
00F8
É
00C9
Ê
00CA
Ë
00CB
È
00C8
Í
00CD
Î
00CE
Ï
00CF
Ì
00CC
`
0060
:
003A
#
0023
@
0040
«
0027
=
003D
"
0022
8_ Ø
00D8
un
0061
b
0062
c
0063
d
0064
e
0065
f
0066
g
0067
h
0068
yo
0069
«
00AB
»
00BB
ð
00F0
ý
00FD
þ
00FE
±
00B1
9_ °
00B0
j
006A
k
006B
l
006C
m
006D
n
006E
o
006F
p
0070
q
0071
r
0072
ª
00AA
º
00BA
æ
00E6
¸
00B8
Æ
00C6
¤
00A4
A_ µ
00B5
~
007E
s
0073
t
0074
u
0075
v
0076
w
0077
x
0078
y
0079
z
007A
¡
00A1
¿
00BF
Ð
00D0
Ý
00DD
Þ
00DE
®
00AE
B_ ^
005E
£
00A3
¥
00A5
·
00B7
©
00A9
§
00A7

00B6
¼
00BC
½
00BD
¾
00BE
[
005B
]
005D
¯
00AF
¨
00A8
´
00B4
×
00D7
C_ {
007B
A
0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
Yo
0049
SHY
00AD
ô
00F4
ö
00F6
ò
00F2
ó
00F3
õ
00F5
D_ }
007D
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
P
0050
Q
0051
R
0052
¹
00B9
û
00FB
ü
00FC
ù
00F9
ú
00FA
ÿ
00FF
MI_ \
005C
÷
00F7
S
0053
T
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005A
²
00B2
Ô
00D4
Ö
00D6
Ò
00D2
Ó
00D3
Õ
00D5
F_ 0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
³
00B3
Û
00DB
Ü
00DC
Ù
00D9
Ú
00DA
EO
 

  Carta  Número  Puntuación  Símbolo  Otro  Indefinido

Traducción de la página de códigos

Dado que el CP 037 contiene todos los caracteres latin-1 estándar, es posible traducir los códigos de caracteres del juego de caracteres CP 037 a códigos de caracteres ISO 8859-1 , de modo que la traducción al juego de caracteres CP 037 es una ronda exacta que preserva el valor. -conversión de viaje . Asimismo, la mitad de los códigos de caracteres de control se pueden traducir a sus equivalentes ASCII exactos . Si los restantes caracteres de control únicamente EBCDIC se traducen (arbitrariamente) en los puntos restantes de códigos ASCII no utilizados (hexadecimal 80 a 9F), la traducción resultante cubre todos los 256 puntos de código de caracteres. A continuación se muestra una tabla de traducción de este tipo:

CP 037 → ISO 8859-1
  _0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _MI _F
0_ 00 01 02 03 9C 09 86 7F 97 8D 8E 0B 0C 0D 0E 0F
1_ 10 11 12 13 9D 85 08 87 18 19 92 8F 1C 1D 1E 1F
2_ 80 81 82 83 84 0A 17 1B 88 89 8A 8B 8C 05 06 07
3_ 90 91 dieciséis 93 94 95 96 04 98 99 9A 9B 14 15 9E 1A
4_ 20 A0 E2 E4 E0 E1 E3 E5 E7 F1 A2 2E 3C 28 2B 7C
5_ 26 E9 EA EB E8 ED EE EF CE DF 21 24 2A 29 3B C.A.
6_ 2D 2F C2 C4 C0 C1 C3 C5 C7 D1 A6 2C 25 5F 3E 3F
7_ F8 C9 California CB C8 CD CE CF CC 60 3A 23 40 27 3D 22
8_ D8 61 62 63 64 sesenta y cinco 66 67 68 69 AB cama y desayuno F0 FD FE B1
9_ B0 6A 6B 6C 6D 6E 6F 70 71 72 Automóvil club británico licenciado en Letras E6 B8 C6 A4
A_ B5 7E 73 74 75 76 77 78 79 7A A1 BF D0 DD Delaware AE
B_ 5E A3 A5 B7 A9 A7 B6 antes de Cristo BD SER 5B 5D AF A8 B4 D7
C_ 7B 41 42 43 44 45 46 47 48 49 ANUNCIO F4 F6 F2 F3 F5
D_ 7D 4A 4B 4C 4D 4E 4F 50 51 52 B9 pensión completa FC F9 FA FF
MI_ 5C F7 53 54 55 56 57 58 59 5A B2 D4 D6 D2 D3 D5
F_ 30 31 32 33 34 35 36 37 38 39 B3 DB corriente continua D9 DA 9F

Variantes y relación con otras páginas de códigos

Las posiciones del signo de intercalación ( ^) y no del signo ( ¬), aunque oficialmente B0 hex y 5F hex respectivamente, a veces se cambian, incluso cuando se usan con APL en el sistema 3279. Esta variante ha sido reconocido por COMPARTIR , pero no designado oficialmente como una página de códigos por IBM, y algunas veces se hace referencia como código de la página 37-2 por transcodificación de software.

Existen varias otras páginas de códigos, que equivalen a la página de códigos 37 con algunos caracteres intercambiados. En particular, la página de códigos 37 codifica los corchetes ( []) en BA hex y BB hex , mientras que otras variantes utilizan otras codificaciones para los corchetes. Por ejemplo, la página de códigos 1047 es una variante utilizada por el compilador MVS Open Systems. Se diferencia de la página de códigos 37 en seis posiciones: Ýy [cambia de lugar, al igual que ¨y ], colocando los corchetes en AD hex y BD hex ; el signo de intercalación y el signo no también cambian de lugar, como en la página de códigos 37-2. Esta codificación de los corchetes se heredó del sistema de visualización 3270. Aunque IBM tiene la intención de que la página de códigos 1047 se utilice solo para cumplir requisitos específicos, y no como un reemplazo de las páginas de códigos 37 y 500, el subconjunto de la página de códigos 1047 que codifica el repertorio ASCII se usó para los códigos gráficos de un solo byte en UTF-EBCDIC .

La página de códigos 500 , conocida como "International EBCDIC", "International Latin-1" o "International Number 5", es la otra codificación EBCDIC importante para el repertorio ISO / IEC 8859-1. Se utiliza en Bélgica , Suiza y en sistemas AS / 400 en Canadá . Está relacionado con la página de códigos 37 y tiene el mismo repertorio, pero difiere en siete posiciones; en particular, codifica [y ]en 4A hexadecimal y 5A hexadecimal respectivamente, que se utilizan para el signo de centavo ( ¢) y el signo de exclamación ( !) en la página de códigos 37. El signo de intercalación ( ^) también se codifica en 5F hexadecimal , de forma similar a la página de códigos 37- 2 y 1047. El ¢está codificado en B0 hex , ¬en BA hex , !en 4F hex y el carácter de tubería ( |) en BB hex . La página de códigos 500 está a su vez relacionada con la página de códigos alemana 273 , que intercambia varios pares de caracteres de una manera correspondiente a las diferencias entre DRV8 e ISO / IEC 8859-1, lo que da como resultado la colocación de los corchetes en 63 hex y FC hex .

Una variante de la página de códigos 37 con el símbolo del euro ( ) agregado en la posición hexadecimal 9F , que reemplaza el signo de moneda universal ( ¤) es la página de códigos 1140 . De manera similar, la página de códigos 1148 realiza el mismo cambio en la página de códigos 500 y la página de códigos 1141 lo hace en la página de códigos 273.

Una página de códigos EBCDIC con el repertorio ISO / IEC 8859-15 , incluido el símbolo del euro, es la página de códigos 924 ; esto está relacionado con la página de códigos 1047 pero con los caracteres ISO / IEC 8859-1 reemplazados con sus reemplazos de ISO / IEC 8859-15, con ¢ y ¬ movidos a sus ubicaciones de la página de códigos 500 en B0 hex y BA hex respectivamente, y con Ý movido a 4A hex .

Ver también

Referencias

  1. ^ a b Conjuntos de caracteres de IANA
  2. ^ Stephens, David (2011), "Lost in Translation 1 - Páginas de código EBCDIC" , LongEx Mainframe Quarterly , Longpela Expertise
  3. ^ a b "Identificadores de página de códigos: CPGID 1047" . IBM . Archivado desde el original el 7 de junio de 2015. Esta página de códigos está destinada a un uso limitado para cumplir con requisitos específicos. No pretende reemplazar la página de códigos 00037, que es la página de códigos requerida para los Estados Unidos y varios otros países o la página de códigos 00500.
  4. ^ "Identificadores de juego de caracteres codificados — CCSID 37" . IBM . Archivado desde el original el 29 de noviembre de 2014.
  5. ^ a b c "Identificadores de juego de caracteres codificados: CCSID 500" . IBM . Archivado desde el original el 1 de diciembre de 2014.
  6. ^ "Asignaciones | Proveedores | Microsoft | EBCDIC" . Consorcio Unicode .
  7. ^ "Códecs - Registro de códecs y clases base § Codificaciones estándar" . Documentación de Python . Fundación de software Python .
  8. ^ Página de códigos CPGID 00037 (pdf) (PDF) , IBM
  9. ^ Página de códigos CPGID 00037 (txt) , IBM
  10. ^ a b c xlate - Transliterate Contents of Records , IBM Corporation , 2010 [1986], archivado desde el original el 16 de junio de 2019 , consultado el 18 de octubre de 2016
  11. a b Umamaheswaran, VS (16 de abril de 2002). "UTF-EBCDIC" . Consorcio Unicode . Informe técnico Unicode n. ° 16. El mapa conserva la invariancia para un conjunto de 82 caracteres gráficos (incluido el ESPACIO) (conocido como el conjunto de caracteres gráficos sintácticos de IBM) y mantiene la coherencia con la página de códigos de sistemas abiertos de IBM MVS (CPGID 1047) para los caracteres variantes de ASCII repertorio.
  12. ^ "ibm-1047" . Componentes internacionales para Unicode . Explorador de convertidores . Consorcio Unicode .
  13. ^ "Página de códigos 1047" (PDF) . IBM . Archivado (PDF) desde el original el 8 de julio de 2015 . Consultado el 9 de junio de 2021 .
  14. ^ "ibm-500" . Componentes internacionales para Unicode . Explorador de convertidores . Consorcio Unicode .
  15. ^ "Página de códigos 500" (PDF) . IBM . Archivado (PDF) desde el original el 8 de julio de 2015 . Consultado el 9 de junio de 2021 .
  16. ^ "ibm-273" . Componentes internacionales para Unicode . Explorador de convertidores . Consorcio Unicode .
  17. ^ "ibm-1140" . Componentes internacionales para Unicode . Explorador de convertidores . Consorcio Unicode .
  18. ^ "Página de códigos 1140" (PDF) . IBM . Archivado (PDF) desde el original el 8 de julio de 2015 . Consultado el 9 de junio de 2021 .
  19. ^ "ibm-1140" . Componentes internacionales para Unicode . Explorador de convertidores . Consorcio Unicode .
  20. ^ "Página de códigos 1148" (PDF) . IBM . Archivado (PDF) desde el original el 8 de julio de 2015 . Consultado el 9 de junio de 2021 .
  21. ^ "ibm-1141" . Componentes internacionales para Unicode . Explorador de convertidores . Consorcio Unicode .
  22. ^ "Página de códigos 924" (PDF) . IBM . Archivado (PDF) desde el original el 8 de julio de 2015 . Consultado el 9 de junio de 2021 .

enlaces externos