La codificación de caracteres en código c ++
Todo en el ordenador está representado por un patrón de unos y ceros - variaciones en el voltaje que se interpretan como números. Así, el patrón de bits 0000 0001 es el número 1 cuando interpreta como un número entero. Sin embargo, este mismo patrón de bits significa algo completamente diferente cuando interpreta como una instrucción por el procesador.
Video: 92. Programación en C - Cadenas - Lectura de cadenas de caracteres
Por lo tanto, no debería ser una sorpresa que el equipo codifica los caracteres del alfabeto mediante la asignación de cada uno un número.
Considere el carácter ‘A’. Se podría asignar cualquier valor que desee, siempre y cuando todos estamos de acuerdo en el valor. Por ejemplo, podría asignar un valor de 1 a ‘A’, si se quería. Lógicamente, es posible que a continuación, asignar el valor a 2 ‘B’, 3 a ‘C’, y así sucesivamente.
Video: Codificar cadenas de texto facil con C++ (Cifrado Cesar)
En este esquema, ‘Z’ obtendría el valor 26. A continuación, podría empezar de nuevo asignando el valor a 27 ‘a’, 28 a ‘b’, hasta llegar a 52 para la ‘z’. Esto aún deja el dígito ‘0’ al ‘9’ además de todos los símbolos especiales como el espacio, punto, coma, raya vertical, punto y coma, y los divertidos personajes que aparecen al pulsar las teclas numéricas mientras mantiene la marcha inferior.
Añadir a que los caracteres no imprimibles como ficha y nueva línea. Cuando todo está dicho y hecho, se podría codificar todo el teclado Inglés usando los números entre 1 y 127.
En algún momento alrededor de 1963, hubo un acuerdo general sobre cómo los personajes deben ser codificados en Inglés. El ASCII (American Standard Codificación para el Intercambio de Información) codificación de caracteres se muestra en la fue adoptado casi universalmente a excepción de una empresa.
IBM publicó su propio estándar en 1963 también. Los dos estándares de codificación disputaron a cabo desde hace unos diez años, pero a principios de los años 1970 - cuando se están creando C y C ++ - ASCII habían casi ganado la batalla. los carbonizarse Tipo fue creado con caracteres ASCII codificación en mente.
Video: Tutorial C - 33. Caracteres Especiales
Valor | Carbonizarse | Valor | Carbonizarse |
---|---|---|---|
0 | NULO | 64 | @ |
1 | Inicio del Título | sesenta y cinco | UN |
2 | Inicio del texto | 66 | segundo |
3 | Fin del texto | 67 | do |
4 | Fin de la transmisión | 68 | re |
5 | Investigación | 69 | mi |
6 | Reconocer | 70 | F |
7 | Campana | 71 | GRAMO |
8 | Retroceso | 72 | MARIDO |
9 | Lengüeta | 73 | yo |
10 | Nueva línea | 74 | J |
11 | Vertical Tab | 75 | K |
12 | Nuevo formulario Page- RSS | 76 | L |
13 | Retorno de carro | 77 | METRO |
14 | Desplazar fuera | 78 | norte |
15 | Desplazar en | 79 | O |
dieciséis | Escape de Enlace de Datos | 80 | PAG |
17 | Control de dispositivos 1 | 81 | Q |
18 | Control de dispositivos 2 | 82 | R |
19 | Control de dispositivos 3 | 83 | S |
20 | Control de dispositivos 4 | 84 | T |
21 | confirmación negativa | 85 | T |
22 | Idle síncrona | 86 | V |
23 | Fin de la transmisión | 87 | W |
24 | Cancelar | 88 | x |
25 | Fin de la media | 89 | Y |
26 | Sustituir | 90 | Z |
27 | Escapar | 91 | [ |
28 | archivo separador | 92 | |
29 | grupo separador | 93 | ] |
30 | separador de registros | 94 | ^ |
31 | unidad Separador | 95 | _ |
32 | Espacio | 96 | ` |
33 | ! | 97 | un |
34 | “ | 98 | segundo |
35 | # | 99 | do |
36 | ps | 100 | re |
37 | % | 101 | mi |
38 | & | 102 | F |
39 | &lsquo- | 103 | gramo |
40 | ( | 104 | marido |
41 | ) | 105 | yo |
42 | * | 106 | j |
43 | + | 107 | k |
44 | , | 108 | l |
45 | = | 109 | metro |
46 | . | 110 | norte |
47 | / | 111 | o |
48 | 0 | 112 | pag |
49 | 1 | 113 | q |
50 | 2 | 114 | r |
51 | 3 | 115 | s |
52 | 4 | 116 | t |
53 | 5 | 117 | u |
54 | 6 | 118 | v |
55 | 7 | 119 | w |
56 | 8 | 120 | x |
57 | 9 | 121 | y |
58 | : | 122 | z |
59 | - | 123 | |
61 | = | 125 | |
62 | gt; | 126 | ~ |
63 | ? | 127 | DEL |
La primera cosa que usted notará es que los primeros 32 caracteres son los caracteres no imprimibles “”. Eso no quiere decir que estos personajes son tan travieso que el censor no les permitirá ser impresos - que significa que no aparecen como símbolos visibles cuando se imprime en la impresora (o en la consola, para el caso). Muchos de estos personajes ya no se utilizan o se utilizan sólo en formas oscuras.
Por ejemplo, el carácter 25 “Fin del Medio” probablemente fue impreso como el último carácter antes del final de un carrete de cinta magnética. Eso fue un gran problema en 1963, pero hoy en día. . . no tanto, así que el uso del personaje es limitado.
Los caracteres que comienzan con 32 son todos imprimible con la excepción de la última, 127, que es el carácter Eliminar.