[SemiOT]Tabla de codigos ASCII en WXP

04/10/2005 - 23:55 por Fernando - Teleline | Informe spam
Que codificación usa, por defecto, WXP?

Es que me hago un lio con esto. No se si usa un ASCII extendido modificado,
ISO-8859-1,ANSI, UTF-8, UTF-16, UNICODE u otro.

Usando el bloc de notas, si escribo Alt+0XXX (siendo X lo que sea). Todo lo
que he probado, en WXP, coincide con la iso-8859-1

Pero por ejemplo:

En WXP pongo Alt+0128 y sale el simbolo del euro
En abro el simbolo de sistema y pongo Alt+0128 sale la c cedilla

En WXP pongo Alt+128 y sale la c cedilla
En abro el simbolo de sistema y pongo Alt+0128 sale la c cedilla


Donde podia conseguir la tabla de codigos, hasta el caracter 256, de cada
uno de esos sistemas operativos: WXP, W98?

Y que diferencia hay entre guardar un archivo en el bloc de notas como
ANSI, Unicode, Unicode big endian, Utf-8?

Preguntas similare

Leer las respuestas

#6 Daniel Martín
12/10/2005 - 12:17 | Informe spam
Busque esa tabla y son 256 caracteres ¿No tiene mas?



Pues ahora mismo no sé exactamente los caracteres que tiene, pero sí, aproximadamente serán unos 256.

Si uso el español y asi tengo configurado el ordenador en WXP, si pongo,
por ejemplo, Alt+0159 sale un caracter (el que sea)

¿Que tabla de codigos he usado?



Si empleas un idioma occidental como el español estás usando la tabla "Windows: occidental" que te comento (caracteres latinos más el símbolo del euro). Abre Mapa de caracteres (Inicio, Ejecutar, "charmap", Aceptar), pulsa Vista avanzada y en Juego de caracteres selecciona "Windows: occidental". Allí tendrás la tabla que usas cuando empleas una distribución de teclado española, con sus combinaciones "Alt+" correspondientes.

Un saludo,
Daniel Martín
Correo electrónico:


"Fernando - Teleline" wrote in message news:
Daniel Martín wrote in
news::

Respuesta Responder a este mensaje
#7 José Manuel Agüero
13/10/2005 - 02:15 | Informe spam
Hola, Fernando:

Algunas aclaraciones: La tabla de códigos ASCII tiene 128 elementos. Para usar los 128 valores restantes que se pueden representar con un byte se usan páginas de códigos, como la Latín-1 (850), o la ANSI (1252) que, obviamente, pueden contener caracteres distintos para el mismo código.

Windows 95, 98 y Me usaban la página de códigos ANSI para los programas de Windows y la Latín-1 (en las versiones en español) para los programas de DOS.
Windows NT y sucesores usan Unicode para los progrmas de Windows y la Latín-1 para DOS (en español). Las tablas usadas para DOS se conocen también como OEM. Esta es la razón de que te aparezca un carácter distinto si pulsas Alt+128 (tabla OEM) o Alt+0128 (Unicode, ANSI en el bloc de notas).

Para frenar el lío que supone que cada uno use la página de códigos que le convenga, se diseñó el estándar Unicode, que comprende todos los caracteres que existen o han existido, aparte de símbolos, signos y otros elementos. Actualmente Unicode comprende más de 97000 códigos, de los cuales unos 70000 son ideogramas (como los caracteres chinos). Además los 256 primeros códigos de Unicode coinciden con la tabla ANSI. Tienes toda la información que quieras en www.unicode.org.

En cuanto a UTF-8 y UTF-16 son formas de representar numéricamente los códigos. Si sólo usáramos ASCII, bastaría un byte para representar cada código, pero un byte sólo puede contener 256 valores. Las codificaciones UTF permiten representar todo el espectro Unicode usando un número variable de bytes para cada código.

En cuanto al bloc de notas, si guardas como ANSI, perderás todos los caracteres que no estén en esa tabla; Unicode guarda con codificación UTF-16 little endian; Uniconde big endian y UTF-8 guardan en la respectiva codificación.
UTF-8 tiene la ventaja de que los caracteres de código menor de 0xa0 se guardan en un sólo byte, de forma que se puede leer como si estuviera codificado con la tabla ANSI.

Una cosa más. Los métodos de entrada avanzados de Windows permiten usar los códigos que puedes ver en el Mapa de caracteres. Por ejemplo, en el WordPad (y en varias versiones de Word) puedes escribir directamente el código y, a continuación, pulsar Alt+X. También puedes escribir un carácter y pulsar Alt+Mays+X: aparecerá el código hexadecimal del carácter. Los programas compatibles con los métodos de entrada avanzados también te permiten escribir códigos mayores que Alt+0255.

No sé si te he aclarado algo, pero lo he intentado...

Saludos.


"Fernando - Teleline" escribió en el mensaje news:
| Daniel Martín wrote in
| news::
|
| > Depende de la distribuci¢n de teclado que est‚s usando. Para los
| > idiomas de Europa occidental la tabla usada es la Windows 1252
|
| Busque esa tabla y son 256 caracteres ¿No tiene mas?
|
| Si uso el español y asi tengo configurado el ordenador en WXP, si pongo,
| por ejemplo, Alt+0159 sale un caracter (el que sea)
|
| ¿Que tabla de codigos he usado? Es que, como digo, la tabla que encontre
| solo tiene 256 caracteres
|
| Saludos y gracias por responder
Respuesta Responder a este mensaje
#8 Fernando - Teleline
24/10/2005 - 02:24 | Informe spam
José Manuel Agüero <jmaguero_vodafone.es> wrote in
news:#7i2#:

Hola, Fernando:

Algunas aclaraciones: La tabla de c¢digos ASCII tiene 128 elementos.
Para usar los 128 valores restantes que se pueden representar con un
byte se usan p ginas de c¢digos, como la Lat¡n-1 (850), o la ANSI
(1252) que, obviamente, pueden contener caracteres distintos para el
mismo c¢digo.

Windows 95, 98 y Me usaban la p gina de c¢digos ANSI para los
programas de Windows y la Lat¡n-1 (en las versiones en espa¤ol) para
los programas de DOS. Windows NT y sucesores usan Unicode para los
progrmas de Windows y la Lat¡n-1 para DOS (en espa¤ol). Las tablas
usadas para DOS se conocen tambi‚n como OEM. Esta es la raz¢n de que
te aparezca un car cter distinto si pulsas Alt+128 (tabla OEM) o
Alt+0128 (Unicode, ANSI en el bloc de notas).

Para frenar el l¡o que supone que cada uno use la p gina de c¢digos
que le convenga, se dise¤¢ el est ndar Unicode, que comprende todos
los caracteres que existen o han existido, aparte de s¡mbolos, signos
y otros elementos. Actualmente Unicode comprende m s de 97000 c¢digos,
de los cuales unos 70000 son ideogramas (como los caracteres chinos).
Adem s los 256 primeros c¢digos de Unicode coinciden con la tabla
ANSI. Tienes toda la informaci¢n que quieras en www.unicode.org.

En cuanto a UTF-8 y UTF-16 son formas de representar num‚ricamente los
c¢digos. Si s¢lo us ramos ASCII, bastar¡a un byte para representar
cada c¢digo, pero un byte s¢lo puede contener 256 valores. Las
codificaciones UTF permiten representar todo el espectro Unicode
usando un n£mero variable de bytes para cada c¢digo.

En cuanto al bloc de notas, si guardas como ANSI, perder s todos los
caracteres que no est‚n en esa tabla; Unicode guarda con codificaci¢n
UTF-16 little endian; Uniconde big endian y UTF-8 guardan en la
respectiva codificaci¢n. UTF-8 tiene la ventaja de que los caracteres
de c¢digo menor de 0xa0 se guardan en un s¢lo byte, de forma que se
puede leer como si estuviera codificado con la tabla ANSI.

Una cosa m s. Los m‚todos de entrada avanzados de Windows permiten
usar los c¢digos que puedes ver en el Mapa de caracteres. Por ejemplo,
en el WordPad (y en varias versiones de Word) puedes escribir
directamente el c¢digo y, a continuaci¢n, pulsar Alt+X. Tambi‚n puedes
escribir un car cter y pulsar Alt+Mays+X: aparecer  el c¢digo
hexadecimal del car cter. Los programas compatibles con los m‚todos de
entrada avanzados tambi‚n te permiten escribir c¢digos mayores que
Alt+0255.

No s‚ si te he aclarado algo, pero lo he intentado...

Saludos.



Me has aclarado muchisimo y, el mismo dia que lo publicaste lo lei

Tengo todavia alguna duda pendiente :P pero hasta el jueves no voy a
tener mucho tiempo

Muchisimas gracias por toda esa informacion. Asi es un placer, prometo
seguir esta conversacion y disculpas por no contestar antes

Saludos
email Siga el debate Respuesta Responder a este mensaje
Ads by Google
Help Hacer una pregunta AnteriorRespuesta Tengo una respuesta
Search Busqueda sugerida