Distiguir entre archivos de texto y binarios...

06/04/2007 - 16:00 por Anibal | Informe spam
Hola,
Como puedo hacer para al tratar de leer un archivo de texto simple, saber si
el archivo seleccionado es realmente un archivo de texto o es binario?
 

Leer las respuestas

#1 Octavio Hernandez
07/04/2007 - 13:01 | Informe spam
En general no es una tarea fácil... Sí está claro q no queda otra que
analizar los primeros bytes del fichero (1000, 2000, según creas).
He visto por ahí que el comando 'diff' de Unix mira si en esos primeros
bytes hay algún caracter nulo; en caso afirmativo, el fichero es binario.
Eso solo podría valer para ficheros almacenados a un byte por carácter. Pero
un fichero de texto también puede estar codificado con Unicode u otro
sistema, y en ese caso habrá muchos bytes nulos dentro...
Si pruebas con el Notepad, verás q un fichero de texto Unicode se guarda con
un prefijo de dos bytes FF FE al principio; los ficheros "normales" (un byte
por carácter) no tienen ese prefijo.
Yo revisaría el contenido guiándome por esos criterios y buscando caracteres
"raros"...

Slds - Octavio


"Anibal" escribió en el mensaje
news:
Hola,
Como puedo hacer para al tratar de leer un archivo de texto simple, saber
si el archivo seleccionado es realmente un archivo de texto o es binario?

Preguntas similares