Tengo un documento en formato PDF. La mayor parte del texto se puede
copiar en el portapapeles de Windows con el lector Acrobat Reader, pero hay
partes, las que más me interesan pues contienen trozos de código fuente que
quiero copiar al portapapeles, que no deben estar codificadas en ningún
formato estandar pues me encuentro con que lo que en el texto del pdf es
p.ej. una "a", cuando lo convierto a decimal con el código que vereis
despues, en unas partes del documento es 2, 6, 8, 12 ... cuando lo normal es
que sea "a" = 97.
Con los trozos de texto que se pueden copiar y pegar sin errores me cuadra a
la perfección la
codificación a = 97, b= 98, A = 65, B = 66, etc.
No le veo relación secuencial alguna a los caracteres, en unas zonas del pdf
sucede:
a = 6, b = 38, c = 28, d = 25, e = 8, f = 39, g = 7
en otras: a = 9, b, c= 30...
¿Cual es la explicación a esto? ¿Codificación no estandar en esas zonas?
private void button1_Click(object sender, EventArgs e)
{
string TextoEnPortapapeles = Clipboard.GetText();
char[] ArrayBytes = TextoEnPortapapeles.ToCharArray();
foreach (byte bb in ArrayBytes)
{
//Convierte cada byte del ArrayBytes en su representación decimal
this.richTextBox1.Text += "" + bb.ToString();
}
}
RAlvare.
Lugones.Asturias.
Leer las respuestas