Martin Τrautmann
2010-10-28 09:11:31 UTC
Hallo,
gibt es bekannte Probleme und Lösungen bei copy/paste von Texten mit
Umlauten?
Ich habe hier immer wieder mal PDFs, wo die Umlaute patzen.
Beispiele:
AnschlÄsse statt Anschlüsse
ÇuÖere statt äußere
BlÅcke statt Blöcke
Im Text wird alles richtig angezeigt. Aber schon die Suche nach dem Wort
funktioniert nicht.
Von daher funktioniert auch kein pdftotext (aus dem xpdf-Paket), egal ob
mit -enc Latin1 oder -enc UTF-8
Was im PDF drin steht weiss ich nicht - es ist PDF 1.7, text als stream
/Creator (vspdflib \(www.visagesoft.com\))
Es findet sich z.B.
/Encoding /MacRomanEncoding
... allerdings arbeite ich hier auf dem Mac und sollte dann eigentlich
eher weniger Probleme damit haben.
Schönen Gruß
Martin
gibt es bekannte Probleme und Lösungen bei copy/paste von Texten mit
Umlauten?
Ich habe hier immer wieder mal PDFs, wo die Umlaute patzen.
Beispiele:
AnschlÄsse statt Anschlüsse
ÇuÖere statt äußere
BlÅcke statt Blöcke
Im Text wird alles richtig angezeigt. Aber schon die Suche nach dem Wort
funktioniert nicht.
Von daher funktioniert auch kein pdftotext (aus dem xpdf-Paket), egal ob
mit -enc Latin1 oder -enc UTF-8
Was im PDF drin steht weiss ich nicht - es ist PDF 1.7, text als stream
/Creator (vspdflib \(www.visagesoft.com\))
Es findet sich z.B.
/Encoding /MacRomanEncoding
... allerdings arbeite ich hier auf dem Mac und sollte dann eigentlich
eher weniger Probleme damit haben.
Schönen Gruß
Martin