In Draw wird die Schrift bei Import überlagert

Hallo community, beim öffnen eines PDFs ist die Schrift überlagert, also doppelt in unterschiedlichen Schriftarten. Wo kann ich da Einstellungen vornehmen?

Edgar

Du kannst eine Musterdatei hier hochladen, damit es sich jemand anschauen und untersuchen kann.


Und bitte ändere oben den Tag “Base” in “Draw”. Ich nehme mal an, dass es nichts mit Base zu tun hat. Danke.


Und beschreibe bitte noch, was du genau mit der PDF machen möchtest.

1 Like

Die Frage wäre aus meiner Sicht, wie die PDF gewonnen wurde. Wurde sie z. B. per OCR aus einem Bild erzeugt? Dann könnte es vorkommen, dass sich Bild und Text als “Dubletten” in unterschiedlichen Ebenen befinden (Abhilfe: Bild löschen).
Sonst kann es auch Schwierigkeiten geben bei der Schriftartenersetzung (also wenn das PDF die Schriften nicht oder nicht komplett enthält wie bei PDF/A)…
Eine generelle Regel wird es nicht geben. Man kann vesuchen die PDF-Datei mit einem anderen Editor zu bearbeiten (z. B. masterPDF oder Inkscape) oder evtl. als Bild weiter zu bearbeiten (Import mit GIMP).

Eine Hilfe wäre es, Betriebssystem und LO-Version zu nennen und - wie schon geschrieben - die Datei hochzuladen. - Ciao

Hallo,
herzlichen Dank für die Antwort.

SDas Dokument wird auf einem Cannon TS 600 als Dokument eingescannt und in draw weiterverarbeitet und ausgefüllt. die überdeckende Schrit lässt sich wortfürwort löschen, was ssbsolut lästig ist.
WIn 10 22H2
Edgar

Was macht denn der Scanner daraus? Über das entsprechende Programm ein Dokument mit Texterkennung, so dass der Text als zusammenhängender Text vorliegt?
So ein Scan, hier hochgeladen, wäre sinnvoll. Bitte nur das Direktergebnis des Scanners, nicht irgendwas, was anderswo noch umgewandelt wird. Denn das ist doch das, mit dem Du LibreOffice fütterst.

Wenn die Schriftart zu groß ist: Das hatten wir gerade in einem anderen Thread. Die kann in Draw in der Formatvorlage “Standard” entsprechend eingestellt werden.

@RobertG
ich fürchte OP erzeugt vom Scanner eine PDF.

JA, das ist so. im Anhang die Datei

Vistenkarte Signatur.jpg

IMG_20240310_0001.pdf (502 KB)

Deine PDF wird bei mir in Draw ganz normal dargestellt:


Version: 24.2.1.2 (X86_64) / LibreOffice Community
Build ID: db4def46b0453cc22e2d0305797cf981b68ef5ac
CPU threads: 8; OS: Windows 10.0 Build 19045; UI render: Skia/Raster; VCL: win
Locale: de-DE (de_DE); UI: de-DE
Calc: CL threaded

@Hrbrgr : Schau einmal genauer hin. Das ist deutlicher zu sehen bei dem Wort “Beschäftigung”. Die PDF-Datei enthält neben dem einfachen Bild auch noch die daraus abgeleiteten Schriftzeichen. Wenn ich das Bild wegziehe und die Schrift einheitlich auf 10 pt stelle, dann sieht das so aus:


Die Scannersoftware hat also ein Texterkennungsprogramm mit dabei und lagert den erkannten Text in den Hintergrund. Durch so etwas wie zusätzliche Schriftzeichen im Hintergrund des Bildes wird so eine Software natürlich an ihre Grenzen stoßen. Das ist dann vor allem in der Mitte des Screenshots zu sehen.

@RobertG
Ja, du hast recht, mit Brille wäre das nicht passiert. :sunglasses:
Aber ich denke so etwas sollte sich doch am Scanner einstellen lassen, ob Bild oder Text.


@bioede
Wie oft benötigst du denn das Formular?
Wenn es oft benötigt wird, wäre es sinnvoll nur Text einzuscannen und im Writer dann eine saubere Formularvorlage zu erzeugen.
Wie ist das mit dem Ausfüllen, geschieht das dann von Hand oder am PC (Formularmanagement)?

Das Blöde ist ja auch bei so einem Scan eines Formulars: Durch die unregelmäßige Postionierung schafft es die Scansoftware nicht, daraus mittels OCR einen zusammenhängenden Text aus zu lesen. Ich finde spontan nur ganz unten mit “war versichert” zwei Worte zusammen in einer Textbox. Bei der 2. Zeile hingegen fallen schon öfter einzelne Buchstaben in separate Boxen.
Wenn das Formular zum Ausfüllen gebraucht wird: Text im Hintergrund löschen und direkt über dem Bild mit Textfeldern arbeiten.
Wenn das Formular häufiger benötigt wird: Neu erstellen und Formularfelder einbauen.

Eigentlich habe ich keine Lust an einem System rumzubasteln. Libreoffice ist zwar kostenlos, dennoch erwarte ich dass es funktioniert.

Vistenkarte Signatur.jpg

Ich hatte dir doch in meinem Post geschrieben:
“Die Frage wäre aus meiner Sicht, wie die PDF gewonnen wurde. Wurde sie z. B. per OCR aus einem Bild erzeugt? Dann könnte es vorkommen, dass sich Bild und Text als “Dubletten” in unterschiedlichen Ebenen befinden (Abhilfe: Bild löschen).”
Genau das traf jetzt ein. Dein Scanner hat ein Endprodukt erzeugt, das äußerst problematisch ist. Ich habe deine PDF-Datei mal im Browser angesehen und nur den Text markiert. Du wirst sehen, dass das sehr unvollständig ist und auch noch einige Artefakte vorhanden sind. Da kann jetzt LibreOffice nichts dafür, sondern deine grandiose Scannersoftware. - Ciao
.

@bioede : Der Fehler liegt in Deinem PDF-Dokument, das eben nicht nur ein Bild sondern auch noch irgendwo hinterlegt Text enthält. Bringe der Scannersoftware ein korrektes Verhalten bei und beschwere Dich nicht darüber, dass LibreOffice den Text entdeckt und auch brav anzeigen will.

Fehlerfreie Software gibt es nicht - weder bei Canon noch bei LibreOffice. Aber dieser Fehler geht nicht auf das Konto des Importfilters von LibreOffice.

1 Like

Danke für die Antwort

Mit freundlichen Grüßen Edgar K. Rieflin

Danke für die Antwort, werde mal einen anderen Scanner suchen

Mit freundlichen Grüßen Edgar K. Rieflin

@bioede : Da ist doch kein anderer Scanner nötig. Das, was dahinter steckt, ist, dass die Scannersoftware im PDF-Modus versucht auch Buchstaben/Text zu erkennen, damit z.B. PDF-Dateien durchsucht werden können. Speichere stattdessen als *.jpg-Datei ab oder verschiebe einfach das Bild in Draw, so dass Du den Text löschen kannst. Dann funktioniert doch alles.

Hier mal das reine Bild als PNG Datei, zur weiteren Verwendung:



Und hier eine Writer Datei von mir gestaltet, ohne Formularfelder:

103242 HB Schaffner Personalbogen - Rohvorlage.odt (594,0 KB)


Benutzen von Formularen in Writer

Ein ausfüllbares Formular erstellen in Writer

Meine Empfehlung: Eingabefelder