PDF in Libreoffice bearbeiten

Hallo,
ich möchte eine umfangreiche englischsprachige PDF mit LO bearbeiten: Den Text ausschneiden, übersetzten und dann in Deutsch wieder einfügen. Derzeit kann ich den Text nur zeilenweise markieren und kopieren. Geht das auch Absatzweise? Das wäre schön.

Version: 7.5.9.2 (X86_64) / LibreOffice Community
Build ID: 50(Build:2)
CPU threads: 12; OS: Linux 6.1; UI render: default; VCL: gtk3
Locale: de-DE (de_DE.UTF-8); UI: de-DE
7.5.9-1
Calc: threaded

Hallo @Michi1 ,

nein, das geht leider nicht. PDFs werden normalerweise in Draw geöffnet. Es ist nur dazu gedacht Kleinigkeiten zu ändern. LibreOffice ist also kein PDF-Editor.


Workaround:
Versuche es vielleicht mal mit PDF24 oder anderen kostenlosen PDF-Editoren.

1 Like

Das ist ja schade und komisch, weil so viele Internet-Seiten LO genau dazu empfehlen.
Draw von LO kann einzelne Zeilen wunderbar markieren, kopieren oder ausschneiden. Weißt Du, was man machen muss, um alle Zeileninhalte eines Absatzes oder einer Seite gleichzeitig markiert und ausschneiden kann? Das wäre schon mal eine große Hilfe.

Was nicht geht, geht nicht.

Das ist ja schade und komisch, weil so viele Internet-Seiten LO genau dazu empfehlen.

Im Internet steht viel Unsinn, deshalb sollte man immer schauen an vertrauenswürdige Seiten zu kommen.


FAQ-Draw - Wie öffne ich eine PDF-Datei in Draw

Also, wenn das ein alter Hase sagt, dann muss ich es nicht bezweifeln, ganz gleich, wie schade ich es finde.
Ich danke Dir.

Folgendes geht zumindest für Absätze. Das ersetzt natürlich keinen Fließtext über mehrere Seiten:
Den Pfeil zu Auswahl der Textzeilen nutzen Auswahl → Form → Text konsolidieren.
Dann ist der zusammengefasste Text in einer gemeinsamen Textbox.

1 Like

Hallo Robert, das klingt super interessant. Doch: Text konsolidieren ist bei mir nur ausgegraut.
Habe das PDF Dokument als odg gespeichert, jetzt geht’s.
Strg+A > Form > Text konsolidieren.
Jetzt verlässt er seine gewohnte Form und ich kann ihn kopieren, bzw. ausschneiden und ersetzen.

Übersetze den Text in ein mit Absatzvorlagen sauber formatiertes Writer-Dokument.

Hallo Villeroy,
genau das möchte ich machen. Doch wenn ich in einer PDF alles markiere und dann in Writer kopiere, erhalte ich ausschließlich den Text, die Bilder bleiben weg.
Weißt Du, wie man das richtig macht?

Aus meinem PDF-Reader kann man Bilder per Rechtsklick in Dateien extrahieren oder in die Zwischenablage übernehmen. Ich kann auch Bilder aus einem PDF in ein Dokument ziehen (wusste ich bis eben gar nicht).

LibreOffice ist eines der wenigen kostenlosen Programme, mit denen man PDFs editieren kann. Prinzipbedingt eignet es sich eher für “kleinere” Änderungen, weil Du in der Graphik-Komponente arbeiten musst.
.
Prinzipbedingt deshalb, weil PDF nicht als bearbeitbares Format geschaffen wurde, sondern für den Transport und Austausch von Druckdaten. Wenn man reinschaut ist es eine Programmiersprache (auf Postscript-Basis) für graphische Objekte, die durchaus auch Buchstaben sein können.
.
Es ist nicht einmal gesagt, dass ein PDF erkennbare Buchstaben enthält. Sowohl gescannte Rastergraphik, wie auch graphische Pfade sind möglich, aber erkennbar Buchstaben aus einer bekannten Schriftart sind halt eine effektive Speicherung und deshalb ift erkennbar. Das Konzept von Wörtern, Zeilen und Absätzen muss ein pdf-Reader aber eventuell erst durch Abstanderkennung zum Rest neu erzeugen.
.
Für Dich wichtiger ist die Frage, ob Du einen PDF-Editor brauchst, also direkt im pdf ändern willst. Wenn ja bei Softmaker findet sich so etwas recht günstig unter dem Namen FlexiPDF. Normalerweise empfehle ich aber eher den Export in eine Textverarbeitung wie Writer. Dann brauchst Du nur einen pdf-Reader.

PDF-Reader sind durchaus verschieden in dem, was sie anbieten. Probier im Zweifelsfall mehrere durch. Bisher wissen wir ja nur, dass Du unter irgendeinem Linux 6.1 arbeitest.
.
Je nach Reader und erzeugter Datei wird sich das Ergebnis unterscheiden. Du kannst auch mal nach pdf2txt-Konvertern suchen. (Fur etwas wie Dein Projekt würde ich versuchen den Text zu extrahieren, das durch DeepL oder einen anderen Übersetzer schicken und dann an einem grossen Monitor neben dem Original korrigieren.
.
PS: Die urheberrechtlichen Fragen lasse ich hier mal aussen vor. Spätestens beim Kopieren der Fotos solltest Du aber mal über die Rechtsgrundlage nachdenken.

Du setzt voraus, dass das PDF ursprünglich mal ein Fließtext war, der in irgendeinem Word-ähnlichen Programm erstellt wurde. Im PDF ist aber keinerlei Information über das ursprüngliche Dateiformat vorhanden. Im PDF sind überwiegend Daten enthalten, die für einen Ausdruck auf Papier wichtig sind. Jedes Desktop-Programm, das auf Papierseiten drucken kann, kann auch detailgetreu PDF-Dateien erzeugen, notfalls über einen virtuellen PDF-Drucker, an den das jeweilige Programm seine Druckdaten sendet. Diejenige LibreOffice-Komponente, die mit Druckseiten aus Fließtext, Pixelgrafik und Vektorgrafik aus allen möglichen Programmen zurecht kommt ist Draw. Ein PDF in einen Word-Processor zu laden ist etwa so, wie gestreifte Zahnpasta zurück in die Tube zu quetschen und dabei die Streifen zu behalten.

Der ist jetzt gut!
.
Der Vollständigkeit halber sollte man ergänzen, dass das Auslesen von strukturierten Texten aus PDFs durchaus möglich ist. Unter Windows würde ich jedenfalls als erstes www.pdf24.org lokal benutzen (läuft leider nicht unter Linux). Oder halt online. Es gibt ein paar Online-Dienste, die als Exportziel DOC oder DOCX angeben, das kommt manchmal einem ordentlichen Ergebnis nahe; vorausgesetzt, es handelt sich um keine sensiblen Daten.
.
Beste Ergebnisse (Text und Bilder kombiniert) konnte ich bisher mit Abbyy Finereader und IRIS erzielen. Das sind jedoch Bezahlprogramme (unter Windows). …

Und diese Unschärfe erwartet man normalerweise nicht von Software. Im PDF ist soviel Information des ursprünglichen Programmes eben nicht mehr vorhanden, dass es eine Software braucht, die anhand der “hingemalten” Anordnung von Linien und Zeichen auf Druckseiten Rückschlüsse auf die Struktur eines Dokumentes zieht. Was macht so ein PDF-Texter, wenn man ihn mit dem PDF-Output einer CAD/CAM-Anwendung füttert?
Wahrscheinlich wird KI hier wirklich etwas leisten können, aber ein 90iger-Jahre Programm wie LO hat keinerlei Mittel, so etwas zu leisten, außer eben Zeichen und Linien in eine Vektorgrafik zu importieren (immerhin!).

Alles ein wenig komplizierter, als man denkt. Am Computer geht doch alles - vor allem, wenn man weiß, wie.
Meine vorläufige Lösung:
Online bei PDF 24 in ein docx konvertiert und das dann mit Wirter als odt bearbeiten. Leider ist hier der Text auch nicht immer blockweise markierbar, aber immerhin nicht zeilenweise.
Urheberrecht? Vielleicht ein Thema. Es geht hier um die frei herunterladbare Datei: “LensCulture_Portrait_Guide_2023.pdf” die ist in Englisch und ich möchte sie mir übersetzten, um sie so besser genießen zu können. Hoffe sehr, dass es da keine Probleme gibt, ich verteile sie ja nicht weiter und verkaufe sie ja nicht.

Man setze dazu das Programm ACROBAT von ADOBE ein! Nicht umsonst hat es einen hohen Preis. Damit lassen sich originale PDFs „fälschen“. Es kann jedoch nur zeilenweise schreiben, kennt keine Absatz, kann also nicht umbrechen.


Ist allerdings das pdf-Dokument von LO aus als „Hybrid-PDF (eingebettete ODF-Datei)“ exportiert, so lässt sie sich zurück transputieren nach CALC bzw. WRiTER .

Hallo @koyotak,
ja, es ist frustrierend, wie zäh und schwer es ist, eine PDF zu bearbeiten. Aber, wenn ich akzeptiere, dass genau das der Sinn einer PDF ist, dann habe ich auch Frieden damit.
Ich habe die PDF bei PDF 24 online in eine odp konvertiert und bearbeite das Dokument dann mit Impress. Das geht recht gut, als wenn ich in odt umwandle und dann mit Writer bearbeite.

Hallo @Michi1
Diese PDFs!? Manche lassen sich nicht einmal die Buchstaben und Ziffern kopieren, sie erscheinen nur als Leerzeichen. Manche lassen sich prima kopieren – besonders mit einem APPEL-Gerät.
Andererseits gibts Text-Erkennungs-Programme, die Text ziemlich gut aus einem Foto extrahieren können, egal ob PDF-Foto oder PDF-Text. Ich mache das mit meinem ANDROiD-SmartPhone + OCR-App „TextFairy“ beispielsweise nicht nur in deutsch, sondern in anderen Sprachen. Hinweisschilder, Zeitungs-Artikel, gescannte Dokumentationen abtippen, das war einmal! Erkennt Absätze, nicht jedoch fette Titel.