content.xml - was sind das für (Index-) Tags?

gefragt 2019-08-27 15:36:08 +0200

Cheryll Gravatar-Bild

updated 2019-08-27 15:51:08 +0200

Ich habe mein odt-Format aufgetrennt und die content.xml angeshen. Ich finde extrem viele Tags da drin, unter anderem dieses, das sehr oft wiederholt wird (nur ein kleiner Ausschnitt). <text:alphabetical-index-mark text:string-value="Reg"/><text:alphabetical-index-mark text:string-value="Reg"/><text:alphabetical-index-mark text:string-value="Reg"/><text:alphabetical-index-mark text:string-value="Reg"/><text:alphabetical-index-mark text:string-value="Reg"/><text:alphabetical-index-mark text:string-value="Reg"/><text:alphabetical-index-mark text:string-value="Reg"/><text:alphabetical-index-mark text:string-value="Reg"/><text:alphabetical-index-mark text:string-value="Reg"/><text:alphabetical-index-mark text:string-value="Reg"/><text:alphabetical-index-mark text:string-value="Reg"/><text:alphabetical-index-mark text:string-value="Reg"/><text:alphabetical-index-mark text:string-value="Reg"/><text:alphabetical-index-mark text:string-value="Reg"/><text:alphabetical-index-mark text:string-value="Reg"/><text:alphabetical-index-mark text:string-value="Reg"/>

Da meine Datei mittlerwele 30 MB groß ist (viele Grafiken) bin ich natürlich daran interessiert, sie kleiner zu bekommen. Brauche ich dieses Index-Tag? Wenn nein, wie bekomme ich es weg? Es sind wohl in Summe tausende. Mit verscheidenden string-values. Ich habe ein Stichwortverzeichnis angelegt. Das ist aber so lange her, dass ich nicht mehr genau weiß, auf welchem Weg. Kann man das allenfalls auch wieder löschen? Wenn die Tags davon nicht weggehen, gibt es einen Makro, der Tags mit Joker löscht? danke!

Bearbeiten Tags ändern Melden schließen vereinen löschen

Kommentare

Doofe Frage - wurde diese Datei immer wieder zwischen .odt und .doc / .docx hin und her konvertiert? Aber wie auch immer, dieser pure Text, der zudem extrem oft wiederholt wird, macht in der Regel das Kraut nicht besonders fett, da er sehr gut komprimiert werden kann. Dein Problem dürften die Grafiken sein. Mit einem guten ZIP Programm kannst Du sehen, welche Bestandteile gut komprimiert sind und welche viele Platz belegen.

Opaque Gravatar-BildOpaque ( 2019-08-27 16:02:48 +0200 )Bearbeiten

Ich käme bei Deinem Problem nicht darauf, mir irgendwie die content.xml vor zu nehmen und dort ein paar Einträge zu löschen. So groß kann diese Datei doch gar nicht sein. Dein Problem liegt doch wohl in den Grafiken begründet, die viel zu groß sind. Schau einmal in das Unterverzeichnis "pictures" und dort nach eventuellen Ausreißern.

Nur zum Vergleich: Das Base-Handbuch mit über 600 Seiten und sehr vielen Screenshots, Inhalts- und Stichwortverzeichnis hat als *.odt-Datei einen Umfang von 16,6 MB. Wenn ich das al *.pdf-Datei erstellen lasse, dann werden daraus 12,7 MB. Die Auflösung der Grafiken wird hier herunter gesetzt. Die Ausreißer beim Handbuch sind schnell in dem Unterverzeichnis "pictures" aus zu machen: Das sind die Titelseite und die Rückseite, die zusammen 4,1 MB einnehmen.

RobertG Gravatar-BildRobertG ( 2019-08-27 16:08:53 +0200 )Bearbeiten

Danke für die Antwort. Die Grafiken sind schon optimiert, ich brauche sie leider in sehr hoher Auflösung.

Hast Du Vorschläge, wie ich diese Einträge wegbekommen? Es sind tausende, machen also das Kraut definitiv fett.

Cheryll Gravatar-BildCheryll ( 2019-08-27 17:37:26 +0200 )Bearbeiten

Ich habe mal grade eine Datei mit 100.000 Zeilen dieses oben beschriebenen Textes erzeugt und die komprimiert ... da kommen gezipped 37kB raus (als Text sind es 10.6 MB). Das ist für mich definitiv kein fettes Kraut. Aber um vorweg zu greifen: Nein - keine Ahnung woher das kommt und wie man es löschen kann (da habe ich zuwenig Ahnung von den Oasis Open Document XML Spezifikationen)

$unzip -lv 100.000ZeileIndexStrings.zip 
Archive:  100.000ZeileIndexStrings.zip
 Length   Method    Size  Cmpr    Date    Time   CRC-32   Name
--------  ------  ------- ---- ---------- ----- --------  ----
11100000  Defl:X    37739 100% 2019-08-27 17:45 ea5106d4  100.000ZeileIndexStrings.txt
--------          -------  ---                            -------
11100000            37739 100%                            1 file
Opaque Gravatar-BildOpaque ( 2019-08-27 17:48:21 +0200 )Bearbeiten

Danke für Deine Mühe! Das ist definitiv interessant, dass das nur so wenig ist. Bin ganz überrascht.

Cheryll Gravatar-BildCheryll ( 2019-08-27 18:12:53 +0200 )Bearbeiten

Tja - wer nicht glauben will braucht Fakten ;-)

Opaque Gravatar-BildOpaque ( 2019-08-27 18:16:12 +0200 )Bearbeiten

Was bringen Dir Grafiken in sehr hoher Auflösung? Willst Du das Dokument nachher in Großformat drucken?

Dann würde ich doch zu der Methode greifen, die früher im Angesicht von Speichermangel auf den Festplatten häufiger von mir genutzt wurde: Grafiken nicht einbetten sondern als Link einfügen.

RobertG Gravatar-BildRobertG ( 2019-08-27 21:06:16 +0200 )Bearbeiten