Unicode Zeichen und HTML-Import

Gibt es eine Liste an Zeichen, die bei einem HTML-Import in Writer nicht auf den Font abgebildet werden, der es sein sollte?

Bisher klappt bei mir unter anderem nicht:

caron 711 “ˇ”
notequal 8800 “≠”
perthousand 8240 “‰”
quotedblleft 8220 ““”
trademark 8482 “™”

Das funktioniert beim Einlesen der HTML-Datei nicht und auch nicht, wenn ich sie aus dem HTML-Browser kopiere und einfüge. Die Fonts, die es sein sollen, funktionieren - auch mit Libreoffice. HTML-Browser zeigen es richtig an und man kann den Font auch per Hand auswählen und zuweisen. Die Zeichen sehen so aus, als ob LibreOffice da im Hintergrund irgendwelche Sachen mit anstellt. Darum meine Frage:

Gibt es eine Liste mit Zeichen, die bei HTML-Import nicht (sicher) den Font übernehmen, der vorgesehen ist?

Kannst Du so eine HTML-Seite mit diesen Codes zur Verfügung stellen? Wenn ich das einfach hier aus dem Browser heraus kopiere habe ich kein Problem, genau diese Zeichen auch im Writer zu Gesicht zu bekommen.

Mein System: OpenSUSE 15.3 64bit rpm Linux, LO 7.4.3.2

Das ist eigentlich nicht mein Thema, aber hast Du es schon mal mit den Einstellungen getestet?

Menü Extras>Optionen>LibreOffice>Schriftarten.

Ja, aber ich brauche erst nochmal eine Testumgebung, weil ich das in meinen Sachen gefixt habe.
Grundlegend sehen die Dateien aber so aus:

<html>
<body>
<font face="RamseSd">
caron 711 “ˇ”
notequal 8800 “≠”
perthousand 8240 “‰”
quotedblleft 8220 ““”
trademark 8482 “™”
</font>
</body>
</html>

RamseSd ist ein “Spezialfont”, der Hieroglyphen enthält. Der wurde mit Fontforge erzeugt und funktioniert auch in Libreoffice, wenn man die Fonts händisch zuweist.
Kann es sein dass, <font face=""> da speziell ist?
Ich baue mal eine Minimalversion für den aufgetretenen Fehler.

  <html>
  <body>
  <font face="RamseSd">
  caron 711 “ˇ”
  notequal 8800 “≠”
  perthousand 8240 “‰”
  quotedblleft 8220 ““”
  trademark 8482 “™”
  </font>
  </body>
  </html>

Ich habe daraus eine html-Datei gemacht. Die dann mit Firefox aufgerufen. Den Inhalt kann ich problemlos in den Writer übertragen.

Dann habe ich die Datei direkt über LibreOffice aufgerufen. Da wird dann die Webansicht des Writer geöffnet. Auch hier ist der Inhalt einwandfrei.

Natürlich habe ich diesen speziellen Font nicht installiert …

Ich habe etwas unter http://helmwo.bplaced.net/LibreO-test.zip bereit gestellt. Die Fonts müsste man installieren. Screenshots kann ich auch machen - aber eigentlich sollte einfach das Öffnen der HTML-Datei den Fehler sichtbar machen.

Da kommt bei dem Versuch eines Downloads zuerst die Risikomeldung wegen des Zertifikats und dann eine 404er-Fehler. Warum hängst Du die Datei hier nicht an? Kann natürlich sein, dass diese Funktion am Anfang nicht direkt zur Verfügung steht.

Also das ist eine ZIP-Datei. Vllt. in der Browserzeile https zu http editieren. Da sind die Fonts drin, die es dazu braucht. Eine Office-Datei alleine funktioniert nicht.

Writer_direkt
So sieht das bei mir im Writer aus, wenn ich direkt die Datei öffne. In der 2. Zeile macht Firefox da einen Unterschied, ansonsten ist das Bild aber dort gleich.
Angezeigt werden im Writer auch nur RamseSb, …c, …d und …e. 4 Schriftsorten kann ich nicht erkennen, da statt des Schriftnamens entsprechende Zeichen auftauchen.

Hauptfehler ist in der zweiten Zeile von deiner Ausgabe. Am Anfang gleich das “notequal”-Zeichen.
Transfet ist im Grunde alles was etwas fetter ist (Umschrift/Transcription). Das funktioniert im Beispiel - im kompletten Dokument aber auch nicht immer (perthousand-Zeichen z.B. - sollte ein ungedrehtes “e” sein).

In der 2. Zeile erkennt LibreOffice bei mir keine Schriftart und nimmt die Standardvariante, hier DejaVu Sans. Wie sieht denn bei Dir die Anzeige in den auszuwählenden Schriftarten aus?

Also ich bekomme auch Standard-Schrift - in dem Fall LibreSans oder so. Da wird beim Import komplett der Font aus der HTML entfernt.

Bei der Anzeige unterscheiden sich manche Schriften - die einen haben einen Namen davor, die anderen werden in Glyphen dargestellt.
Da habe ich schon drüber gegrübelt, kann in der TTF aber keinen Parameter finden, der dazu führen würde. Die TTFs sind mit FontForge gemacht und sollten ziemlich gut sein - ich kenne mich auch ein wenig damit aus. Also ich bin ratlos und für mich ist das Verhalten von LibreOffice überhaupt nicht erklärbar.