質問する
0

1点つじ・2点つじ(辻)の出し分けができない。

質問日 2016-05-18 10:36:59 +0200

j-horiba のGravatar画像

updated 2017-03-23 01:47:16 +0200

Windows8.1(64bit)のExcel2013で作成したファイル(xlsx形式)に特定の文字列を入力して保存し、

以下のsofficeコマンドで変換すると同じ文字として認識されます。

別々の文字として出しわけすることはできないのでしょうか?

sudo /usr/bin/ooffice --display :0 --headless --nofirststartwizard --convert-to pdf --outdir /tmp /tmp/test.xlsx https://help.libreoffice.org/Common/S...

環境:

・ファイル作成環境:Windows8.1(64bit)Excel2013

・エクセルのセル書式:IPAmj明朝

・検証文字:1点つじ・2点つじ(辻) のしんにょうの点が1つと2つのもの

・ファイル変換環境:CentOS 6.5(Final) 64bit Libreoffice 4.2.8.2 420(Build:2)

edit retag flag offensive close merge delete

3 Answer

0

回答日 2017-11-20 00:02:12 +0200

himajin100000 のGravatar画像

updated 2017-11-20 00:02:57 +0200

Excel 2016とCalc nightlyで検証。

そもそもExcelでもCalcでもIPAmj明朝では、二点しんにょうになった。IPAex明朝の場合、GUI上からPDFにエクスポートしたらちゃんと別表示になっている。(コマンドラインは失敗したわけではなく、単純に面倒だから未検証なだけ)

Version: 6.0.0.0.alpha1+ (x64)
Build ID: 6d24213d55df33c7bb5f10d511dcfc82b745db38
CPU threads: 4; OS: Windows 10.0; UI render: default;
TinderBox: Win-x86_64@42, Branch:master, Time: 2017-11-18_04:09:43
Locale: en-US (ja_JP); Calc: CL

edit flag offensive delete link もっと
0

回答日 2017-11-30 07:50:31 +0200

hibagonsan のGravatar画像

結論:IPAmj明朝フォントが、この、「辻」、「辻󠄀」 の違いに対応していないから。

コマンドラインは試していません、Calcに直接2つの文字を入力し、フォントを比較し、PDF出力比較をしました。 LbreOffice calc 6.0.0BETA1 windows86用 windows10環境で試してみました。 Microsoft IMEの機種依存入力設定で「辻󠄀」を入力しました。

<IPAmj明朝> Calcに直接2つの異体字を入力して、文字フォントをIPAmj明朝に指定すると、どちらも「辻」と表示されます。 Calcから直接PDF変換し、Acrobat reader DCで表示すると、どちらの文字も「辻」と表示されました。

<IPAexゴシック、IPAex明朝> Calcに直接2種の文字を入力して、IPAexゴシック、あるいはIPAex明朝に指定すると、「辻」と「辻󠄀」に別々に表示されます。 Calcから直接PDF変換し、Acrobat reader DCで表示すると、別々に表示されました。

<Calc内に入力した2つの文字のフォントを変えて、私のPCでこの異体字の違いを表示できたフォント> Meiryo UI、Noto sans cjk jp (いろいろな大きさのフォント含む)、Takao Ex ゴシック、Takao Ex 明朝、Yu Gothic UI(いろいろな大きさのフォントを含む)、メイリオ、游 ゴシック(いろいろな大きさのフォントを含む)、花園明朝A、MSゴシック、MSPゴシック、MS明朝、MSP明朝(MSはWindows10付属のもの)

IPAフォントの中でも、IPAゴシック、IPAPゴシック、IPA明朝、IPAp明朝は、2つの文字の違いがCalcでは表示できなかったので注意が必要です。

edit flag offensive delete link もっと

Comments

1

エクセルのサンプルが無いので原因ははっきりとはわかりません。 IPAmj明朝で入力された「辻󠄀」のUnicode+異体字セレクタが実際は何だったのかによっても変換動作が異なると思われます。

試しにPythonで「辻」に該当するUnicodeの異体字を5種類作成してCalcに張り付けて、3種類のフォントで修飾してxslx形式で保存しました。その後、Windows10(86)のコマンドラインからsoffice変換してみました。 IPAmj明朝で作成されたxslxファイルもそのままにPDF変換されて「辻󠄀」をPDF出力することができました。

ここで注意していただきたいのは、「辻󠄀」の文字について、MS明朝、IPAex明朝とIPAmj明朝では異体字セレクタの位置が異なっていたということです。同じフォントで、同じUnicode+異体字セレクタであればPDFも同じに出力されると思います。

MS明朝、IPAmj明朝では、「辻󠄀」は、u8FBB+UE0100に割り当てられていた。 IPAmj明朝では、「辻󠄀」は、u8FBB+UE0102に割り当てられていた。

hibagonsan のGravatar画像hibagonsan ( 2017-12-15 09:11:02 +0200 )edit

今さっき知った。「IVDとコレクション」以下メモ。
http://mojikiban.ipa.go.jp/1292.html
「IPAexフォントとIPAmj明朝フォントにおけるコレクション 」より

その際、IPAexフォントではAdobe-Japan1のコレクションを採用しています。(略) 一方、IPAmj明朝は、汎用電子情報交換環境整備プログラムの成果を引き継いだ、行政実務における人名の記載を主な目的としたフォントであり、IVSの実装に当たってはHanyo-Denshiコレクションの2010年11月14日版を採用しています

himajin100000 のGravatar画像himajin100000 ( 2018-01-07 09:17:14 +0200 )edit
0

回答日 2016-05-25 04:21:35 +0200

Piedpiper のGravatar画像

古いJISが一点しんにょうで、新しいJISが二点しんにょうなので、仕方がないといえば仕方がない。 手段としては 1.機種依存文字を用いる http://answers.microsoft.com/ja-jp/wi...

2.一点しんにょうの時はフォントをかえる

そもそも一点だろうが二点だろうが、同じ部首、こだわる方がおかしいと思うが、こだわりたい人が多いんだよね。 特に固有名詞だと。

edit flag offensive delete link もっと
ログイン/サインアップして回答する

質問ツール

2 followers

Stats

Asked: 2016-05-18 10:36:59 +0200

Seen: 5,721 times

Last updated: Nov 30 '17