|
|
メタ定義文字の変換
メタ定義一覧
殆どのテキスト入力のエリアで、メタ定義文字の変換をサポートしています。
これはキーボードから直接入力できない文字の記述をサポートする機能で、
[..A]
といったメタ定義文字を、
Ä
といった文字に変換します。
☞Point 直感的に書いて、全体を [ ] で囲むだけ!
メタ定義文字の変換機能が利用可能なテキスト入力エリアであるかどうかは、
そのエリアをマウスで右クリックすればわかります。
右クリックでポップアップしたメニューに、「メタ定義文字の変換」が含まれている場合は、
そのエリアでメタ定義文字の変換を行うことができます。
入力エリアで、変換したい範囲の文字列を選択状態にし、右クリックでメニューを表示すると、
「メタ定義文字の変換」が選択可能になります。
下記のFig.1が変換前、Fig.2が変換後の例です。
Fig.1: 選択範囲に含まれるメタ定義文字を変換します
Fig.2: Fig.1のメタ定義文字列が変換されています
メールで使用する部分
(メールの件名や本文、発信者名、宛先の名前、など)
にメタ定義文字から変換した文字が含まれる場合は、
charsetを正しく設定するように注意する必要があります。
日本語と英語が混在するだけの場合は、初期値の
ISO-2022-JP(日本語)
から変更する必要はありませんが、
それに加えて、英語で使用しない文字(Äのようなドイツ語文字など)も混在するような文章の場合は、
UTF-8(Unicode)
を選択する必要があります。
例
「Diamanten på marssnön」
→ ISO-8859-1(Latin1)を選択
「Diamanten på marssnön (3月の雪の上のダイヤモンド)」
→ UTF-8(Unicode)を選択
「3月の雪の上のダイヤモンド」
→ ISO-2022-JP(日本語)を選択
|
UTF-8を選択すると、あらゆる言語の文字を混在させて使用することができます。
ただし、ごく一部のメーラーでUTF-8をサポートしていない場合もあり、
メールの受け側がそういったメーラーを使用していた場合は、
メールを正しく読むことができません。
その為なるべく、ISO-8859-1 や ISO-2022-JP といったcharsetを使用するようにします。
charsetを
ISO-2022-JP(日本語)
に設定したまま、ISO-2022-JPで表現できない文字を含めたい場合などは、その表現できない部分を
Base64エンコード
してください。
例えば
「Diamanten på marssnön (3月の雪の上のダイヤモンド)」
という正確なスペルによる表現が必要な場合は、
Diamanten på marssnön
の部分をBase64エンコードして
「=?ISO-8859-1?B?RGlhbWFudGVuIHDlIG1hcnNzbvZu?= (3月の雪の上のダイヤモンド)」
と表記します。
この場合、メールの受信側でBase64デコードする必要があります。
「プロセルピナ」の場合、Base64エンコード・デコードは、変換したい文字列を選択して、
マウスの右クリックから表示されるメニューから選ぶことで行えます。
メタ定義文字の表記方法
メタ定義文字は、覚えやすいように、また知らなくても推測して書けるように、
直感的でわかりやすい表記になっています。
例えば、Ë は [Ë] と書くのではなく、ただ単純に
[..E]
と書きます。
[Euml]
でも変換できるように登録されているので、
既に Ë として覚えていても混乱することはありません。
メタ定義文字は全て、各文字が
[ ]
に囲まれています。
この
[ ]
内側に、直感的な記号を組み合わせたものが入ります。
Ä の場合は [..A]
、
ä の場合は [..a]
、
å の場合は [oa]
、
Š の場合は [vS]
というように、上に載せる記号に類似したアルファベットを先に書き、
下にくるアルファベットを後に書くのが一般的な規則になっています。
Ǟ
の場合は、- と .. と A の三段重ねと解釈して、
[-..A]
と書きます。
同じように
ǡ
の場合は
[-.a] 、
Ǖ の場合は、
[-..U]
です。
注: このページの一部の文字はIE6などの古いブラウザでは正しく表示できない場合があります。
IE7、firefox 等では問題ありません。
メタ定義文字は、各文字が [ ] で囲まれたものになります。
文字列 "aoäö" は "ao[..a][..o]" と書いて変換します。
"ao[..a..o]" では変換できません。
複数候補
1つの文字に対し、複数のメタ定義が関連付けられている場合があります。
例えば、
[..u]
と書いてメタ定義変換した場合、
{ü(0x00FC)/ϋ(0x03CB)}
と変換されます。
これは
[..u]
から変換される文字に、
ü (Unicode: 0x00FC)
ϋ (Unicode: 0x03CB)
の2つがあることを示します。
目的の文字以外は、その場で消して使います。
使用しているフォント等の影響で、どちらが目的の文字かわからない場合は、
()内に併記されているUnicode値から判断します。
Unicode値に関する簡単な説明を表示したい場合は、View部メインフォームから、
SHIFT + F2 キー
を押してテキストフォームをメモ帳モードで開き、変換結果の
{ü(0x00FC)/ϋ(0x03CB)}
をコピーします。
テキストフォームのメニューから
「Edit」→「メタ定義文字」→「詳細表示」
を選択します。
この例の場合では、
0x00FC と 0x03CB のUnicode文字についての説明が表示されます。
【Tips】
処理的には、( ) 内に書かれた4桁のHEXコード値のみを参照にするので、変換結果をコピー&ペーストするのではなく、単に、
(0x00FC)(0x03CB)
と書いてもかまいません。
0x00FC, uuml // - ü - ü small u, dieresis or umlaut mark
0x00FC, ..u // - ü - ü small u, dieresis or umlaut mark
0x03CB, ..upsilon // - ϋ - GREEK SMALL LETTER upsilon WITH DIALYTIKA
0x03CB, ..u // - ϋ - GREEK SMALL LETTER upsilon WITH DIALYTIKA
テキストフォームのメニュー : 「Edit」→「メタ定義文字」→「詳細表示」
この例では、
ü の文字には [uuml] と [..u] の2つのメタ定義があり、
ϋ の文字にも [..upsilon] と [..u] の2つのメタ定義があることを示しています。
例えば、「ドボルジャーク、ヤナーチェク、マルティヌー」といったチェコ語の人名は、
DVO[vR]['A]K, JAN['A][vC]EK, MARTIN[oU]
と書いてから変換しますが、メタ定義を変換した結果は、
DVOŘ{Á(0x00C1)/Ά(0x0386)}K, JAN{Á(0x00C1)/Ά(0x0386)}ČEK, MARTINŮ
となり、
['A] について Á と Ά の2つの候補が表示されます。
上記で説明した手順で 0x00C1 と 0x0386 のUnicode値について詳細を表示すると、
Á(0x00C1) は「A acute」
、一方
Ά(0x0386) は「GREEK CAPITAL LETTER ALPHA WITH TONOS」
というギリシャ文字であることがわかります。
この場合はチェコ語なので「A acute」である Á の文字を残して、
DVOŘÁK, JANÁČEK, MARTINŮ
と編集します。
参考:
RFC1345 digraph
「プロセルピナ」のメタ定義文字に似たようなものに、「RFC1345 digraph」があります。
例えば Ă の文字はメタ定義文字では [uA] ですが、「RFC1345 digraph」では
A(
で表記します。
メタ定義文字が直感性を重点を置くのに対し、規則性に重点が置かれます。
[Tips]
後述するように、メタ定義文字の変換パターンはユーザーで編集可能です。
[A(] で Ă の文字に変換するように、メタ定義の変換パターンを独自に追加することもできます。
その他の規則
メタ定義のパターンは、視覚的印象から決められていますが、規則的な要素も含みます。
ウムラオトが必ず
..(ドット2つ) で表現されるのも
その規則的要素の1つです。
その他の代表的な規則を次に示します。
(1)
GRAVE (グレーヴ)
グレーヴ(grave accent)は常に
「前位置`」
で表現します。
例えば、À のメタ定義は [`A] になります。
È は、[`E] になります。
(2)
ACUTE、HORN
アキュート(acute accent)は、
「前位置' (アポストロフィ)」
で表現します。
例えば、Á のメタ定義は ['A] になります。
É は ['E] になります。
アキュートと似たものに、PRECEDED by APOSTROPHE があります。
この場合も、' で表現します。
['n] → ʼn
(Latin small letter n PRECEDED by APOSTROPHE, Unicode=0x0149)
['n] → ń
(Latin small letter n with ACUTE, Unicode=0x0144)
[補足]
メタ定義 ['n] には上記の2つ以外にもう1つ、
ή (GREEK SMALL LETTER eta WITH TONOS, Unicode=0x03AE)
への変換も関連付けられています。これは n ではなく、 eta という文字のヴァリエーションです。
「後位置' (アポストロフィ)」は、HORNを意味します。次のような例があります。
[O'] → Ơ (Latin CAPITAL LETTER O with HORN)
[U'] → Ư (Latin CAPITAL LETTER U with HORN)
「後位置' (アポストロフィ)」
はHORNの他に、一部のCARONを表現するのにも使用します (下記(6)を参照)。
(3)
ターン、インヴァート(上下逆)と リバース(鏡像)
「前位置 !」は、次の文字を上下逆さまに写像(インヴァート)にすることを意味します。
「前位置 @」は、次の文字を上下逆さまに回転(ターン)にすることを意味します。
写像(インヴァート)の場合、文字がハネる向き、カーブする向きには変化がありません。
回転(ターン)の場合は上下左右の全てが反対になります。
ʀ (LATIN LETTER SMALL CAPITAL R)は
[R]
のメタ定義から変換し、
ʁ (LATIN LETTER SMALL CAPITAL INVERTED R)は、
[!R]
のメタ定義から変換します。
ʔ (LATIN LETTER GLOTTAL STOP)
という文字は
[GLOT]
から変換します。この場合 GLOT で1文字を表すので、
ʖ (LATIN LETTER INVERTED GLOTTAL STOP)
という文字は、
[!GLOT]
で変換します。
ミクロ記号 µ は [micro] から変換しますが、小文字hを上下方向でインヴァートしたようにも見えるので
[!h]
と書いて変換することができます。
¡ という ! を逆さにした文字の場合は [!!] です。
ターンは、@記号を「くるくる回る渦巻き」に見立てて、この記号の次位置の文字を回転させる意味にして表現しています。
¿ という ? を逆さまにした文字のメタ定義は [@?] になります。
同じように、
Ɯ の場合は [@M] に、
ɯ は [@m] になります。
上下逆さに似たものに、左右反転(鏡像、リバース)があります。
こちらは「前位置 %」で表現します。%記号の / を鏡に見立てて、o が左右に写っている様子を意味させています。
[%e]で ɘ (Latin small letter REVERSED e)、
[%E]で Ǝ (Latin CAPITAL LETTER REVERSED E)
といった表記になります。
また、Ʒ (Latin CAPITAL LETTER EZH)
のメタ定義を [EZH] で表現していることから、
Ƹ (Latin CAPITAL LETTER EZH REVERSED)
を [%EZH] で、
ƹ (Latin small letter ezh REVERSED)
を [%ezh] で
表現します。
(4)
SLASH、BAR、MACRON
文字の上に重なるようにスラッシュが入る場合は、文字の前に / を書きます。
¢ の場合は [/c]、
Ø の場合は [/O]、
ð の場合は [/d] です。
文字の上に線が重なる場合でも、横棒の場合は文字の後ろに - (マイナス記号) を書きます。
例えば、Đ は [D-] と書きます。
文字の前に - を書く場合は、- が文字の上にある場合です。この場合、- の文字はMACRON記号を意味します。
例えば
Ū は [-U]、
Ā は [-A]
と書きます。
(5)
Circumflex accent
Circumflex accent(山傘記号)は
「前位置 ^」
で表現します。
Ê は [^E] に、
Û は [^U] に、
î は [^i] に、
なります。
(6)
CARONとBREVE
CARONは「前位置v」で、
BREVEは「前位置u」で表現します。
CARONとBREVEは、フォントが小さい場合は見分け難いことに注意してください。
BREVEは丸みを帯びていますが、CARONは鋭角的な記号です。
例えばBREVE文字の場合、
Ă (Latin CAPITAL LETTER A with BREVE)
は [uA] で、
ă (Latin small letter a with BREVE)
は [ua] で、
Ĕ (Latin CAPITAL LETTER E with BREVE)
は [uE] で
表現します。
CARON文字の場合、
Ě (Latin CAPITAL LETTER E with CARON)
は [vE] で、
č (Latin small letter C with CARON)
は [vc] で
表現します。
CARON文字は、「前位置v」で表現する他に、
「後位置' (アポストロフィ)」
で表現するものがあります。
「後位置' (アポストロフィ)」はHORN文字を表現するのにも使用しています
(上記(2)を参照)。
ď (Latin small letter D with CARON)
はCARON文字ですが、視覚的に
「dの後ろに ' がついている」
ように見えるので
[d']
と表現します。同じように、
[L'] → Ľ (Latin CAPITAL LETTER L with CARON)、
[l'] → ľ (Latin small letter L with CARON)、
[t'] → ť (Latin small letter T with CARON)
となります。
(7)
OGONEK、CEDILLA
OGONEKは、
「後位置 _ (アンダーバー)」
で表現します。
Į (Latin CAPITAL LETTER I with OGONEK) は、メタ定義で
[I_] と表現します。
OGONEKと逆向きにヒゲが伸びたような文字に、CEDILLAがあります。
CEDILLAは、
「後位置 , (カンマ)」
で表します。
例えば、
Ş (Latin CAPITAL LETTER S with CEDILLA) は、
[S,] で、
ņ (Latin small letter n with CEDILLA) は、
[n,] で
表現します。
HOOK文字は +記号 で表現しますが、文字の右下で伸びているHOOKは、特例としてOGONEKと同じように
「後位置 _ (アンダーバー)」で表現します。
Ʈ → メタ定義は [T_] ([T+]ではない)
Ȥ → メタ定義は [Z_] ([Z+]ではない) (LATIN CAPITAL LETTER Z with HOOK)
(8)
CEDILLAとCOMMA BELOW
|
CEDILLAと似たものに、COMMA BELOWがあります。COMMA BELOWもCEDILLAと同じように、
「後位置 , (カンマ)」
で表します。
例えば、
Ț (Latin CAPITAL LETTER T with COMMA BELOW) のメタ定義は、
[T,]
となります。
同じように、
Ș (Latin CAPITAL LETTER S with COMMA BELOW)
は
[S,]
、
ș (Latin small letter s with COMMA BELOW)
は
[s,]
というように、文字の後ろに
, (カンマ1つ)
を書いて表します。
Şという別の文字もありますが、これも
[S,] で表します。
|
(9)
フック
HOOKは +記号 で表します。HOOKの向きによって、先に書く場合と、後に書く場合があります。
Ƥ → メタ定義は [+P] (Latin CAPITAL LETTER P with HOOK)
Ƙ → メタ定義は [K+] (Latin CAPITAL LETTER K with HOOK)
Ƭ → メタ定義は [+T] (Latin CAPITAL LETTER T with HOOK)
ƭ → メタ定義は [t+] (Latin small letter t with HOOK)
_(アンダーバー)記号を使う場合があります。上記(7)を参照してください。
(10)
「後位置 #」で小文字を表す場合
(この規則は廃止されました)
ユニコード値からの変換
[u:0xXXXX]
または
[u:#DDDD]
の書式で表記して、変換してください。
16進数表現のユニコード値の場合、
[u:0xXXXX]
を使います。
XXXX の部分が文字をあらわすユニコード値です。
10進数表現のユニコード値の場合、
[u:#DDDD]
を使います。
DDDD の部分が文字をあらわすユニコード値です。
【例】
嫏
という
「女郎」と書いた2文字を1つにまとめたような漢字は、ユニコードで
5ACF
になるので、メタ定義文字変換では、
[u:0x5ACF]
と書いて変換します。
メタ定義文字の一覧
{{GTMAL_HOME}}\ctrl\MetaConvData.txt
メタ定義文字のカスタマイズ
{{GTMAL_HOME}}\ctrlフォルダにある
MetaConvData.txt
を編集することで、独自の変換パターンを追加することができます。
既存の変換パターンを編集したり削除することも可能です。
MetaConvData.txt は、変換パターンのソースファイルです。この、
MetaConvData.txt
の編集後に、同じフォルダにある
MetaConvData.bin
を削除し、View部を再起動してください。
View部は、起動したときに、メタ定義変換の辞書である
MetaConvData.bin
をチェックします。
これが存在しない場合は、
MetaConvData.txt
を読み込み、
MetaConvData.bin
を作成します。
MetaConvData.txt
は UTF-8 の文字コードが扱えるエディタで編集してください。その場合でも、表示できない文字がいくつか存在する場合があります。
MetaConvData.txt
は、ヴァージョンアップやデイリーアップデートの対象ファイルです。
独自に編集する場合は、同じフォルダ(ctrlフォルダ)にある、
00 exceptionals.txt
というファイルに、
MetaConvData.txt
と書いた行を追加してください。
これで、
MetaConvData.txt
はアップデート対象外になります。
「プロセルピナ」のテキストフォームをメモ帳モードでオープンし、
MetaConvData.txt
を読み込ませて編集することもできます。
この場合でも正しく表示できない(ドットや四角形で表示される)文字がありますが、そのまま編集・保存しても問題ありません。
また、Windows Xpでは表示できなくても、Windows Vistaでは表示できる文字が多数あります。
テキストフォームで編集する場合は、
編集を終えて保存するときに、
SAVE ボタン
から開くフォームの「文字コードの識別行の有無」の選択欄で、必ず
「Yes: 先頭行として追加する」
を選択するように注意します。
変換パターン編集のサンプルとして、
MetaConvData.txt
の末尾にいくつかの漢字が登録してあります。参考にしてください。
【漢字のメタ定義変換】 (サンプル登録)
[馬鹿] 騼
[洗金] 鍌
[自死] 臰
[門門] 闁
[下心] 忑
[難肉] 臡
[女中] 妕
[日立] 昱
[牛角] 觕
[高木] 槀
[秋水] 湬
[山田] 峀
|
|
|