異体字…IVS、フォント、GSUB

 世の中には姓名にちょっとでも違う字を使うとうるさく言う奴がいて、そんなこんなでUnicodeに字形切り替えの仕組みが備わった。これをIVSという。特に「ナベ」さんはうるさかったらしく、字形も沢山登録された。

上の図はUnicodeに登録されている異体字リスト(IVD:http://unicode.org/ivd/data/2007-12-14/IVD_Charts.pdf*1)から引っ張ってきた。実は上に挙げたのは一部である。日本人しか使わない、日本人のための表である。ああ素晴らしい( ´∀`)。


 こういう規格が何で出てきたのかとか、以下のサイトが詳しかった。
  IVSとフォントの関係 - ちくちく日記
  IVSとGSUBはどう違うのか - Mac OS Xの文字コード問題に関するメモ

ともかく、私も日曜フォントプログラマーとして、フォント内部のIVS構造がどうなっているのかを話したい。

仕様

 フォントの仕様の部分はここ(Character/Glyph Index Mapping)のFormat 14: Unicode Variation Sequencesに当たる。バイナリのデコンパイル実装は自分で頑張ってください。私が作ったのはこれ*2Chromeブラウザで閲覧することをおすすめする。で、デコンパイルした結果が下。フォントのサンプルにはHanaMinOTPr6N-Regular.otfを使用させていただいた。


http://fontconverter.appspot.com/cmap?platformID=0&encodingID=5&fontname=HanaMinOTPr6N-Regular.otf


見て分かる通り、VS(varSelector)に対して、レコードが幾つといったように、通常とは逆のデータ構造に成っている。defaultUVSOffsetは気にしなくてもいい。nonDefaultUVSOffsetがUnicodeとグリフIDを結びつけているレコードになる。defaultUVSOffsetとnonDefaultUVSOffsetの数値をクリックすると表示を展開するので見て欲しい。

対応表

 上のデコンパイル結果を見ても、どのVSがどの表示に対応しているか分からないと思うので、並び替えてリストを作った。ソートされていないのはご愛嬌。


http://fontconverter.appspot.com/cmap2?platformID=0&encodingID=5&fontname=HanaMinOTPr6N-Regular.otf


Unicode#VSとなっている。対応しているグリフIDは右に表示される。クリックしたらグリフに飛ぶ。リストの一番下に37001の定義がある。キャプチャした画像が以下。


http://fontconverter.appspot.com/glyph?fontname=HanaMinOTPr6N-Regular.otf&GID=7947

http://fontconverter.appspot.com/glyph?fontname=HanaMinOTPr6N-Regular.otf&GID=7948


点が有ったり無かったり。極めてどうでもいい、些細な違いのあるグリフがフォント内には別々のIDを振られて格納されている。

GSUB

GSUBとは字形置き換えの仕組みである。IVSの仕組みと何が違うのといわれれば、IVSはUnicodeの仕様、GSUBはOpenTypeFontの仕様である。だからGSUBは字形を置き換える用途ならなんでもありになる。縦書き用のグリフを置き換えたり、アラビア文字の置き換えを定義したり、大体なんでもできる。GSUBの中味を見てみよう。仕様のテーブルの解説はいつかまた。


http://fontconverter.appspot.com/GSUB2?fontname=HanaMinOTPr6N-Regular.otf


featureというのが用途だと思えば良い。14のjp78のmaptableのリンクを見て欲しい。


http://fontconverter.appspot.com/GSUB3?subtableindex=0&lookupindex=4&fontname=HanaMinOTPr6N-Regular.otf


original GlyphIDが置き換え前のグリフID、substitute GlyphIDが置き換え後のグリフIDである。試しに、index:3の行を見て欲しい。以下キャプチャ。


http://fontconverter.appspot.com/glyph?fontname=HanaMinOTPr6N-Regular.otf&GID=23
http://fontconverter.appspot.com/glyph?fontname=HanaMinOTPr6N-Regular.otf&GID=6210


なんだかゴチャゴチャっとしたグリフに置き換わっているのがお分かりいただけただろうか。こんな感じで言語や用途を指定した上で、使用するグリフをすげ替えてしまうのがGSUBテーブルである。もちろん、今見せたような1対1の置き換えだけではなくて1対多、逆に多対1、特定のグリフ列担った場合に置き換えるなど色々できる。

まとめ

 日曜フォントプログラマーとして、IVSとGSUBをフォントフォーマットの観点から語ることが出来た。残念ながら「ナベ」さんだけが異状にうるさい理由は分からなかったが、まあよしとしよう。

お詫び

 公開しているプログラム(http://fontconverter.appspot.com/)はバグフィックス中です。エラーコードの表示が出ても許してください☆(ゝω・)vキャピっ

どうやらデフラグさんが本気出してきた

           [゚д゚] デフラグカイシシマス。
           /[_]ヽ
            | |

ちょっと高機能なデフラグさんだよ!文字をデフラグするよ。JavaScriptだからさくさく動く…と思うよ!IEでは動かないよ!文字列の値をcharAtでとるとIE7でも動くようになりました。

[゚д゚]:http://www28095u.sakura.ne.jp/defrag/

本来の用途としては

WebFontを日本語で - Webと文字においてある文章内で使用しているすべてのUnicode値が必要になったために作成した。

GoogleのAAとYEN SIGN問題

Googleで「AA」で検索かけるとGoogleのロゴがAAっぽくなる:アルファルファモザイク

  ___                _
/ __|___ ___ __ _| |___
| (_ / _ \/ _ \/ _` | -_)
\___\___/\___/\__, |_\___|
  |___/

さまざまなブラウザで実験した。

AA表示テスト- Shift JIS
AA表示テスト- utf-8

すべてのブラウザで正しく表示されるにはフォントをCourier Newに指定するのがいい。

// ==UserScript==
// @name           googleaafix
// @namespace      gnagaoka
// @description    GoogleAAFix
// @include        http://www.google.co.jp/search?hl=ja&source=hp&q=AA&btnG=Google+%E6%A4%9C%E7%B4%A2&lr=&aq=f&oq=
// @include        http://www.google.co.jp/search?hl=ja&lr=&safe=off&q=AA&start=*&sa=N
// ==/UserScript==

document.getElementsByTagName("pre")[0].style.fontFamily="Courier New";

AAで使われる文字を調べたよ

らばQ:顔文字でおなじみになった特殊文字、でもその起源や意味ってわかる?

よく使われる特殊文字「Д、∀、ω」ですが、これらはギリシャ文字キリル文字と呼ばれるもの。

         ∧ ∧
       ヽ(・∀ ・)ノ <モナー系AAを対象に調べたよ
       (( ノ(  )ヽ ))
         <  >

1.サンプル:ショボーン

∧_∧
( ´・ω・) みなさん、お茶が入りましたよ・・・・。
( つ旦O
と_)_) 旦旦旦旦旦旦旦旦旦旦旦旦旦旦旦旦旦旦旦旦
∧ : 論理積

 数学記号。P ∧ Qで PかつQの意味。AAでは猫のような耳として多く使われる。
 論理積 - Wikipedia

( ) :括弧

 約物 。中と外とを区切る役割を果たす。AAでは主に顔や体の輪郭を現すのに使われる。
 括弧 - Wikipedia

_ :FULLWIDTH LOW LINE 全角下線

 約物。下線の付いた空白。もともとはタイプライターで重ね打ちすることで強調するために存在した。AAでは輪郭に多く使われる。似たものに「 ̄」があるが、これはマクロンと呼ばれるダイアクリティカルマークで、英字の上につく発音記号である。「 ̄」はFULLWIDTH MACRON(全角マクロン)である。AAでは輪郭に多く使われる。

アンダースコア - Wikipedia

http://www.unicode.org/charts/PDF/UFF00.pdf

マクロン - Wikipedia

´ : アキュート・アクセント

 アクセント記号。主にヨーロッパ諸語においてラテン文字の上側についてアクセントを表す。AAでは斜めの一部分やたれ目もしくは眉毛(目と眉毛に同時に同じ記号を使うことは区別がつかなくなるのでまずしない)として使われることが多い。似たものにプライム(Modifier Letter Prime)「′」がある。これは約物微分したときに肩に付けたりする。プライムには複数あるが、AAでは「′」使うことは少ない。他にもAAで多用されるものにアポストロフィー「'」がある。プライムやアキュートアクセントに比べて点の位置が低く、また文字を拡大すると点の部分が大きくなって意図したものにならない。

 図1.ドクオの拡大画像−目の部分にアポストロフィーが使われている。

 たれ目として使われたとき、対応する目として使われる記号に「`」「`」がある。

┌─────────────────────┐
│          ∧_∧                 .│
│    ∧_∧  (´<_`  ) 流石だよな俺ら。    .│
│   ( ´_ゝ`) /   ⌒i                .│
│   /   \     | |                │
│  /    / ̄ ̄ ̄ ̄/ |                .│
│__(__ニつ/  FMV  / .| .|____         ...│
│    \/____/ (u ⊃              │
│      ガガガガ・・・・                  │
│                              ..│
│ 図2.流石兄弟                    .│
└─────────────────────┘

 「`」はグレイヴ・アクセントと呼ばれ、AやEなどの上に付いて発音のアクセントを表す。フランス語などにアクセント記号として使われる。「`」はFULLWIDTH GRAVE ACCENT(全角グレイヴ・アクセント)で意味は同じ。

アキュート・アクセント - Wikipedia
プライム
流石郷-「流石だよな俺ら」テンプレ等
グレイヴ・アクセント - Wikipedia
http://www.unicode.org/charts/PDF/UFF00.pdf

・ : 中黒

 約物。主に合成語内の区切り。海外の人名など。例) 惣流・アスカ・ラングレー AAではくりっとした目として使われることが多い。
中黒 - Wikipedia

ω : オメガ

 ギリシャ文字の最後の文字の小文字。AAでは猫のような口としてとして使われ、ショボンからブーンまで幅広く使われる。やる夫の口の「(__人__)」はこれを大型化したものである。

┌──────────────────────────┐
│       ____                          ....│
│     /⌒  ⌒\                         ..│
│   /( ●)  (●)\                         .│
│  /::::::⌒(__人__)⌒::::: \   だからニュー速でやるお!    .│
│  |     |r┬-|     |                       .│
│  \      `ー'´     /                       .│
│                                     ...│
│ 図3.やる夫                              .│
└──────────────────────────┘

 大文字は「Ω」で電気抵抗の記号として有名。AAでは肩より上の人として使われることがある。

┌───────────────────────────────────────────┐
│       な、なんだってー!!                                          ..│
│      Ω Ω ΩΩ                                                 .│
│                                                              ..│
│    、__人__人__人__人__人__人__人__人__人__人__人__人__人__人__人__人__人__人__人__人__,          │
│    _)                                                (_         .│
│    _)  ナ ゝ        ナ ゝ  /   ナ_``  -─;ァ              l7 l7   (_        ....│
│    _)   ⊂ナヽ °°°° ⊂ナヽ /'^し / 、_ つ (__  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ o o    (_        ....│
│    )                                                (        ......│
│    ⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒        .....│
│ /   , ,ィ ハ i、 、     !   /''⌒ヽ-─‐- 、     、ー'´         \ .イ   , ,ィ ハ i 、 .   |     ...│
│ /イ  ,ィ/l/ |/ リuヽlヽト、 |   ゝ ,、.___,  \  >       ,       !  | ,ィ/l/ l/ uハlヽトiヽ. |      │
│  イ /r >r;ヘj=:r‐=r;<ヽ│  「 ./       u \  |  ≧  , ,ィ/ハヽ\   |   |/゙>r;ヘ '-‐ァr;j<`K       │
│  r、H   ┴'rj h ‘┴ }'|ト、  |./        ヽ |  1 イ/./ ! lvヾ,.ゞ、 ! .ry   ┴ 〉   └'‐ :|rリ      │
│  !t||u`ー-‐ベ!` ` ー-‐' ルリ r|´゙>n-、ヽ-rj='^vヽ _レ「゙f.:jヽ ーT'f.:j'7`h |t|.   ヾi丶     u レ'     ....│
│  ヾl.     fニニニヽ  u/‐'  :|r|  ー "j `ー ′ h゙リ {t|!v ̄" }  ` ̄  !リ ヾl u  iニニニヽ   /|       .│
│    ト、  ヽ.   ノ u,イl.    ヾ! v  ヾ__ v イ‐' ヾl   ヾ_  v ./'    ト、  、__丿u ,イ ト、      .│
│   ,.| : \  `ニ´ / ; ト、    ト.、u L_ フ , ' |.    ト、u ヾー `> /.|.   ,| ::\     / ; / \    .│
│-‐''7 {' ::   ` ー '  ,; ゝ:l`ー- ⊥:`ヽ. __ / ,' |    | :\   ̄ /,' ト、_ /〈 ::  ` ー '   ,'/   「  ......│
│  /  \ ::       , '/  :|     `'''ー- 、 , ' '>-,、.._ノ ::  `ー '   /,.イ   \::     /      |    .│
│ /     \    /     |        | ヽ-‐'´ _,.ヘ<  _::   _,. イ/ |     ,.へ、 /´\       |   ....│
│                                                              ..│
│ 図4.MMR                                                       │
└───────────────────────────────────────────┘

 ちなみにこれをひっくり返したモー(オームを逆から読んでモー。コンダクランス(Rの逆数)の単位)℧もあるがAAではまず使われない。
 他に使われるギリシャ文字としてΔ、ξ、Φなどがある。例) ( ФωФ)、ζ(゚ー゚*ζ、ξ ゚⊿゚)ξ 「⊿」はRight TriangleでUnicodeの数学記号領域の22bfにコードされている数学記号である。「Δ」もまたINCREMENTとして同じ字形で数学領域にの2206にコードされている。
Ω - Wikipedia
やる夫 - Wikipedia
MMR
ナギ戦記(停止中) ブーン系小説を読む前に
ギリシア文字 - Wikipedia
http://www.unicode.org/charts/PDF/U2200.pdf

つ : つ

 ひらがな。AAではその形から何かを差し出している手として使われることが多い。 例) ( ・∀・)つ旦
つ - Wikipedia

旦 : たん

 漢字。AAでは真横から見て「日」部分が湯のみをあらわし、その下の「_」がコースターをあらわしている。

サンプル:斉藤またんき

         ∧ ∧
        (・∀ ・;)  あちー
         ノ(  )ヽ
         <  >
∀ : 全称記号

 数学記号。∀xで任意のxに対して。AnyのAをひっくり返した形。AAではモナーを筆頭として口として非常に多くのキャラクターで使われている。

┌───────────────┐
│   ∧_∧  / ̄ ̄ ̄ ̄ ̄    .│
│  ( ´∀`)< オマエモナー   ....│´`
│  (    )  \_____     .│
│  | | |              ....│
│  (__)_)              .│
│                     ...│
│ 図5.モナー            .....│
└───────────────┘

 笑っている口を表し、ポジティブな雰囲気を持たせるのに使われる。この逆のラテン大文字「A」を口として使うとネガティブな感じとなる。

┌──────────┐
│ |              .│
│ |  ('A`)         │
│/ ̄ノ( ヘヘ ̄ ̄     .│
│              ..│
│ 図6.ドクオ      ..│
└──────────┘

全称記号 - Wikipedia
モナー - Wikipedia
毒男 - Wikipedia

ノ : の

 かたかな。「乃」を略して作られた。AAでは手として使われたり、体の輪郭として使われたりする。
 似たようなものとしてこの半角「ノ」や「乃」の漢字部首「丿」がある。
の - Wikipedia
丿部 - Wikipedia

ヽ : 一の字点

 踊り字。片仮名繰返しの記号である。AAでは手として使われたり、体の輪郭として使われたりする。斜めの線としても多用される。似たようなものに「ヾ」「ゝ」「ゞ」「丶」がある。
 「ヾ」「ゝ」「ゞ」はいずれも「ヽ」のような繰り返し記号である。AAでは頭を掻いている手や敬礼として使われることが多い。

┌────────────────────────────┐
│::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::。:::::::::::::::::::::::::::::::::::::::::::::    ....│
│:::::::::::::::::::::::::::::::::。::::::...... ...   --─-  :::::::::::::::::::: ..::::: . ..::::::::     .....│
│:::::::::::::::::...... ....:::::::゜::::::::::..   (___ )(___ ) ::::。::::::::::::::::: ゜.::::::::::::     │
│:. .:::::。:::........ . .::::::::::::::::: _ i/ = =ヽi :::::::::::::。::::::::::: . . . ..::::      │
│:::: :::::::::.....:☆彡::::   //[||    」  ||]  ::::::::::゜:::::::::: ...:: :::::     ......│
│ :::::::::::::::::: . . . ..: :::: / ヘ | |  ____,ヽ | | :::::::::::.... .... .. .::::::::::::::     │
│::::::...゜ . .:::::::::  /ヽ ノ    ヽ__/  ....... . .::::::::::::........ ..::::      .│
│:.... .... .. .     く  /     三三三∠⌒>:.... .... .. .:.... .... ..     ...│
│:.... .... ..:.... .... ..... .... .. .:.... .... .. ..... .... .. ..... ............. .. . ........ ......     │
│:.... . ∧∧   ∧∧  ∧∧   ∧∧ .... .... .. .:.... .... ..... .... .. .      .│
│... ..:(   )ゝ (   )ゝ(   )ゝ(   )ゝ無茶しやがって… ..........     .│
│....  i⌒ /   i⌒ /  i⌒ /   i⌒ / .. ..... ................... .. . ...      │
│..   三  |   三  |   三  |   三 |  ... ............. ........... . .....      │
│...  ∪ ∪   ∪ ∪   ∪ ∪  ∪ ∪ ............. ............. .. ........ ...      .│
│  三三  三三  三三   三三                   ....│
│ 三三  三三  三三   三三                    ....│
│                                         .│
│ 図7.無茶しやがって                            │
└────────────────────────────┘

 「丶」は漢字部首。「丸」・「丹」・「主」などにつかわれ、点の意味である。Unicodeの中国漢字ブロックに存在する。

踊り字 - Wikipedia
Unicode一覧 3000-3FFF - Wikipedia
無茶しやがって
丶部 - Wikipedia
Unicode一覧 4000-4FFF - Wikipedia

<  > : 山括弧

 括弧の一種。AAでは蟹股や輪郭を現すのに使われる。特徴的な使い方として図8のようなニダーの頬の使い方がある。

┌────────┐
│  ∧_∧     ...│
│ <丶`∀´>    .....│
│ (    )      .│
│ | | |       │
│ 〈_フ__フ      .│
│図8.ニダー   ....│
└────────┘

括弧 - Wikipedia
ニダー - Wikipedia

サンプル ギコ猫

   ____∧∧  / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
 〜' ____(,,゚Д゚)< 逝ってよし!
   UU    U U   \________
/  \ : FULLWIDTH SOLIDUS FULLWIDTH REVERSE SOLIDUS 全角斜線と全角逆斜線

 約物。スラッシュのこと。スラッシュは日付の表記や数学の割り算記号として使われる。バックスラッシュは主にプログラムコードにおいてエスケープ記号に使われることが多い。日本語だとこのコードは円記号に当てられているために海外製のAAがうまく表示されないことがある。FireFoxではhtml要素のlang属性をenにすると解決する。

AAにおいては左右対称であることを生かした斜めの線として使うことが多い。

スラッシュ (記号) - Wikipedia
バックスラッシュ - Wikipedia
http://www.unicode.org/charts/PDF/U2200.pdf

_  ̄ : 下線とマクロン

 AAでは吹き出しを構成するのによく使われる。

〜 : fullwidth tilde 全角チルダ

 アクセント記号。スペイン語などでラテン文字の上について発音のアクセントを表す。これの全角板(fullwidth tilde)と約物である波線(wave dash)は混同して用いられたため、字形は同じである。AAにおいては尻尾であったり、手であったりする。
チルダ - Wikipedia
波ダッシュ - Wikipedia

, : コンマ

 約物。文の途中の区切りに打たれる点。日本語の読点「、」と同じ様なもの。リアル系のAAの輪郭などで使われる。
コンマ - Wikipedia
読点 - Wikipedia

゚ : HALFWIDTH KATAKANA SEMI-VOICED SOUND MARK 半濁点(半角)

 かな記号。「ぽ」や「ぷ」などの右上の丸に当たる。AAでは目として使われることが多い。

┌──────────────────┐
│    _  ∩                  .....│
│  ( ゚∀゚)彡 おっぱい!おっぱい!    │
│  (  ⊂彡                  .....│
│   |   |                    │
│   し ⌒J                   ...│
│                           .│
│ 図10.ジョルジュ長岡            .│
└──────────────────┘

他の中空点と共に涙を表す記号として用いられることもある。

┌──────────┐
│。゚ ゜(ノД`)゜ ゚ 。   .│
│              ..│
│ 図11.涙      ......│
└──────────┘

「。」は約物で日本語文書で文の終わりにつける。「゜」は全角の半濁点である。これとよく似たものに角度などに用いられる度「°」がある。これはラテン文字などの肩についてさまざまな温度を表すのにも用いられる。
半濁点 - Wikipedia
ジョルジュ長岡 - Wikipedia
句点 - Wikipedia
° - Wikipedia

Д : デー

 キリル文字。ロシア語で使われる大文字。ギリシャ文字のデルタ、ラテン文字のDに相当する。AAでは開いた口を表すのに用いられる。この小文字は大きさが小さいだけで同じ形をしており見分けにくい。またキリル文字の面白い特徴として斜体になるとまったく異なる字形になるものがある。

┌────────────────────┐
│     (゚д゚ )  ≡≡≡            ......│
│    O┬Oc )〜 ≡≡≡            ...│
│    (*)ι_/(*) ≡≡≡           .│
│                            ....│
│                            ....│
│     ( ゚д゚ ) ! ≡≡≡            .│
│    O┬Oc )〜 ≡≡≡            ...│
│    (*)ι_/(*) ≡≡≡           .│
│                            ....│
│                            ....│
│         ( ゚д゚ )                  .│
│        O┬O                ......│
│        ( .∩.|                 ...│
│         ι| |j::...                ...│
│            ∪::::::                 .│
│                            ....│
│ 図12.小文字дを使った「こっちみんな」  .....│
└────────────────────┘

 他に使われるキリル文字としてはeがあげられる。例) (’e’) ギリシャ文字ほど使われている感じはしない。

Д - Wikipedia
ベア速 こっちみんなを超えるAA作ったwwwwwwww
ナギ戦記(停止中) ブーン系小説を読む前に
キリル文字 - Wikipedia

U U: ユー 全角ユー

 ラテン大文字とその全角板。小文字のuと共にAAでは足としてよく使われる。

┌─────────┐
│    ∧ ∧      .│
│   (,,・д・)      .│
│  〜(_u_u_)       │
│            ....│
│図13.チビギコ    │
└─────────┘

 似たようなU字の記号郡として集合を現す数学記号の「∈」「∋」「⊆」「⊇」「⊂」「⊃」「∩」「∪」がある。これらの記号は手や足などの先っぽを表すのにちょうどよく、多くのAAで使用される。
 「∈」「∋」はa ∈ AでaはAに属しているという意味になる。例) レモナ∈モナー系AA。AAではその形から鳥のくちばしに使われることもある。

┌──────────────┐
│    ノノノノ              │
│   ( ゚∋゚)             .│
│  /⌒\/⌒ヽ_______       .│
│ | ̄⌒\ 彡ノ_   |     .....│
│ |_________\_|__ 丿____|     ....│
│/_____________\彡ノ_________\    .│
│ ‖      \ヽ    ‖     │
│         ヽミ        ......│
│                   .....│
│ 図14.クックル          │
└──────────────┘

U - Wikipedia
集合間の関係を表す記号 - Wikipedia
数学記号の表 - Wikipedia
クックルドゥドゥドゥ - Wikipedia

サンプル:フサギコ

    ∬   ∧,,∧      
     ~━っミ ゚Д゚彡,,       
    ∀._(,,,~  ,,,~⊃_ 
━┳┷ |. ,(~ヽ,,,ミ.    
  ┃...| ̄ ̄し'J.  ̄ ̄ ̄ 
  ┻ ヽ ̄ ̄ ̄ ̄ ̄ ̄
∬ : 重積分記号

 数学記号。インテグラル「∫」の重なったもの。周積分記号「∮」もある。3重積分記号はない。AAではタバコの煙を表したり、湯気を表したりする。
積分記号 - Wikipedia

ミ ミ: み

 カタカナの「み」とその半角。AAでは「彡」と共に使われて、毛の「ふさふさ」感や動きを表すのに使われる。

┌───────────────────────┐
│  winter      /^l                      .│
│     ,―-y'"'~"゙´  |                    ...│
│     ヽ  ´ ∀ `  ゙':                    .│
│     ミ  .,/)   、/)                   ...│
│     ゙,   "'   ´''ミ                    │
│  ((  ミ       ;:'                    .│
│      ';      彡                    ..│
│      (/~"゙''´~"U                     ..│
│                                  │
│  summer     /^l                    ....│
│     ,―-y -―-'  |    〜〜~ミ~〜     〜     .│
│     ヽ  ´ ∀ ` ヽ    ミ~〜 〜 〜          │
│     ,| /)     /)     ミ 〜       〜    │
│     |        |      〜~ ミ ミ〜        │
│  ((  |        l     〜~~ ~          ......│
│     ヽ       ノ        〜~  〜~      ....│
│      (/ ̄ ̄ ̄U    ~〜ミ 〜~〜          ...│
│                  〜ミ〜     ~〜    .....│
│                                  │
│ 図15.もっさりさん                     │
└───────────────────────┘

み - Wikipedia
もっさりさん - Wikipedia

彡 : さんずくり

 漢字部首。毛髪の飾りの紋様を意味する。AAでは毛の「ふさふさ」感や動きを表すのに使われる。
彡部 - Wikipedia

━ ┳ ┻ など : 罫線素片

 ワープロなどで文字で表を構成するために定義された文字郡。読み方も「よこ」とか「たて」などである。AAにおいては背景や物などの輪郭に使われることが多いが、まれに図16のようなAAもある。

┌─────────────────────┐
│      ┌┐                       .│
│      ││                │││       .│
│      ├┘                └┼┘       .│
│      │      ┏━━┓      │         .│
│      ┏┓    ┃━┏┃    ┏┓         .│
│      ┃┃    ┃  ┛┃    ┃┃         .│
│      ┃┃    ┗┳┳┛    ┃┃         .│
│      ┃┗━━━┻┻━━━┛┃         .│
│      ┗━━━┓    ┏━━━┛         .│
│              ┃    ┃              │
│              ┃    ┃              │
│  ─────────────────   ...│
│        ┏━━┳┳┳┳┳┓          ....│
│        ┃┓━┃┃┃┃┣┫          ....│
│        ┃┗  ┃┃┃┃┣┫          ....│
│        ┗━━┻┻┻┻┻┛          ....│
│                              ..│
│ 図16.罫線素表で構成されたAA        .....│
└─────────────────────┘

罫線素片 - Wikipedia
┃━┏┃ : AAなにっき....〆ミ・д・,,ミ

終わりに

…それにしては、ちょっとばかり低俗なものが多い気もしますけど。

         ∧ ∧
        (・∀ ・) <逆に聞きたいのだが高尚なAAってなによ
         ノ(  )ヽ
         <  >

         __O)二)))(・ω・`) こういうのだろ
   0二━━ )____)┐ノヽ
         A   ||ミ|\ くく


全体をドラッグ
&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;■■&#9600;&#9600;&#9600;&#9600;■
&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9600;  ┃       
&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608; &#9604;&#9606;&#9608;&#9608;&#9608;&#9605;      
■&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608; &#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;▲     
▲ ▼&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;◆ &#9607;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;    ▼
&#9600;┃■&#9608;&#9612;&#9609;&#9600;■&#9608;&#9608;&#9608;&#9608;&#9610;┃ &#9600;★&#9600;&#9608; &#9604;&#9600;&#9700; &#9602;    ┃∴&#9701;&#9600;▲
 &#9701;&#9606;&#9611;&#9608;&#9600;●&#9698;&#9701;▼&#9608;&#9600;▼∴ &#9608;&#9608;&#9606;&#9608;&#9605;&#9608;&#9608;&#9607;&#9608;&#9612;    ∵&#9603;★ &#9699; ∵
&#9700;━&#9701;&#9600;■━▲   ∵┃  &#9608;&#9608;&#9608;&#9608;■&#9608;&#9608;&#9608;&#9700;     ∵&#9600;▼ &#9600; ▼ &#9607;&#9600;◆
   ◆∵ ▼        &#9600;&#9608;&#9607;&#9602;&#9605;&#9608;&#9608;&#9608;∵      ∵∴  ∵〓&#9614;  
∵   ∴∵  ∴ ∴∵ ∴&#9600;&#9607;●&#9605;&#9608;&#9608;&#9600;    ∴ ∴ ∵ ∴ ∴∵&#9698;&#9700;∵
       ∴∵&#9698;〓■     &#9600;&#9608;&#9600;&#9600;         &#9701;〓◆∴      
     ∴&#9644;&#9642;〓&#9776;&#3642;〓&#9700;        &#9604;  ∴      ∵   〓∵∴    
   ∴&#9644;〓▼∵ ★∵       &#9608;&#9606;&#9605;&#9605;&#9606;&#9604;∴            &#9698;&#9700;&#9698;〓&#9700;∵
  〓■&#9698;&#9698;&#9700; &#9698;&#9642;          &#9604;&#9605;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;■ ∴ ∴&#9701;■■▲〓&#9644;∴
  ◆〓━&#9701;&#9699;∵          &#9604;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9610;┃∴  ∵▲▲▲〓〓━
∴∵ ∴▼&#9701;&#9699;▲∴ ∵  ∴▲&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608; ┃&#9602;&#9644;〓━∴ ∴&#9701;〓▼&#9701;&#9699;
   ∴ ∵▼◆    ■&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;■&#9644;〓〓━   ∵ ∵&#9701;◆
  ∴〓&#9776;&#3642;〓&#9698;&#9700; ∵   &#9701;&#9600;■&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;■&#9600;∵    ∴∵      ∵ 
  &#9701;▲ &#9606;■&#9698;∴    ┃ ┃&#9614;┃&#9614;┃&#9698;&#9700;┃∵     ∴ ∵   ∴     
    &#9701;〓&#9699;∵       ┃ ┃┃  ┃       ∵          
 ∴&#9602;&#9644;〓&#9644; ∴       ┃   ∵┃             ∵ ∴∴    
 ∵■▼〓∵              ┃              ∵    
∵   ∴                                        
        &#9698;∴                        ∴       
       ▼&#9698;&#9700;┃&#9698;&#9700;&#9606;&#9608;&#9607;&#9606;&#9605;&#9604;&#9602;           ∴   ∵  ∴   
     ∵&#9698;▼┃&#9613; ■&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9606;&#9603;▼           〓&#9699;       ∵   
        ┃    ■&#9608;&#9608;&#9608;&#9608;&#9608;&#9608;&#9600;&#9608;&#9605; &#9701;〓&#9699;  &#9701;&#9602;                
       ∴   &#9603;&#9605;  &#9600;&#9600;&#9608;&#9608;&#9600;■&#9606;&#9602;   ∵                 
           ▼&#9605;&#9608;■ ◆&#9600;■&#9605;  ▼          ∴       
           ∴&#9603;&#9606;■∵   ∵                       
          ∵ &#9698;▼                 

JIS 0213、JIS C 6226:1978、10646/Unicode漢字の典拠資料一覧

10646/Unicode 漢字の典拠規格

典拠規格 漢字数
JIS X 0208-1990(JIS漢字) 日本 6355
JIS X 0212-1990(補助漢字) 5801
GB2312-80 中国 6763
GB/T 12345-90 2180
GB 7589-87 4835
GB 7590-87 2842
現代漢語通用字表 41
GB 8565.2-88 290
GB 12052-89 94
PRC Telegraph Code 8000
Big Five (Big5) 台湾 13053
CCCII,Level1 4808
CN 11643-1986 Planes 1 5401
CN 11643-1986 Planes 2 7650
CN 11643-1986 Planes 14 4198
Taiwan Telegraph Code 9040
KS X 1001:1992 韓国 4620
KS X 1002:1991 2856
ANSI Z39.64-1989(EACC) アメリ 13481
Xerox Chinese 9776
TCVN 6056:1995 ベトナム 3311

JIS C 6226:1978で収録漢字を検討する際に使用された漢字表

No 漢字表 文字数
1 IBM 2245漢字印刷装置文字セット一覧表 6792
2 情報処理学会漢字コード委員会標準コード用漢字表試案 6086
3 明治生命保険相互会社漢字コード 5355
4 大蔵省主計局漢字収容漢字表 4276
5 富士通標準文字表 4271
6 大蔵省印刷局常用文字の調査 4009
7 全日本漢字配列協議会全国統一一新配列による常用漢字目録 4003
8 国立国会図書館収容漢字表 3956
9 林四郎、小林信子『語彙調査四種の使用度のよる漢字のグループ分け』 3915
10 森岡健二『漢字の層別』 3624
11 国土行政区画総覧使用漢字 3251
12 内閣調査室収容漢字表 3181
13 日本生命収容漢字表 3044
14 読売新聞社1倍明朝(基本活字)文字数 2925
15 国立国語研究所資料集8『現代新聞の漢字調査』中間報告 2876
16 行政情報処理用基本漢字に対する符号付与に関する調査研究報告書『付表』 2817
17 日本タイプライター(株)和文タイプライター文字配列表(A) 2792
18 国語シリーズ64 各種漢字表字種一覧 2696
19 日本タイプライター(株)N.T.C.漢字入力システム用文字コード表第一次分 2671
20 日本生命漢字コード表 2628
21 NHK文研用語研究部『ラジオニュース語い調査漢字集計表』参考 菅野謙 2613
22 (株)写研SPICA『一寸ノ巾式』メインプレート 2508
23 サンケイ新聞社(大阪)サプトンシステム鑽孔機鍵盤文字配列及び符号表 2319
24 日本テレビ放送網?『文字表示装置用字母 2302
25 電話番号簿活字鋳造量 2097
26 菅野謙『当用漢字表に含まれない漢字』〈放送で使う漢字の範囲の検討のために〉 2095
27 NHK文研用語研究部『国語教科書出現漢字表』 2022
28 毎日新聞社さん孔機文字盤 1992
29 6社協定新聞社用コード表(C0-59) 1985
30 文字出度調査109万字集計結果 1977
31 日本経済新聞社KKB文字表及び符号表 1952
32 日本科学技術情報センター収容漢字表 1864
33 当用漢字表 1850
34 電総研漢テレコード表1 1834
35 電総研漢テレコード表2 1831
36 雑誌記事索引自然科学編における漢字の頻度調査 1411
37 日本工業標準調査会JIS職業コード(JIS C 6226-1772) 737

JIS X 0213に収録する漢字を決めるための典拠資料

No. 典拠資料 漢字数
1 NTT電話帳 3241
2 地名(国土地理協会・国土地理院・国土行政区画総覧除去分) 477
3 現行法令(総務庁 7
4 小・中・高の文部省検定済み教科書 1532
5 文部省学術用語 6
6 康煕字典』部首不足分 4
7 83JIS互換29区点 29
8 人名許容字体・当用漢字表康煕字典別掲字 105
9 公開レビュー中の要望字 64
10 公開レビュー中の用例探索字 75
11 人名(パーフェクトリバティー教団 204
12 中国地名 117
13 中国地名(村田忠禧氏) 62
14 神社名・祭神名(神社本庁 54
15 国宝・重分(文化庁 147
16 日本内経医学会選定文字(日本内径医学会) 521
17 日本鍼灸学会選定文字(日本鍼灸学会) 131
18 東洋医学会選定文字(東洋医学会) 156
19 日本医薬品集(薬業時報社) 39
20 国書総目録 1059
21 国立国会図書館書誌(国立国会図書館 1430
22 書籍出版協会書誌(日本書籍出版協会 287
23 朝日新聞社用例(新聞協会) 620
24 共同通信社K-JIS 369
25 共同通信社用例(新聞協会) 68
26 毎日新聞社用例(新聞協会) 91
27 産経新聞社用例(新聞協会) 12
28 新潮文庫の100冊・新潮文庫明治の文豪・新潮文庫大正の文豪』(新潮社) 589
29 青空文庫中の外字(青空文庫 375
30 仏教用字(日本印度学仏教学会データベースセンター選定) 15
31 儒教経書用字(師尾潤氏) 75
32 雑誌”群像”総目録 4
33 歌舞伎番附東京大学国文学研究室) 40
34 歌舞伎外題(飯島満氏) 16
35 酒造講本 5
36 熟語対応など 4
37 弓道弓道読本) 4
38 青銅器 10
39 大辞林第二版』(三省堂 1250
40 日本国語大辞典』(小学館 6682
41 Microsoft Shogakukan BookShelf Ver.2.0』(マイクロソフト 129
42 マイクロソフト エンカルタ百科事典』(マイクロソフト 317
43 宋本玉篇部首 153
44 切韻韻目 16
45 韻鏡三十六字母 1
46 字体記述要素 142
47 富士通メインフレーム外字 4202
48 日立製作所メインフレーム外字 2186
49 日本アイ・ビー・エム メインフレーム外字 360
50 日本電気メインフレーム外字 3564

参考資料

( ゚∀゚)彡絵文字( ゚∀゚)彡絵文字

Google Japan Blog: 絵文字のユニコード符号化: 符号化提案用のオープンソースデータ

私たちが提案している絵文字のマッピングや変換表、更に絵文字データからHTMLの表などを作成するのに役立つツールなどを 「emoji4unicode 」という名前でオープンソースプロジェクトとして公開します。

    _  ∩
  ( ゚∀゚)彡 絵文字!絵文字!
  (  ⊂彡
   |   |
   し ⌒J


       |
   \  __  /
   _ (m) _ピコーン
      |ミ|
   /  .`´  \
     _
   ( ゚∀゚)
   し  J
   |   |
   し ⌒J

U2600.pdf


チェスボード:http://www28095u.sakura.ne.jp/emoji/tyesu/

    _  ∩
  (*゚∀゚)彡
  (  ⊂彡
   |   |
   し ⌒J


       |
   \  __  /
   _ (m) _ピコーン
      |ミ|
   /  .`´  \
     _
   ( ゚∀゚)
   し  J
   |   |
   し ⌒J

FireFox3.1bとWebFont - Webと文字
K'sBookshelf フォント/絵フォント Fonts & Dingbats 将棋駒
yosh's laboratory "FONT"


将棋盤:



マージャン牌:



   ∩ _ _   ≡=−
   ミ(゚∀゚*) ≡=−絵文字!絵文字!
    ミ⊃ ⊃    ≡=−
     (⌒ __)っ   ≡=−
     し'´≡=−

  −=≡    _ _ ∩
 −=≡   (*゚∀゚)彡  絵文字!絵文字!
−=≡   ⊂  ⊂彡
 −=≡   ( ⌒)
  −=≡  c し'

最後に大事なこと

  _  ∩                   _ ∩
( ゚∀゚)彡 ありがとう!         ( ゚∀゚)彡 Thank you!
 ⊂彡                   ⊂彡 

id:teramakoさん、はてなポイントありがとう!大事に使わせていただきます。

追記

mashabow 2008/12/06 07:57 そういえば、Unicode 5.1 でドミノ牌も収録されましたね。麻雀牌と一緒に。
http://www.unicode.org/charts/PDF/U1F000.pdf
http://www.unicode.org/charts/PDF/U1F030.pdf

うはwwww既にあったのか( ^ω^)www。結構いろんなものを登録できるんね。
Googleの絵文字もあながち冗談じゃないんかも。でもそうすると「色」はどうなるんだろう。
たとえ色を定義したとしても現在のTrueTypeじゃ使えない*1みたいだし。フォントとか関係なく文字処理にしか使わないんだろうか。

*1:TrueTypeにcolorRef(http://d.hatena.ne.jp/project_the_tower2/20080918/1221730920)というのがあって使われていない

文字コードをまとめようとして挫折した

土日でできませんでした。
 進捗率:10%ぐらい
 目標:符号化方式を追加すること

    ∧,,∧    僕には無理でした
   ( ´・ω・)
  c(,_U_U      ・゚・。・ ゚・。・゚・ 。・゚・
     ━ヽニニフ


PDF:http://www.geocities.jp/project_the_tower2/web_mozi/code/matome.pdf
右クリックで保存してローカルで開いてください。
OpenOfficeDrawで作ったファイル:http://www.geocities.jp/project_the_tower2/web_mozi/code/matome.zip
ダウンロードしたら、拡張子をodgに変えてOpenOfficeで開いてください。

追記1

ブクマがいっぱいでびっくり。ダウンロード先のリンクを修正します。いいか、見て幻滅するんじゃないぞ(´・ω・`)!本当は修正したい箇所いっぱいあるんよ。
PDF:http://www28095u.sakura.ne.jp/codematome/matome.pdf
OpenOfficehttp://www28095u.sakura.ne.jp/codematome/matome.odg

追記3

文字の歴史編も作りました。よかったら見てね。
文字の歴史はですねぇ... - Webと文字