JIS X O208改訂

JIS X O208改訂

《愚者の後知恵》今はない電子ライブラリーコンソーシアムの機関誌への寄稿。第2回。現時点(2004年6月)で読み返してみると、この原稿執筆時点で、JIS X 0208の97改正、JIS X 2013:2000制定の問題点が、ある程度顕在化していたことが分かる。この時点で、国語審議会答申『表外漢字字体表』の主旨を生かすためのJIS文字コードの改正に関わるとは、夢想さえしていなかった。
1997年4月
ELICON「電子化文書規格シリーズ」

JIS X O208改訂
われわれが日常用いている専用ワープロやパーソナルコンピューターは,ご存じのように漢字を扱うことができる。一昔(まさに十年)前までは,手元 のコンピューターで漢字を扱えること自体が大きな驚異だった。しかし,今ではある程度までは自由自在,そして,できないことに対する不満が一杯,と いう状態になっている。今回は,パーソナルコンピューターで漢字を扱うことの現状を,それを支えるJISコードの側面から振り返ってみたい。
われわれが,通常JISの第一水準,第二水準などと呼んでいるJISは,正確には「JIS X O208-1990情報交換用漢字符号」と呼ばれているものを指している。 いや,もう正確ではない。この規格は今年の1月20日に改訂されて,X 2028-1997となっている。
そもそも,漢字符号がJIS化されたのは,昭和53年1月1日。「情報交換用漢字符号系JISC6226-1978」が最初である。これが,昭和58年9月1日にJIS X 0208-1983として改正され,さらに、平成2年9月1日1に「情報交換用漢字符号JIS X 0208-1990」となり,今回の改正に至っている。
われわれが参照することのできるJIS漢字コードはもう一つあり,「情報交換用漢字符号-補助漢字JIS X 0212-1990」で,平成2年10月1日に制定されている。この規格は,非常に多岐にわたる文字種を採録しているが,人名という非常に重要なニーズへ の配慮が足りず,現状としては,普及するに至っていない。ただし,前にもふれたようにJIS XO221には,この文字種はすべて含まれており,Unicode実 装の普及により,使用への障壁は取り除かれつつある。
こまごまと年代を書き連ねたが,この歴史の中に,コンピューターで漢字を扱う上での問題点が込められているので,お許し願いたい。

現行のJIS XO208には,基本的な性格の漢字2965文字(第1水準漢字集合)とそれ以外の漢字3390文字(第2水準漢字集合),合計6355文字が含まれて いる。他に,特殊文字,数字,ローマ字,ひらがな,片仮名,ギリシア文守:,ロシア文字,罫線素片などが含まれている。規格票自体は,赤坂にある日本規格 協会の他,政府刊行物を販売している書店などでも,容易に入手することができる。
では,昨今喧しい,JIS漢字の問題点とは何か。
問題は大きく,二つに分けられる。
一つは,現行のⅩ 0208に一貫して含まれている問題。もう一つは,1983年の改訂に伴って顕在化した問題。
83年の改訂の問題から考えよう。この改訂では,規格にずいぶん大きな変更が加えられた。特に問題となるのは,以下の二つの変更の部分だと思われる。
まず,第1水準と第2水準で位置を入れ替えられた漢字が,22字ある。*鯵と鯵*,*鷺と鴬*など。もう一つは,第1水準にあって常用漢字表,人名用漢字別衣にない漢字で,常用漢字表,人名用漢字別表の字形を部分字形として含むもので,それに準じた字形に変更されたものが,151字ある。  この二つが,大きな混乱を巻き起こした。メーカーや業界などで,この改訂に追従しなかったところがあったのだ。たとえば,パーソナルコンピューターやプリンターなどでは,78JISの字形をそのまま踏襲するメーカーと83JISに準拠するメーカーが混在し,その組み合わせによって,意図した文字と異なる文字が印刷される例が頻出した。この問題は,今に至るまで尾を引いている。  特に,よく引き合いに出されるのが,森鴎外の「鴎」と冒涜の「涜」。ともに,教科書や一般の出版物などでは,森*鴎*外,冒?と書かれるのが通例で,この字形には,違和感を覚える人も多いようだ。現在審議が進行している第21期国語審議会でも,この間題を看過することができず,何らかの解決の方向性を求めて,鋭意審議が行われている。JISを所轄する通産省工業技術院でも,今回の改訂に当たっては,この83JISでの改訂の問題にも,真剣に取り組み,問題点の正確な把握を行った上で,包摂という概念を導入して,同一コードでのいわゆる旧字体出 力の可能性に道筋をつけている。この点に関しては,今回の改訂の問題点として,後述する。
JIS漢字全般に関する問題。現在のJIS漢字では,表現できない人名特に姓が多く存在する。たとえば,「富」と「冨」といったように,人名に頻出する異体字をかなり多く拾っている一方で,「高」はあって「*高*」がないとか,「吉」があって「*吉*」がない などの.不整合が目立つ。これは,規格そのものの性格付けにも大いに関係がある。
問題の所在は,固有名詞,特に人名の姓に関わる異表記,いわゆる異体字をどのように扱うか,という点にある。今回のJIS改訂に当たって,工技院が用意した調査資料をみても,78年の制定当初から,JIS漢字が人名表記を重視していたことは疑いを得ない。異体字と一くくりに述べてきたが,人名に用いられる異体字には,いわゆる俗字と明らかな誤字が混在している。なおかつ,漢字の生産性の高さ(新しい字を作る潜在的な機能)からいって,このすべてを列挙することは,とうてい不可能なことだと思われる。法務省の指導の下,各地方自治体では,着々と戸籍の電子化の作業が進みつつある。この現場においても,法務省が容認した字形をJISの規格票でカバーすることは到底不可能なことだ。JIS漢字が情報交換用のものであるなら,転居等に伴う諸手続の電子化もふまえて,やはり人名の問題に対して.一定の解決を与える必要があるだろう。
問題点を一言でまとめると,現在のJISは,特に人名に用いられる漢字に関して,実体にそぐわない点が多くある,ということである。
ここで制定に関わった人々の名誉のために強調しておくが,JIS漢字は,制定された当初の目論見を離れて,意図せぬ用途に使われてきたきらいがある。
78年にJIS漢字が制定された際,現在のような家庭やオフィスで専用ワープロやパソコンが使われ,年賀状の宛名書きにおいて,手書きに取って代わることを関係者が予想していたとは,想像しにくい。規格とは往々にしてこのように当初の意図を越えて利用される運命にあるとはいえ,現在の混乱の責任を当時の規格策定の関係者に帰すのは,酷というものだろう。

97改訂の問題点
今回の改訂では,文字とコードとの対応はいっさい変更しなかった。いったん割り振られたコードを変更することによる社会的損失の大きさを痛感した結果と思われるが,この点は高く評価できる。また,いわゆるシフトJISを実装規定として,規格に取り込んだこともデファクトスタンダードの規格化の流れとして評価できる。
問題は,包摂にありそうだ。筆者としては.この問題に対して性急な評価を下すことは差し控えるが、区別する手段の提供を放棄して,同一視することのみを提唱した今回の改訂は,混乱に拍車をかけるおそれがある。

いわゆる第3水準,第4水準について
現在,工技院では,新しい漢字コードの策定が進んでいる。これは,特に人名,地名に重点を置いて,現在一般に用いられているものと,教科書等に出現するものを合わせて,網羅しようとするものだと聞いている。JIS漢字の大きな用途の一つに人名,地名があることを見据えて,現在のシフトJISの仕組みの上で高度な解決を図ろうとする姿勢は,敬服に値する。問題が存在するとすると,包摂で同一視した漢字の弁別と,一般人の人名に対する素朴な思い入れに,どのように折り合いをつけるか,という辺りにありそうだ。また,論理的な整合性を求めるあまり,再度実状にそぐわない形での規格が制定され ることがないように祈りたい。

カテゴリー: デジタルと文化の狭間で, 文字コードの宇宙, 旧稿再掲 パーマリンク

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です