bit別冊『インターネット時代の文字コード』(あとがき)

《愚者の後知恵》bitの最後の別冊。この後書きを書いた時期は、ぼくの文字コード標準化への係わりという点でも、大きな転換点のさなかだった。
ここでは、曖昧な形でしか書いていないが、この時期から、2004年初頭まで、ぼくは、JIS X 0213を表外漢字字体表の主旨を反映するように改正する委員会に幹事として係わることとなる。しかし、それは、また別の話。

 

2001年4月

bit別冊『インターネット時代の文字コード』

2000年12月8日、第22期国語審議会は、期答申を文部大臣に提出して、国語調査会も含めると明治以来**年に渡る国語施策への関与の幕を閉じた。
その一日前に、2000年12月7日、ISO/IEC JTC1/SC2/WG2/IRGは、ISO/IEC 10646-2 JCS Unified Ideographs Extension-BのDraft Internasitonal StandardのIRGとしての最終稿をISO/IEC 10646-2のエディターに付託することを決議し、20001年6月に香港で再会することを約して、予定よりも一日早く審議を終了した。

清水国語審議会会長が文部大臣に、答申を提出しているころ、ぼくはソウル郊外のホテルの一室で、bit別冊『文字コード』にSun Microsystemsのヒウラヒデキが寄せる原稿をせっついていた。

20世紀の掉尾を飾る記念すべき年の瀬に、ぼくは「日本の符号化文字集合と社会」と題する原稿を書こうとしている。

以下は、偶然の成り行きから符号化文字集合の標準化活動に係わりを持った一個人の現在(いま)から振り返ってみた、日本の符号化文字社会、就中国際社会との係わりに関する、雑感である。

第21期国語審議会は、1996年(平成8年)7月、第20期の答申を受ける形で、常用漢字表外字の字形問題および敬語の問題を主たる議題として、審議を開始した。
中でも、新聞や放送等のメディアは、ワープロ等に現れる字形と教科書等で教えられる字形との相違を、取り上げ、いよいよ国語審議会がこの問題にメス入れる、といったややセンセーショナルな扱いで報じた。
この期の委員として、最年少の俵真智委員とともに、(おそらくは男性として最年少の)浮川和宣ジャストシステム社長も名前を連ねていた。
浮川社長は、初回の委員会に、所用で出席することができず、当時ジャストシステムに在籍していたぼくは、文化庁担当者の許諾を得て、報道席の片隅で、委員会を傍聴した。
委員会の終了後、浮川社長からのインタビューを目論んでいた放送記者の一人から、ぼくは、浮川社長の身代わりとしてインタビューを受ける羽目に陥った。

そこでの質問の一つ。
「JISの字形と教科書の字形の違いが云々されていますが、情報機器で文字や言葉を扱う立場から、この問題をどのようにお考えになりますか」
ぼくの答えの概略。
「もちろん、この問題は非常に重要な問題で、だからこそ国語審議会で審議されることにもなったのでしょうし、メーカーとしても、出来る限り早く、国としての方向性を出していただき、いい方向で解決が図られることを期待しています。ただ、一言申し上げておきたいのは、最初のJIS漢字を作られた方々は、おそらく一般社会の中で今のような形でJIS漢字がこれほどの影響力を持つとはお考えにならなかったのではないでしょうか。現在の混乱の原因の一つは、JIS漢字が、その制定当事者の想定していた利用目的を遙かに越える形で、広く使われるようになったことにもあると思います。その混乱の責任を、制定当事者に帰すような報道、発言は、是非とも慎んでいただきたい。」
最後の部分が、ニュース等で放映されたかどうかの記憶は、ぼくにはない。

ここで、JIS漢字として言及しているのは、JIS X0208。言わずと知れた「情報交換用符号化文字集合」のこと。混乱として、指摘されているのは、この規格の1983年版が、最初の1978年版(制定当時はC****)から大幅な変更を伴う規格改訂によって引き起こされた混乱のこと。
規格それ自体の変遷については、別項で安岡**氏が言及されているので、ここでは深く触れないが、様々な方々の発言、JIS X0208:1997の解説などを総合すると、当時のJIS原案作成委員会は、国の国語施策の流れと世の中の漢字字形に対する捉え方の変化を予測する形で改訂作業を行ったが、流れはその予測とは異なる方向に進んだ、と言うことのようである。端的に述べれば、(この当時から現在に至る)社会は、簡略化を伴う漢字字形の変化に対して思いの外保守的であった、ということになろうか。

そして、最後の部分での、混乱の責任云々という言及は、そのころ巷間喧しかった
「日本文化の根幹たるべき漢字の使用が工業規格ごときに左右されるとは何事か」
といった風潮のJIS批判、ISO批判に対する、ぼくなりのささやかな抵抗であった。
この部分を、もう少し詳しくパラフレーズすると、以下のような趣旨となる。
一つ。
まず、当初のJIS漢字は、あくまでも、「情報交換用符号化文字集合」として作られた。規格票にもあるとおり、そこでは、例えば、文学作品の創作に、「情報交換用符号化文字集合」が用いられることは、想定されていない。いわば、(規格票を読みもせずに)規格のスコープ外の議論を吹っかけられているように思われた、ということ。
二つ。
当初の規格が想定していた利用領域から逸脱した使用が発生したことを認識した上で、なお、規格に対する要望があるのであれば、ヒステリックで声高な抽象的非難ではなく、具体的な形で提示して欲しい、ということ。(このことは、別のところに詳しく書いた。平凡社本)

このようにして、ぼくの国語審議会、文化庁文化部国語課国語調査官の方々との係わりが始まった。
以後3年、ぼくは折に触れて国語審議会総会を傍聴し、一度などは、漢字問題を扱う部会で、ユニコードについての説明まで行うこととなった。

文部省文化庁が所轄する国語審議会が、通産省工業技術院が所轄するJIS規格に係わる問題に、正面からかつ真摯に取り組んだことも画期的なことであれば、以下のエピソードに代表される工技院の対応も、また画期的なことのように、ぼくには思われる。

たしか、ぼくがユニコードについての説明を行った委員会の席だったと思う。委員のおひとりだった井上**氏が、「JISに係わる問題を審議しているのに、(工技院の)JIS担当者がいないのはおかしい。フェアではない」という発言をされた。
文化庁担当者の対応も早かったが、それに応じて担当者を審議の場に出席させることとした工技院の対応も、また迅速であった。
爾来、工技院の担当者は、国語審議会の審議過程を、ぼくと同じように報道関係者席から、常に見守ることになった。

1999年5月、ぼくはIRGの会議のため、香港にいた。
そして、同じころ、JIS X0213の審議をしていたJCS委員会は、この規格に採録する文字のレパートリーを、ほぼ決定しようとしていた。
この時のIRGに、すでにかなり作業が進んでいたExtension-Bのレパートリーとして、香港と台湾、中国が、突如、かなりの数の新しい漢字を提案してきた。ぼくたち、日本の代表団は、(あまりフェアなこととは言えないが)これらの尻馬に乗る形で、X0213に含まれており、CJK Unified Ideographおよび同Extension-Aとの対応付けの取れない文字を、Extension-Bに追加収録することを提案し、若干の条件付きながら、承認を取り付けることに成功した。
思えば、これが、ISO/IEC関連の審議の場、Unicode Techinical Committeeでの議論の場で、X0213との係わりに振り回される端緒となった。

経緯の委細は記さない。標準規格策定の現場が、個人や組織の主張と利害がぶつかり合い、駆け引きと妥協が渦巻くすぐれて人間くさい営為の積み重ねである、ということを記憶しておいていただければ十分であろう。
その上で、本稿の主題である規格と社会との係わり、という点では、X0213をめぐることどもは、いくつかの大きな教訓を残したと思う。
一つ。
規格の制定とその実装とは別物である、ということ。
規格の制定直前になって、X0213に含まれる実装規定部分が、規格本文から参考に変更された。
このことの背景には、文字コードを巡る環境が、規格原案を検討し始めたころと、規格制定の時期とで大きく変化していたことが挙げられる。具体的に述べれば、Shift-JISエンコーディングからUnicodeへのかなり急激な変化。
X0213の原案策定作業が大詰めにさしかかったころ、新聞などで以下のようなコメントや言及を読んだ。すなわち、

  • 「マイクロソフトは、JIS X0213のレパートリーが、Unicodeに採録されるまでは、実装を行わない」
  • 「アップルコンピュータは、JIS X0213のレパートリーを、独自の観点から整理し直し、基本的にはUnicodeの枠組みの中で、順次実装していく」

このことは、(日本の)マイクロソフトやアップルコンピュータなどが、レパートリーとしてのJIS X0213を評価しながらも、実装方法としてのShift-JISは視野に入れていない、ということを如実に物語っていた。
実際、X0213の策定が始まった1997年ごろは、まだ、Unicodeの影響力は、それほど大きなものではなかったと思われる。マイクロソフトのWindowsも従来のコードベージの考え方を引きずっており、アップルコンピュータも、Shift-JISの枠組みの中で、さまざまな工夫を凝らしたプロ用の漢字レパートリー実現技術を模索していた。ハードウエアとしての専用ワープロも一定のシェアを持っていた。
しかし、その後の変化は、劇的なものがあった。
Javaが、XMLが、Windowsが次々とUnicodeをデフォールトのCoded Character Setとして採用し、世界は一気にUnicodeに傾斜していく。
そうした中で、日本のハードウエアヴェンダーは、Coded Character Setとは不可分であるO.S.に関する主体的決定権をもはや維持することが出来なくなり、地球規模企業の市場戦略の一部としてのO.S.の地域化(Localization)としてしか、日本の文字のレパートリーを位置づけてもらえない位置に追い込まれてしまう。
確かに、Shift-JISで作られた膨大な情報の蓄積があり、さらにそれを上回るであろう、メインフレームを用いた専用システム上での情報の蓄積があるにも係わらず。
いや、むしろ、市場は、屋上屋を重ねる形での新しいShift-JISへの移行ではなく、全く別物であり世界の趨勢となりつつあるUnicodeへの移行を選んだ、と言うべきか。

X0213は、レパートリーとしては非常に高く評価されたにもかかわらず、その当初の目論見であったであろう、そしてレパートリーの選定とは不可分であるはずのエンコーディングスキームとしてのShift-JISとは、切り離される形で、社会から受容されることとなった。
二つ。

  • これも、最初の問題と関連する。世界は、X0213をどう見たか。
  • 日本におけるJIS X0213の規格制定は、UTCでも大きな話題となった。JIS原案策定の委員会から、UTCやISO/IEC JTC1/SC2に対応する米国のナショナルボディに相当するL2に対してUnicodeへに採録を要請するレターが行ったこともあり、感情的な反発も含め、その取り扱いについては、多くの議論が交わされた。

そうした中で、特に強く印象に残ったのは、マイクロソフト、アップルコンピューター、IBMなどの地球規模企業の代表が、どのような形で取り扱うかは措くとして、UnicodeとJIS X0213との相互互換性の確保を、ある種“至上命令”もしくは“既定事実”として考えていることであった。
この議論の過程で、”Round Trip Conversion”と”Around the World Trip Conversion”という言葉が、いわば符丁として多用された。
前者は、JIS X0213であるコードを付された文字をUnicodeのコードに変換し、それをまたJIS X0213に戻したときに、もとのコードに戻る、という“往復”の互換性を確保しよう、というもの。
後者は、例えば、JIS X0213であるコードを付された文字をUnicodeのコードに変換し、さらに、Unicodeのコードから、GBKに変換する。それを、また何らかの方法で、JIS X0213のコードに戻したときに、元のコードに戻る、という経路に係わらず“世界一周”での互換性を確保しよう、というもの。
本誌の読者は、すでにお見通しのことと思われるが、ISO/IEC 10646-1:1993とここに記載されている各国/地域の規格との間には、(対応関係が明記されている場合に限ってではあるが)”Around the World Conversion”が保証されている。そして、UCS開発の際には、各ローカル規格との間の”Round Trip Conversion”を確保するためのものとして、CJK Unified Ideographsに関して、Source Code Separationという原則が採用され、さらに、それでも救いきれない状況に対応するために、CJK Compatibility Ideographsが用意された。
今回、UTCがJIS X0213にどう対応するか、という議論は、規格制定当時からの、”Round Trip Conversion”と”Around the Trip Conversion”の議論が、Unicodeという規格の市場性という点から、未だに非常に重要な論点となっていることを明らかにした。
Unicodeに参加している地球規模企業の立場を端的に纏めると、以下のようになるのではなかろうか。

  • Unicodeのコードポイントが膨張することは、開発コストの点も含めて、好ましいことではない。
  • ある程度以上の市場規模を持つローカル規格に関しては、その規格が持つ市場を取り込むために、”Round Trip Conversion”は、欠くことが出来ない。その際、”Around the World Conversion”は、視野に入っていない。

UTCに参画している地球規模企業にとって、JIS X0213は、あくまでの市場確保のために対応を余儀なくされている局地的な問題でしかないのではないか。UTCの場で、議論に加わっていたぼくの率直な感想である。

日本の国内事情と、UTC傘下の地球規模企業の事情は、奇妙なところで利害が一致する部分があった。いわば、同床異夢といった塩梅で、JIS X0213のレパートリーは、かなり強力かつ迅速にUCSに取り込まれることとなった。
委細は略するが、現時点で、漢字に関しては、ISO/IEC 10646-2のExtension-BおよびISO/IEC 10646-1:2000の補遺に含まれるJIS Conpatiblity Ideographsとして、非漢字に関してもISO/IEC 10646-1:2000の補遺の中のさまざまな場所に、採録することで、ほぼ決着が付いたと言えよう。

2001年4月から、国語審議会の答申を受けて、JIS規格の改訂を検討する委員会の審議が開始される。この委員会には、国語審議会委員として、答申の審議に深く係わった方々の参画もあるやに聞いている。また、JISの原案を策定する委員会と、ISO/IEC JTC1/SC2に対応する国内委員会との、合同委員会発足のプランも進んでいる。

一ユーザーとして外から見ていた標準規格は、“既定の事実”、“天から降ってきた金科玉条”といった塩梅で、いわば盲目的に遵守すべきものである、という印象が強かった。
ふとしたきっかけで、文字コードの開発現場を垣間見てみると、標準規格も、人間が作るものであり、時代と社会の制約の中で、さまざまな矛盾を内包せざるを得ないものであることが分かってきた。
そして、一度制定された規格も、時代と社会の要請の中で、その役割が変貌していくことも、身をもって知ることができた。
だからこそ、JIS規格にもISO規格にも、5年ごとの見直しと、改訂、廃止の議論が制度化されている。

第21期国語審議会開始の際に、ぼくが述べた考えは、今も変わってはいない。標準規格の開発に係わっている人たちは、意見の相違や利害の相違はあっても、みなが自らの業務や教育、研究の時間を割いて、ボランティアで係わっている。そして、標準規格が広い意味で社会全体の利益となることを願っている。それだけに、自分たちが開発に係わった標準規格が、社会の要請に応えることが出来ず、いわば店晒しとなって実装されることもなしに、ひっそりと廃止されることは、出来ることならば、避けたいと思っている。
だからこそ、エンドユーザーも含め、標準規格の利用者は、標準規格に対する要望を、可能な限り具体的な形で声にしていただきたいと思うのだ。

この別冊bitも、bit本誌の休刊に伴い、当面“最後”の別冊になると聞いている。
編者の一人として、この別冊が、文字コード規格のユーザーが、その要望を具体的な声とするための一助となれば、これに勝る喜びはない。

カテゴリー: デジタルと文化の狭間で, 旧稿再掲 パーマリンク

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です