国際符号化文字集合 多言語環境への試み

国際符号化文字集合
多言語環境への試み

《愚者の後知恵》本稿は、2001年3月9日、10日の両日、フランスのユネスコ対応委員会の主催でパリで開催される「情報社会における言語の多様性(Language Diversity in Information Society)」と題されたコロキウムにおける発表の予稿である。このコロキウムには、東京大学の西垣通さんの紹介によって参加した。
2001年3月
Unesco Paris

本論では、情報技術分野における標準化活動、特に、私が係わってきた言語文化に依存する分野における、互換性を維持することと国際的な協力の重要性を、自らの経験に基づいて論じたい。

【汎アメリカ主義症候群】
最初は、自分のいくつかの体験から話を始めたい。
現在、私はISO/IECの文字コード標準を制定する委員会の活動に係わっている。そのきっかけになったのは、以前勤めていたソフトウエアヴェンダーが日本の企業としては、唯一かつ初めてのフルメンバーとして、ユニコードコンソーシアムに参加したことによる。
直接の上司だった会社の副社長であり共同創立者であり経営者の妻の指示により、私はユニコード技術委員会に、唯一の日本人として参加するようになった。
ユニコードというのは、世界中のあらゆる文字をコンピューターやネットワークで使えるようにするために、一意な文字コードをつけようといういわばバベルの塔のような壮大なプロジェクトで、さまざまな経緯はあったが、現在では、ISO/IEC 10646というISOとIECの合同規格と表裏一体のものとして、制定とメインテナンスが行われている。
ユニコードを制定しているユニコードコンソーシアムは、アメリカの西海岸に本拠をおくIBM、アップルコンピューター、マイクロソフトといった地球規模企業が中心になって運営している。技術委員会は、ユニコードコンソーシアムの中で、ユニコード規格の内容に責任を持っている。
私がUTCに参加して、最初に驚かされたのは、この会議が、ISO/IEC JTC1/SC2に対応する米国のナショナルボディである、NCITS/L2(the National Committee for Information Technology Standards L2)と合同で行われていたことだ。決議もUTCとしての決議とL2としての決議の区別さえされていない状態だった。おどろいた私は、おずおずと手を挙げて、通訳を通して、このことに抗議を行った。
「ユニコードは、国際的なコンソーシアムではないのか? それに対して、L2は、合衆国内の組織のはずだ。私は、日本のジャストシステムの代表としてこの会議に出席しており、ユニコードの意志決定には参加できるが、合衆国の意志決定には係わりはないはずだ」メンバーの対応は、さらに私を驚かせた。
彼らは、異口同音に私に感謝の発言をしたのだ。
「タツオ、指摘してくれてありがとう。」
「今まで気がつかなかった。」
「これからは、UTCとしての意志決定とL2としての意志決定をはっきり分けることにしよう。通常の会議の間は、ユニコードとしての採決だけを行い、最後にまとめて、L2のメンバーだけで合衆国として、採決の再確認を行うことにしたい」
これが、私がUTCで行った最初の貢献となった。

日本に戻ってから、私はこの話を友人の社会学者にした。彼は、すかさずに答えた。
「小林さん、それこそパックスアメリカーナの見本みたいな出来事ですよ」
しかし、パックスアメリカーナの例は、この出来事一つで終わることはなかった。その後、現在に至るまで、私はUTCのアメリカ中心主義に何度も出会うことになる。
なによりも一番大きなパックスアメリカーナの例は、ユニコードに含まれている35余りのスクリプトの中に、そのスクリプトを実際に使っている人が一人も関与することなく、いわば「異邦人」によってだけで規格化されたものがいくつもあることだ。
アメリカは偉大だ、アメリカ人は何でも知っている、自分の母語の研究を専門とする人よりも。

ちなみに、この考えは、アメリカ人だけに限られたのものではない。さまざまな形で、多言語問題に係わってみると、私自身を含めて日本人の中にもパックスジャポニカ的な観念があることも分かってきたし、中国を初めとする東アジアの漢字圏の人たちと議論をするようになってからは、中華思想に往生させられ続けている。おそらくは、ヨーロッパにはヨーロッパで、現代のパックスロマーナがあることだろう。

彼らのパックスアメリカーナをもう少しブレイクダウンして考えてみよう。
じつは、UTCのメンバーの中には、アメリカ生まれのアングロサクソン以外の人間が多くいる。ある人は、ドイツ生まれだし、ある人はオーストラリア生まれ、またある人は、ヨルダン生まれのカトリック教徒。カナダで働いているインド人もいる。最近では、台湾出身の中国人も何人か参加している。
だから、必ずしも、彼らがアメリカの外の世界を知らないということではない。しかし、彼らはアメリカを基盤とする情報技術企業で働いており、それらの企業の技術と繁栄を信じているのだ。場合によっては、彼らの意志決定の存立基盤は、アメリカという国ではなく、自らが属する地球規模企業とそれを支える技術にあるのかもしれない。彼らにとって、アメリカとは、従来の意味での国(Nation State)ではなく、地球規模企業とそれを支える技術の集合体なのではないか。

少し結論を先走りすぎた。話を戻そう。
UTCのメンバーは、自分たちの技術に絶大な自信を持っており、その技術が世界に貢献できると信じている。しかも、彼らは心の底から自分たちの技術が善だと信じており、世界中の出来るだけ多くの人々に彼らの技術の恩恵が行き渡るようにしたいという信念を持っているように思われる。
一方、地球上にはさまざまな言語があり、文化があり、考え方がある。自分たちの価値観と異なる価値観があり得ることへの想像力が欠けているとすると、それはいささか問題ではないだろうか。

【漢字は中国人のものか】
UTCに参加するようになってしばらく経って、私は、ISO/IEC JTC1/SC2に対応する日本のナショナルボディにあたる委員会の委員になった。こうして、私は、UTCにおいては日本の一民間企業の代表として、ISO/IECの会議の場では、日本の代表団の一員として、そして、特に中国、台湾、韓国などの漢字圏の国や地域からの代表で構成され、統合漢字の規格化作業に責任を持つIdeographic Raporteur Group – IRG という委員会の場では、日本の代表団長として活動するという、いくつもの帽子をかぶり分けなければならない立場となってしまった。
ここで、IRGの活動について、もう少し詳しく述べておきたい。
漢字という文字のカテゴリーは、言語の多様性と多言語によるコミニュケーションという点で、非常に興味深い問題を持っている。
そもそも、IRGの前身であるCJK-JRG(China, Japan, Korea Joint Research Group)というグループは、中国、日本、韓国などの漢字圏の国家/地域で使われている漢字コードを、一つのコードに統合して使用することが出来ないかどうか、ということを検討するためのボランティアによる集まりが始まりだ。
漢字は、もともとは中国で使われていたものだが、日本や朝鮮半島、ヴェトナムなど、その周辺の地域にも広がっていった。その過程で、地域や国家の環境や文化の相違によって、少しずつ変化し多様性を増してきた。日本では、漢字を源としながらもっぱら音を表すために使う、ひらがな、かたかななどを生んだし、日本独自の漢字も生んできた。
韓国やヴェトナムでも似たような事情がある。何よりも、中国自体が、簡体字という新しい形を作り出すことによって、漢字の世界に大きな変化をもたらした。
CJK-JRGの当初の目的は、このように多様性を持つようになった漢字を、現代のテクノロジーを用いて統一的に扱うことはできないか、というもう一つのバベルの塔の試みだったのだ。
CJK-JRGの活動は、結論が出ないままに、IRGの活動に引き継がれ、「バベルの塔が建てられるかどうかを検証するためにバベルの塔を建ててみる」といった状況で、現在も続いている。
以下に、漢字の多様性と統合の問題を説明するため、最近議論している例を挙げよう。
現在、元は同じ形をしていた漢字でも、中国本土、台湾と香港、日本と韓国という大きく分けて3つのグループがある。
[fig]
漢字圏の人なら、だれもがこれらが同じ字である、ということは理解することが出来る。そして、規格上は、これらの文字は、同一のものとして、一つのコードが付けられている。
しかし、市場では、中国でビジネスをする場合は、中国風の形を、台湾でビジネスをする場合は、台湾風の形を、日本でビジネスをする場合は、日本風の形を持ったフォントを準備しなければならない。
IRGの会議の席では、ともすると、このような多様性を無視して、コードだけではなく、形も統一しようという動きが出てきがちである。そうならないように、文化的な相違、多様性を受け入れ、相互に尊重しながら、可能な限りの共通点を見つけだし、漢字圏でのコミニュケーションを容易にする環境を作っていくことが、IRGに参加する際の私自身の目標である。

【Dream comes True】
最後の話題に移ろう。
この四五年、私は、国際情報化協力センター(CICC:Center of the International Cooperation for Computerization)という日本の政府関連組織が主宰している、多言語情報環境技術委員会という委員会に委員として参加している。この組織は、名前からも想像できるように、さまざまな形で、特にアジア諸国に対して情報処理技術取得のためのさまざまな援助活動を行っている。エンジニアを招いての研修、各国政府の情報規格担当者間の情報交換のための会議、情報規格制定のための方法論の伝授など。
また、1997年から1999年まで、都合4回MLITというシンポジウムシリーズを行った。このシンポジウムでは、各国の言語、文字に依存したIT技術の状況の報告と、IT技術の地域化では先進地域である日本の、成功と失敗の経験を伝えることを行ってきた。
先にも述べたように、現在のISO/IEC 10646には、おおよそ35の“スクリプト”が含まれている。ヨーロッパの言語を例に取ると、ラテン、グリーク、キリル、アルメニア、グルジア、ルーン、オーガムなどのスクリプトがあり、ラテン文字一つをとっても、英語、フランス語、ドイツ語、スペイン語、ポルトガル語など、アクセント付きの文字も含めて、多くの言語を表現することが出来る。
アラビア文字やインド文字なども、一つのスクリプトのグループで多くの言語を表記することが出来るので、ISO/IEC 10646で表現できる言語の数は可能性としては、数百に及ぶと思われる。
ただし、問題も多くある。
いちばん大きな問題は、すべてのスクリプトについて、そのスクリプトを母語の記述に使う母語話者やその言語の専門家が関与しているわけではないことである。
問題はさらに二つに分かれる。
一つ。
スクリプトの利用当事者もしくは専門家が参画していない場合。
二つ。
あるスクリプトを用いる言語が複数あり、そのすべての言語の母語話者もしくは専門家が参画していない場合。
なぜ、このような問題が起こるのだろう。
一番大きな問題は、国際規格の制定に参加するためには金がかかる、ということだ。
ISO/IECの規格制定に投票権を持って主体的に係わるためには、会費を払ってどちらかの組織に参加する必要がある。世界各地で開催される会議に参加するための旅費は、会費以上に大きな問題となる。
以前、IRGの日本での会議をホストとしてアレンジしたことがある。
四国の徳島にある当日勤めていた会社の本社で会議を行ったのだが、出来るだけ安く泊まれるホテルの確保、朝食の準備など、(物価の高い日本で)参加者の負担を出来るだけ軽くするために、ずいぶん苦労した。幸いに、会場となった会社の食堂に無理を言って準備してもらった朝食は、参加者から非常に感謝された。
しかし、費用以前の問題もある。情報規格制定のプロセス自体を、政府や産業界の担当者が知らない場合が多い。デジュアなものであれデファクトなものであれ、規格でマジョリティを取ることが、情報産業そのものの成否に大きな影響を持つことを考えると、情報規格に関する情報を持っていないことは、その国/地域の産業発展にとって大きなハンディキャップとなる。CICCでも、国際規格についての情報を開発途上国に伝えることは、その活動目的の大きな柱となっている。
東南アジア諸国でも、ITに関する関心は非常に高い。

ヴェトナムのホーチミンシティで行われたMLITの折りのことである。お昼近くになって、午前中の議事が終わろうとしたところで、情報担当大臣である将軍のお声掛かりで、議事には含まれていなかった某地球規模企業がオペレーションシステムレベルでサポートしたヴェトナム語のデモンストレーションが行われた。
その企業の担当者が、恐ろしく流暢な英語でプレゼンテーションを行った。彼の英語は、この会議のどの参加者よりもうまかったに違いない。
しかし、画面に表示されたヴェトナム語は、他国人から見ても決して美しいものではなかった。
将軍は、表示されるヴェトナム語の品質云々よりも、その企業がオペレーションシステムレベルで自国語をサポートしたことそれ自体を喜んでいたのかも知れない。
実際、インターネットブラウザーなどで表示されるラテンアルファベット系以外の文字の品質は必ずしも高いものではない。日本語でさえも、文字レベルではある一定の水準に達しているが、文章として表示したときに読みやすさ、という点では、まだまだ完成度が低い。
なぜそうなるか、ということは技術的には単純なことである。ラテンアルファベットは、そのタイポグラフの設計段階から、アセンダーライン、ディセンダーラインが設定されており、ラインスペースをゼロに設定しても読みやすさを確保できるように作られている。それに対して、日本語をはじめとする漢字圏では、文字は四角い箱一杯にはまるように設計されており、ラインスペースがないと縦組みか横組みかもはっきりせず、とても読みにくくなる。
ところが、通常のインターネットのブラウザーは、欧米の文字用に実装された表示部分を変更せずに日本語にも利用するので、とても読みにくい表示となる。
タイ語なども、4階建ての構造を持っているのだが、これをラテンアルファベット用のシステムを流用して表示しようとすると、とんでもなく不格好なものとなってしまう。
地球上には、多様な文字の体系が存在し、それぞれの文化に根ざした美意識もあるのだが、欧米中心の美意識からはなかなかそれが理解できないようである。

もちろん、こういった文化の多様性に対する配慮を行っている地球規模企業もあれば、個人もいる。
イギリスに住む友人の一人は、複写機のLCDに表示するアイコンの文化依存性を研究しいており、通常は(日本も含め)STOPの意味に使う手のひらを拡げて相手に向けるアイコンが、ギリシャでは相手に対して決闘を申し込むときに使う、という話をしてくれた。そのため、この企業では、ギリシャ向けに出荷する製品では、”STOP”のアイコンを変えているとのことだった。
このような文化の多様性に対する配慮は、ユーザーの満足感を高めると同時に、最終的には企業の利益にも繋がると思われる。

ヴェトナムでのプレゼンテーションのもう一つの大きな問題は、ここで紹介された技術が、米国のレッドモンドにある本社の統一的な方針に基づいて行われたものではなく、この会社の現地組織がいわばアドホックに地域化したものであるらしい、というところにある。日本でも、日本語版のアプリケーションで作った英語やフランス語の文書ファイルが、英語版やフランス語版のアプリケーションとのコンパチビリティが取れない、といった信じられないようなことが多くあった。互換性を無視した地域化は、結局はその技術環境の孤立化を招き、コミュニケーションの非活性化によって、経済的な発展にとってもマイナスの影響を与えることになるのではないか。

最後に、こういった問題の典型的な例であり、数少ない成功例を紹介する。
これは、ミャンマーの当事者からCICCに送られた感謝の手紙である。長くなるが、そのまま引用する。

夢の実現(和訳)
はじめに
この話は、成功の話でも見本とすべき話しでもない。これは単に、私たちの経験をみなさんと共有し、私たちの地域における共同作業の重要性を示すために書かれたものである。 具体的には、ISOスキームの中でのミャンマー文字のコード化に関する経験談を述べさせていただきたいと思う。

背 景
1990年以降、ミャンマーでのPCの使用率は急速に伸びた。そのため、国内におけるPCの普及に伴い、ミャンマー文字処理システムが必要とされるようになった。
1992年より、多くの方言のローカルな実現方法が開発されてきた。しかし、そのほとんどのものは、フォントセットの実現にとどまっており、情報処理の実現の段階まで届いていなかった。さらに、私たちは文字コードが国内的にも国際的にも標準化されるべきであると思ってはいなかった。
1996年に、私は日本の茨城県筑波で行われたシンポジウムに招待された。当時、私はミャンマー語の構造についての発表は出来たが、そのシンポジウムで議論された標準化に関わるほとんどの事項が、私の知識外のことであったと認めざるを得ない。グリフ、文字コードセット、ISO/IEC 10646、ユニコード等の単語は、私が聞いたことのないものであった。電子技術総合研究所が、何かの手違いで私をシンポジウムに招待したのだと思ったほどであった。しかし、私はそれらのことが自分の国で必要であるということ、また私にはシンポジウムで教わったことを自分の同僚に知らせる義務があるということを認識した。
その後、この過去数年で私はさまざまな国のセミナーに参加した。セミナーへの出席をアレンジしてくれたこと、私の非常に遅い成長につきあってくれたことに、国際情報化協力センターや関係の組織に対し、深く感謝の意を表したい。私は、セミナーに出席して帰国した後、学んだ知識を友達に伝え、政府担当者に今後の方針についての提案をする等をしてきた。
このような年月の中、ミャンマーの人々によって、ミャンマー文字のコード化を国際標準にすることが私の夢になっていった。もちろん、当時その夢を実現するのは非常に困難なことであったと認めざるを得ない。なぜなら、当時、私たちには技術も情報も、支持も予算も何も無かったからである。
1997年、私は日本での多言語情報処理国際標準化シンポジウム(MLIT)に参加する機会を得、その場で佐藤氏にミャンマー文字コードが、ミャンマーの人々の関わりもなしにISOの場で決定される段階にあるという話しを聞いた。佐藤氏は、私たちのISO会議の出席を勧め、彼のサポートを約束してくれた。帰国後、私はこの件について政府機関に報告し、標準化事業に携わる委員会を即時に設立することを提案した。
政府はこの件の重要性を認識し、ミャンマー情報技術標準化委員会(Myanmar IT standardization Committee“MITSC”)を設立した。MITSCは、情報技術専門家とミャンマー語の専門家から成り立つ。私たちは、ミャンマー語の国内標準の設置を担当するミャンマー委員会(Myanmar Language Commission)とともに作業を進めた。私たちはベストを尽くして提案書を改訂し、佐藤氏の支援を得てISOに送った。さらに、佐藤氏、三上氏をはじめとする関係者方々の協力を得て、私たちは1998年9月にロンドンで行われたISO/IEC JTC1/SC2/WG2会議に出席することが出来た。

ロンドンでのアドホックミーティング
実は、その時点でミャンマー文字コードは、ISOのPDAMの段階まで進んでいた。ロンドンでの会議は、私たちの意見を表し、私たちの文化や伝統に基づいた提案書の修正を提出するほとんど最後のチャンスであった。ここでまた、私たちは沢山の支援を受け、佐藤氏よりISO会議での議論の進め方につき教わった。私たちは多くの関係者と対面し、1998年9月21~24日の間、幾度ものアドホックミーティングを重ねた。
議論の中で、私たちはいくらかの誤解や反対を受けたものの、議論のすべてはとても生産的であり、実のあるものであったと思う。ISOやユニコードの関係者より、多くのことを学んだ。この点で、彼らの忍耐と私たちに対する理解に大変感謝したいと思う。最終的に、彼らは私たちの技術的、文化的なコメントを受け入れてくれ、その内容をFPDÅMに入れてくれることになった。私たちは出席者のコンセンサスを得ることが出来、またいくつかの点が今後の検討課題として残された。私たちは、FPDAMに基づいたミャンマー文字処理システムを実現することに合意し、ユニコードとISOに対して、その結果についてのコメントを伝えることにした。

<現在の状況
私たちは、合意された文字コードスキームを基礎にしたミャンマー語の処理システムを開発し、実験した。そして、それは私たちが予想したように動くことが認められた。私たちはFPDAMへ更なる修正は不必要であると考えた。私たちは、1999年3月に日本の福岡で行われるISO/IEC JTC1/SC2/WG2に出席し、この結果に対しての議論をする予定である。そこで更なる議論やアメンドメントの提案が出されるかもしれない。そこでの反対意見を解決し、国際規格にするというもう一つ上の段階に進められればと願う。

私たちの夢の実現
ついに、私たちの夢は現実のものとなった。これは大変なサクセス・ストーリーであるとは言えないと思う。しかし、この話しは、ミャンマーの人々と日本の友達との共同の努力によってもたらされた結果であるということは、誰もが認めることであると思う。もちろん、私たちの政府の奨励やサポートが大きな役割を果たした。私は、アジア太平洋地域の情報技術標準化の分野における日本のイニシアティブを感謝したいし、このようなサポートが継続されることをお願いしたい。
最後になるが、私たちの夢の実現に貢献をしてくれた三上氏、佐藤氏、小紫氏、そしてCICCのスタッフに心からのお礼を述べたい。ミャンマーの人々は、ミャンマーの情報技術発展に対する彼らの貢献を常に感謝し、忘れることはないだろう。

ミャンマーコンピュータ連盟 幹部評議会メンバー
ミャンマー情報技術標準化委員会 幹部評議会メンバー
KMDCo.Ltd.専務取締役
タウン・ティン

この手紙の後、日本の福岡で行われたISO/IEC JTC1/SC2の決議と国際投票を経て、ミャンマー文字は、正式な国際規格として、成立した。この福岡の会議には、ミャンマーの代表もオブザーバーとして参加し、提案された規格がミャンマーの人々にとっても満足できるものであるという意見を表明した。また、この経緯を通して、ミャンマーには情報技術の標準化に関与する委員会も設立された。

繰り返すが、これは、数少ない成功した例である。実際には、国家の政治的な思惑や地球規模企業の市場性最優先の戦略によって、当事者の利益とはかけ離れた規格や実装が出来る例が少なくない。

今年の初めに、香港でIRGのメンバーである友人とデジタルデバイドの議論をした。
その時、彼女が言ったことが非常に大きな啓示となった。
よくコンピューターリテラシーとかITリテラシーとかいった言葉を聞く。コンピューターの操作の仕方が分からない、インターネットへのアクセスの方法が分からない、といったことが、情報化時代において新たな差別を生むのではないか、ということだ。
しかし、IT技術が本来目指すべきことは、ユーザーに対してIT技術のリテラシーを求めることではなく、誰もが簡単に使えるような技術を開発した上で、本来の意味でのリテラシーを高めるために役立つことではないか。
一言で述べれば、
「ITのためのリテラシーではなく、リテラシーのためのIT」
ということになる。
以前読んだ、「多言語主義とは何か」という本に、新しいメディアの出現は、言語の多様性を減らす力を持つ、ということが書かれていた。
文字コード規格という、言語の多様性に係わる規格の標準化に係わる人間の一人として、IT技術が地球上のすべての人々がみずから育んできた言葉の多様性を言語の豊かな多様性を損なうことなく、さらに豊かに育てていき、かつ、相互に尊重し、理解し合えるようになることを願うと同時に、少しでも役に立てるように努力を続けたい。

カテゴリー: デジタルと文化の狭間で, 文字コードの宇宙, 旧稿再掲 パーマリンク

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です