パソコンと漢字処理
戸口民也
1999年10月26日 開設
2001年10月3日 改訂
2003.12.8. リンク先・情報更新
2008.6.30. 情報更新
- コンピュータで処理できる漢字の数は1万なにがしでしかありませんでした。最近になって普及するようになったUnicodeでは、中国・韓国・日本の漢字を悪く言えば「ごちゃまぜ」にして3万数千字が使えるようになりましたが、それでもたとえば日本史・日本文学研究、あるいは中国研究などの専門分野で使用するには十分ではありません。コンピュータを使いたいと思っても、コンピュータで使えない漢字が常に残っているため、それがコンピュータ処理の大きな妨げになっていました。
- 地名・人名などが含まれるデータベースを作る際も、やはり漢字の絶対的不足に悩まされています。
- そんな時は、次のような解決策があります。まだ完全な解決までに至ってはいませんが、日本・中国・台湾・韓国などで使われている漢字なら古代から現代に至るまでのほとんどすべての漢字をとりあえずはパソコンで扱えるようになります。
「今昔文字鏡」(こんじゃくもじきょう)を使う
-
「今昔文字鏡」については文字鏡Netを参照してください。文字鏡Net日本語サイトに直接とぶこともできます。
- 「今昔文字鏡」とは、「漢字の成立から現在まで、今昔のすべての文字と文字を繋ぎ、互いの関係を網 のように連結した、あらゆる視点からの検索が可能な漢字文化圏を網羅する漢字検索字典」です。次のようにも紹介されています。
文字鏡Netは、文字鏡研究会が運営するWebサイトです。当研究会の成果 である、漢字検索システム「今昔文字鏡」の紹介と、TrueTypeフォントの無 償配布などを行っております。
収録文字数は、驚きの9万字
最近ようやく実用的になってきたUnicodeのCJK漢字はもちろん、諸橋大漢和辞典収録の約5万字の漢字もすべて収録されています。更に、古くは甲骨文字から、現代中国で使われている簡体字まで、多種多様な文字が収録されています。
- いきなり漢字のことになりましたが、まずは自分が使っている文字から考えましょう。
- 文字がないのでコンピュータが使えなかった(使ってはいても苦労の連続だった)国語・国文関係者、中国語関係者、日本史・東洋史関係者には強い味方になりそうです。学校・官公庁・企業関係でも、地名・人名の入力には大助かりですね。
- なお今昔文字鏡の利用法およびコンピュータと漢字については次の本を推薦します。
- 『パソコン悠々漢字術 2002』(紀伊國屋書店、252円、2002年)
- 文字鏡フォント自体はフリーウェアですが、実際に日常的に使うようなら「今昔文字鏡」製品版(紀伊國屋書店)を手に入れた方が便利です。
「超漢字」(ちょうかんじ)を使う
文字コードについて知るために
- 伊藤英俊『漢字文化とコンピュータ』(中公PC新書、780円、1996年)
コンピュータを使って仕事をするようになると、「文字コード」についての知識が必要になります。日本語・漢字処理の問題だけでなく、コンピュータと言語の関係を考えさせる好著です。
- 加藤弘一『電脳社会の日本語』(文春新書、710円、2000年)
「文字コード」についてもう少し詳しく知りたいと思う人は、この本をぜひ読むことです。
「文字コード」とは何か−その基本的な考え方−から、国際文字コードとしての漢字、文字コードにおけるグローバル・スタンダードの問題などが取り上げられています。文字の処理は文科系のコンピュータ技術の基本です。つまり、コンピュータを使って仕事をしている我々すべてに関わる問題といえるでしょう。
とくに漢字処理や多言語処理で頭を痛めている人には必読書といえるでしょう。
加藤さんのWebサイト「ほら貝のなかの
文字コード問題を考えるにもどうぞ。
- 清水哲郎『図解でわかる文字コードのすべて』(日本実業出版社、2700円、2001年)
「文字コード」の基本を説明しながら、難しい漢字や英語以外の外国語をコンピュータで使うにはどうしたらよいかも紹介する、実用書。上の2冊は理論編だとすれば、これは応用編といったらよいでしょう。
コンピュータを使いこなすようになると、実際に使用できる文字にいろいろと制限があることがわかってきます。
- JISコードには6000字あまりの漢字しか収録されていない。人名や地名、日本の歴史や文学で登場する漢字が使えない。
- WindowsとMacintoshで書類のやりとりをするとき、一部の文字が化けてしまう。
- 電子メールやインターネットのホームページで文字化けが起こる。
- 英語以外の外国語を使うにはどうしたらよいか? フランス語、ドイツ語などの西欧言語の場合は? ギリシャ語やロシア語は? アラビア語、ヘブライ語、中国語、韓国語は?
- 日本語と、これらの外国語が混在する文書を書くにはどうしたらよいか?
これらの問題には、すべて文字コードが絡んでいます。ところがこれまで、文字コードについて初心者にもわかるように解説した本がほとんどありませんでした。
本書は、初心者にも理解できるように図表や画像を多数用いながら、文字コードのことをわかりやすく解説しています。それだけでなく、上にあげたような問題で悩んでいる人に、現時点で可能な解決手段を提示してくれてもいます。
その他にも、次のような人たちに本書を推薦したいと思います。
- コンピュータでどこまで文字が使えるか知りたい人
- 英語以外の外国語を学んでいる/使っている人
- 多言語処理に関心のある人
長崎外国語大学の学生は、全員「英語以外の外国語を(も)学んでいる/使っている人」に該当しますから、迷わずこの本を読むように!
- 「文字コードをめぐって(文字講堂)」
南堂久史さんのサイト。「このホームページでは、文字コードについて述べます。特に、JISの新規格 ・ 略字 ・ 異体字 ・ 機種依存文字 ・ ルビについて。」(南堂さん自身によるページ冒頭の紹介)
「他の人のホームページ」(リンク集)も参考になります。
-
euc.JP
伊藤隆幸さんのホームページ。「フォントデータ」「文字コードの話」「従来の文字コードとUnicodeの対応に関する諸問題」など、文字コードやフォントの問題に関心を持つ人にお薦めします。
戸口ホームページに戻る