ホームページに日仏混在テキストを載せる方法

戸口民也

1999年12月13日 開設
2001年10月18日 改訂
2003年 8月14日 改訂
2003年12月 8日 改訂


コンピュータで日本語とフランス語(というよりも英語以外のすべての言語)とを混在させるのは昔からの大問題で、残念ながら現在でも根本的な解決には至っていません。
アクサンやセディーユがちゃんとついたフランス語と日本語が混在する文章をホームページに載せるにはどうしたらよいか? 今から紹介します。

  1. 文字コードを「 Unicode(UTF-8)」に設定して文書を作成する

    日本語とフランス語を無理なく共存させる方法としては、現時点ではこれが最善の方法だと思います。

    この方法を使うと、日本語の「漢字」や「かな」と、フランス語のアクサンやセディーユ記号つきの文字が混在する文書が、一つの文字コードの中で処理できます。ですから、これがもっとも基本的な解決手段といえるでしょう。ただし、Unicode(UTF-8)を扱うことができるテキスト・エディタやHTML文書作成ソフト(ホームページ作成ソフト)が必要となり、また文字コードの知識も要求されます。
    また、ブラウザ(Internet ExplorerやNetscapeなど)の種類やVersionによってはUnicode(UTF-8)のテキストが表示できないこともありますので、ご注意ください。 市販されているホームページ作成ソフトのほとんどは、日本語(外国語はかろうじて英語だけ)しか事実上扱えないものばかりのようです。私自身で確認したソフトの数は限られているのですが、調べた限りにおいては、フランス語の入力をサポートしていなかったり、Unicode(UTF-8)での保存ができなかったりで、日仏混在テキストには使えないものが多いです。

    HTML文書作成ソフト(ホームページ作成ソフト)のなかで、日仏混在テキストが問題なく扱えるのは、私自身が確認したものでは以下のものがあります。

    これらのソフトを使うと、ワープロに近い感覚で、そのまま日仏混在文書を書くことができます。
    もちろん、Word などで書いてから、それを Copy & paste することもできます。

    テキストエディタを使ってHTML文書を書く/再処理する本格派には、

    がお薦めです。Unicodeテキストを扱うことができ、またアクサン記号つきのフランス語の検索/置換処理も問題なくできるので、私自身は数年前からもっぱらこれを愛用しています。

    文字コードを「 Unicode(UTF-8)」に設定するには

    なお、高橋 誠さんのサイトWindows 2000上でのUTF-8のページの作り方(「UTF-8NとUTF-8とBOM」もこの中にあります)は大変参考になりますので、インターネット・ホームページで多言語テキストを載せたいときは、このページを参考にしてください。WWWページ作成についても役に立ちます。

  2. 文字コードの設定はとくに気にしないで、ソフトにまかせる

    文字コードを「 Unicode(UTF-8)」に設定しなくとも、そのまま保存するだけで、とりあえず日仏混在テキストが表示できるようになるソフトがあります。

    上に紹介したソフトのうち、「 Frontpage 2000 」「 Netscape Composer ( Netscape 6.1)」の2つは、文字コードを変更しないをまま(=標準では日本語 Shift-JISに設定されています)保存しても、とりあえず「それらしく」表示されます。
    どちらもブラウザは Windows版 Internet Explorer 6 と Netscape 6.1 で確認しました。
    ただし、他のversionは未確認です。Macでも未確認。

  3. フランス語の部分の表示フォントを指定する

    HTML 文書の文字コードは日本語( PC では Shift JIS が標準)を選ぶが、フランス語の部分には「 <FONT FACE="Times New Roman,Courier New,Times,Courier">(フランス語テキスト)<font>」というタグをつける。具体的にはこちらを見てください

    Times New Roman:Windows用欧文フォント(プロポーショナルフォント)
    Courier New:Windows用欧文フォント(固定ピッチフォント)
    Times:Macintosh用欧文フォント(プロポーショナフォント)
    Courier:Macintosh 用欧文フォント(固定ピッチフォント)

    WindowsとMacの両方に対応しようと思えば、この4つを指定すればよいでしょう。 Times New RomanとTimesの2つだけでもとくに問題はないはずです。

    付記(2003.12.8.):
    Internet Explorer 6.0 と Netscape 6.1(いずれも Windows 版;Macintosh 版は未確認)では、上のように「 <FONT FACE="・・・」などのタグをつけなくとも、アクサンつきの文字をHTML独特の&(アンパサンド)と;(セミコロン)の間にeacute、egraveなどと記述する書式を使って書くだけで、日仏混在(=日欧混在)テキストの表示が可能になっています。

    あるいはEmEditorのようなUnicode(UTF-8)を扱うことができるテキスト・エディタで日仏混在文を書き(日仏混在文の例)、ごく簡単なHTMLの書式(書式の例)をした上で、HTML文書化(HTML文書化の仕方の例)してから、ファイルの種類は「HTML」(ファイル名に .htm という拡張子をつけるのを忘れずに!)、文字コードは「UTF-8」で保存(保存の仕方の実例)すると、日仏混在のHTML文書ができあがります。
    なお、保存の仕方については、詳しくは上に紹介した「1.文字コードを「 Unicode(UTF-8)」に設定して文書を作成する」の最後の「文字コードを Unicode(UTF-8)に設定するには」→「EmEditorの場合」を参照してください。

    ただし、このこの方法を使おうとすると、文字コードや HTML 文書に関する知識が要求されますし、Unicode(UTF-8)を扱うことができるテキスト・エディタが必要となります。

    初心者には難しすぎるでしょうが、中・上級者なら少し慣れると、簡単にできるようになります。

  4. Microsoft Word で文章を書き、「Webページとして保存」を選択する

    これがもっとも簡単な方法です。初心者でも簡単にできます。

    ただし、私自身はこの方法を好みません。(ソースを表示するとぞっとします! ただし、これは個人の好みの問題ですから、気にしない人には問題ないでしょう。)

    なお、Word 以外にも「Webページとして保存」(HTMLで保存) が可能なソフトがあると思いますが、日仏混在テキストの処理ができるかどうか分かりません。どなたかご存知でしたらお教えください。

結論

初心者には4または2の方法が簡単です。

中・上級者には1をお薦めします。また、初心者でも「きれいな」テキストにこだわる方には1をお薦めします。


Unicodeについて

 私は個人的にはUnicodeに全面賛成というわけではありません。多言語という観点からは、まだ不十分なコードだと考えています。
 日本語に即して言えば、確かにUnicodeでは処理できる漢字の数は大幅に増えましたが、中国・台湾・韓国などで使われている漢字との区別が明瞭にできません。だから、たとえば日本語と中国語が混在するテキストを処理するとき、どこからどこまでが日本語で、またどこからどこまでが中国語であるか、人間の目でいちいち確認するほかないという不都合が生じてきます。
 日本文学、日本史、中国文学、中国・東洋史などを専門とする人がコンピュータで漢字の処理する場合、現時点ではむしろ「今昔文字鏡」を使った方がよいのではないか、と私は考えています。
 Unicodeが今後さらに改善されることを一方では期待していますが、「今昔文字鏡」がすでに発表され、普及する気配を示しています。「今昔文字鏡」を組み込みつつ、Unicodeとの互換性あるいは統合をも視野に入れた本格的な「多言語OS」と「文字コード体系」が開発されれば、と願っています。
こうした点にもしも興味がおありでしたら、私のページ

「パソコンで漢字を使いこなす/文字コードの問題」

および、私のおすすめサイトのなかの「コンピュータと言語(多言語)」をご参照ください。とくに加藤弘一氏の「文字コード問題を考える」は大変参考になります。

南堂久史さんの「文字講堂」もどうぞ。


御意見や有益な情報がありましたら御連絡ください。


戸口ホームページに戻る