続・漢字表記法

Copyright ©1998-2003 Petronius All rights reserved.

2001/08/02 追加 (2001/07/31 公表)

色々と貴重なご意見ありがたうございます。幾つかご意見が出て来ましたので、此処に自分の考へとしてのお答をしておきます。

「字体の美しさ」

関聯があるので、此方に移して書きます。

当方の「何かの日記」のH13-07-27で、「字体の美しさ」とはどう云ふ事を云ふのでせうか。と問合せてみた処、ご返事がありました。

半角英字と云ふのは飽迄半角英字としてデザインされてをります。特に大文字は基本的にベースラインからキャップラインの間でデザインされてゐるため、全角文字と竝べると「基準となる線が浮いて」見えます。

例へば極端なもので言ふと「…その時Sと云ふ人が…」と書いたときに、多くのフォントでは「S」だけが出っ張って見えると思ひます。此れは非常にバランスが惡い、と思ふ譯です。

實體參照なり何なりによって、「全角文字一文字」としてデザインされた「Ⅰ」を使ふ場合は全角文字に溶け込み、違和感はありません。一方、アルファベットの「I」を用ゐた場合は「實體參照→ⅠI←アルファベット」と竝べれば(少なくとも僕の環境では)一目瞭然なやうに、アルファベットの「I」の方が「短く」、他から「浮いて」了ふのがお解り頂けるかと。

『文学室:1997』所載、07/28/2001ピース(畧)・5より

半角英字なり半角数字(此れは通常半角英数字と呼ばれてゐます)は、基本的には「半角」と呼ばれる形式に収めるやうに意匠されてゐます。ですが、意匠は意匠で文字さへ特定できればどのやうに作つても構はない筈ですよね。

偶々半角は1byteで一文字を表し、対する全角は2byteで一文字を表したから、2byte分の文字の広さを使つて英数字より形の複雑な漢字の意匠を施したんだと思ふけれども、如何でせう。

さう云ふ時代の影響が、半角英数字と全角かな漢字との間のフォントの意匠の微妙なずれとか不釣合となり気になる要因となつてゐると理解します。

ただ、此の話は可成り環境に依存して了ふかも知れないので、他のフォントではどうか定かでありませんが…併し、少なくともそれ專用にデザインされたフォントの方が美しいと云ふのは、間違ひないと思ひます。

因みに僕の使用フォントはOsakaです。

『文学室:1997』所載、07/28/2001ピース(畧)・5より

さうなんですよね。環境にも依存しますし、使つてゐるフォントにも大きく左右される状況であると言へます。"Osaka"と呼ばれるフォントは確かマッキントッシュでは標準的なフォントだと聞いてをりますが、詳細は知りません。

「實體參照→ⅠI←アルファベット」英文字のはうは、此方の表示でも確かに不釣合に見えます。実態参照のはうは、羅馬数字の壱ですね。抑々夫々の文字の持つ内容用途が違ふのですから、文字の意匠に対しても差別化を図つたと解釈します。

私は、文字概念が違へば別の文字として区別すると云ふ立場から、意匠として違和感が無いとしても、元々羅馬数字として規定された"Ⅰ"を英文字の"I"として用ゐる事は正しい事だとは言へません。此れは漢数字の「二」がカタカナの「ニ」として使へないのと同じ理由です。

因みに私の使用フォントは「MS Pゴシック」です。

処で、「略/畧」とか「実/實」とか「学/學」とかは如何でせう、此れならば純粋に字体の違ひになります。

日本の文字コード

ご意見を下さつたのは、野嵜さんの闇黒日記と、Fuji. / KONDOU, KazuhiroさんのDiary - Ancient libraryです。

先づ、確認しておくべき事項として一点挙げておきます。此処では表題に示した通り「漢字表記法」を主体に言及してをりますので、ご承知おき願ひます。

ご意見

当方が前回記載した「日本の文字コードとして代表的なものは、JISコード・EUC・シフトJIS・ユニコードです。」と云ふ文章に対して以下のご意見が寄せられました。

JISの定めてゐるのは文字のセットであつて、その實裝が、iso-2022-jp、euc、Shift-JISと云ふ事になります。unicodeも、そのJISの文字セットを(言はば)そつくりそのまま採入れてゐます。

プログラム側での對應がこれまたまちまちである爲に、話はややこしくなるのですが、eucだらうとShift-JISだらうと、IANAに登録されてゐる規格としては「機種依存文字」の類は入つてゐません。ただ、プログラム側で勝手に擴張してゐる例がある、と言ふだけの話です。iso-2022-jpも事情は同じです。

『闇黒日記』所載、平成13年7月29日より

上記の意見に対して、下記の意見が寄せられました。

JIS は文字集合を定めると共に、コードも割り当てています。でなければ、例えば IANA に登録されている X0201 なんて使えませんよね。また、そういう意味で取る場合、JIS 規格の中で JIS コードと共に EUC-JP や Shift-JIS に対しても定義していますので。

ところで、日本の文字コードとして Unicode が挙げられている点へのツッコミはないのでしょうか? あれってば、日本語に限らないものですけど。ちなみに、UCS-2 では Tilda を 3 種類程収録し、その理由として glyph が似ていても意味が違う、という点からなのですが、glyph が違うものは全て収録する、という当初の目的をあっさりと無視してますが。簡字体と繁字体収録しただけで破綻する量のコードエリアしかないのだから当たり前ではありますが。

ではなく。日本語文字コードでは、EBCDIC コード辺りがメジャーだと思いますが。

ついでに、プログラム側で勝手に拡張している訳ではないでしょう。ベンダ定義外字領域に任意の glyph を割り当てているだけですから。問題は、それをユーザが認識しないで利用していることの方です。

『Diary - Ancient library』所載、2001/ 7/29より

要約

  1. 「文字セット」と「文字の実装」は峻別すべき。
  2. JISコードは「文字セット」なので、EUCやシフトJISと同列には語れない。「文字の実装」で言ふのならば"iso-2022-jp"とするべき。
  3. Unicode が挙げられてゐる点に何等かの問題は無いか。
  4. 所謂「機種依存文字」についての見解。

ご返事

「文字セット」と「文字の実装」については、正直混乱してゐたやうです。あの文章では「文字の実装」よりも、正統を主張できる「文字セット」をどのやうに選択するかを述べてゐるのだとご理解下さい。

結果的に、iso-2022-jpを選択しようが、EUCを選択しようが、シフトJISを選択しようが、JISコードで規定された第1水準漢字や第2水準漢字の部分を使用すると云ふ事になります。当然其処には「区点」による個々の漢字の配列がある訳なので、以降の論に変化はありません。又、「JIS補助漢字」に就いては持論では除外しておきます。

ユニコードに関しては、確かにJISの「文字セット」をそつくり其の侭取入れてをりますが、当初国際的に使用できる文字集合として全く新たに規定・配列された文字集合なので、此処では全く別の「文字セット」と理解します。其れ以降の論では、この「文字セット」は敢へて選び採りませんでした。

「ベンダ定義外字領域に任意の glyph を割り当てているだけですから」私は此れをして「機種依存文字」と表現してをりました。此処で再定義しておきます。

文字コードの体系

と言ふか、現在この世に存在する「文字コード」は全て、體系としての一貫性を缺いてゐるので、まともな人間には理解出來ない代物ばかりである。便宜主義に基いてゐる、とは言へるが、便宜主義とは要するに「出たら目」と云ふ事だから、全ての「文字コード」は何にも基いてゐない、非論理的なものである。

で、その原因は、國語國字改革で漢字の體系を破壞した事にあるのだが、その本質的な原因を「文字コード」に關する論者はひたすら無視しようとする。或は、せいぜい「歴史的事實」としてしか認識しない。そして、國語國字問題が齎した害惡を、小手先の「技術」で解決しようとしてゐる。

『闇黒日記』所載、平成13年7月30日より

文字コードの体系としては、確かに一貫性を缺いてゐる事を理解できます。辺りを見渡せば確かに理想的な資料は幾らもあると思ひます。

「当用漢字」制定や「常用漢字」への移行や「人名漢字」の細々とした変更が、日本の文字コードを一層複雑怪奇なものにしてしまつてゐるのは、事実であり、問題となつてゐる筈です。「縦割り行政」以前に、餘計な規定によつて文字コードが振回されてゐると云ふのが現状でせう。

残念な事は、手書きの文字と違つて、電脳では規定された以外の文字が表示できないと云ふ点にあると思ふんです。或る文字は正字体が表示できるが別の文字は略字体しか無いとか云ふ類ひの話です。此れは正直に言つて痛い。折角戦前の印刷物の文字を出さうと思つても、例示字体が無い文字が色々と出て来ます。仕方無く見た目に近い文字を選ぶとか略字体を選ぶと云つた手もあります。

ですが、私は其の例示字体を敢へて無視すると云ふ事を主張してみました。本当はもつと増しな一貫した体系の文字コードが必要なのは承知の上です。

関聯頁