WindowsにおいてはUNICODEのユーザーエリアに東アジア言語のコードページ用の予約領域がある。

Sorting It All Out : The PUA outside of Unicode

In fact, all of the East Asian code pages have areas set aside for private use, and specifically intended for the kind of characters that EUDC is intended. The various ranges used (shown in the registry at HKLM\SYSTEM\CurrentControlSet\Control\Nls\CodePage\EUDCCodeRange) are:

  1. 932 — 0xF040-0xF9FC
  2. 936 — 0xAAA1-0xAFFE, 0xF8A1-0xFEFE, 0xA140-0xA7A0
  3. 949 — 0xC9A1-0xC9FE, 0xFEA1-0xFEFE
  4. 950 — 0xFA40-0xFEFE, 0x8E40-0xA0FE, 0x8140-0x8DFE, 0xC6A1-0xC8FE
  5. Unicode — U+E000-U+F8FF

ということで、UNICODEとしてユーザーエリアとして確保されているコード領域でも、Windowsでは日本語(CP932)を含む東アジア地域言語向けのコードページ用に予約領域があるので、注意しておく必要がありますね。
元記事の質問は、おめーらまたLattain-1だけしか世の中にねーと思っているだろうゴラァ。なわけですが、我々もうっかりしているとおめーらまたLattain-1とJapaneseだけしか世の中にねーと思っているだろうゴラァ。と言われかねない危険性もあるし、たぶん無意識にそういうプログラムを作っていたりします。そうならないためには、Windowsの国際化対応機能について、理解を深めておく必要があります。と言っても、ドキュメントにかかれていなかったりすることも多いわけですけど。

コメントを残す