Sorting It All Out : The PUA outside of Unicode
In fact, all of the East Asian code pages have areas set aside for private use, and specifically intended for the kind of characters that EUDC is intended. The various ranges used (shown in the registry at HKLM\SYSTEM\CurrentControlSet\Control\Nls\CodePage\EUDCCodeRange) are:
932 — 0xF040-0xF9FC 936 — 0xAAA1-0xAFFE, 0xF8A1-0xFEFE, 0xA140-0xA7A0 949 — 0xC9A1-0xC9FE, 0xFEA1-0xFEFE 950 — 0xFA40-0xFEFE, 0x8E40-0xA0FE, 0x8140-0x8DFE, 0xC6A1-0xC8FE Unicode — U+E000-U+F8FF
ということで、UNICODEとしてユーザーエリアとして確保されているコード領域でも、Windowsでは日本語(CP932)を含む東アジア地域言語向けのコードページ用に予約領域があるので、注意しておく必要がありますね。
元記事の質問は、おめーらまたLattain-1だけしか世の中にねーと思っているだろうゴラァ。なわけですが、我々もうっかりしているとおめーらまたLattain-1とJapaneseだけしか世の中にねーと思っているだろうゴラァ。と言われかねない危険性もあるし、たぶん無意識にそういうプログラムを作っていたりします。そうならないためには、Windowsの国際化対応機能について、理解を深めておく必要があります。と言っても、ドキュメントにかかれていなかったりすることも多いわけですけど。
コメント