複数の事象を混同しがちなVistaの文字問題:ITpro

セキュmemo経由。気になったのはここ。


ちなみにマイクロソフトが定めたデータ圧縮の仕様であるCAB形式は,Unicodeに対応している。
CAB ファイルにおける Unicode なファイル名の扱いについては、Microsoft Cabinet SDK に含まれる CAB のフォーマットの解説書(CABFMT.DOC)に書かれています。Unicode なファイル名を格納する場合には、UTF-8 とは明記されていませんが、同様のエンコーディング方法で格納します。ただし、仕様として書かれているのは、U+0000 から U+FFFF までの BMP の範囲内の文字のみで、U+10000 を超える範囲については書かれていません。ですので、Vista で追加された、UTF-16 であればサロゲートされる文字については、ファイル名として格納することは本来はできないはずです。
あと、7-Zip や RAR も Unicode なファイル名を取り扱えるはずですが、BMP 外の文字が利用可能なのかどうなのかは知りません。