Unicode

メモ

特定のキーワードをはてなに察知させない裏技。どんな感じ? キーワード有効:[Windows][openmya] キーワード無効:[Windows][openmya] …Good ですな。ブラウザ限定です…。

めも

CreateFileW()は、パスの区切りとしてU+005CはOKだけどU+00A5はNG。とりあえず安心。 しかし、U+00A5を含むファイル名を作れたり…。

めも

CompareStringW は、U+FEFFの存在を無視する。つまり、 U+0030 U+FEFF U+0031 と U+0030 U+0031 は同じ文字列とみなされる。

めも

Windows ではファイル名にU+FEFFを入れるとExplorer上からはファイル名が同じに見えるファイルを複数作ることができる。

メモ2

U+2025(TWO DOT LEADER)はNFKC,NFKDで".."になる U+2026(HORIZONTAL ELLIPSIS)も"..."になる

メモ

NFDNFKCは国際化ドメインにてドメイン名の正規化のために使われているらしい。(04/7/8修正) http://www.atmarkit.co.jp/fnetwork/tanpatsu/11idn/idn1.html

めも

「と」+「濁点」(U+3068 U+3099) と 「ど」(U+3069)は、CompareStringW()では等値とみなされるが、NTFS上では個別のファイルになる。つまりNTFSはUnicodeを正規化していないみたい。 Mac OS X の HFS Puls での正規化は NFD とは微妙に違うらしい(http://kur…