2004-11-21から1日間の記事一覧

見えない文字

U+FEFF - ZERO WIDTH NO-BREAK SPACE Unicode の U+FEFF には、表示幅ゼロで改行もしない空白文字 ("ZERO WIDTH NO-BREAK SPACE") すなわち何も表示に影響を与えない文字が割り当てられています。 表示に影響を与えないというだけでなく、処理系によってはこ…

UTF-8 での注意点

非最小形式の不正なエンコーディングに注意 UTF-8 は文字によって1文字あたりのバイト数が1バイトから4バイト(もしくは6バイト)と可変長なエンコーディングです。Unicode の各文字がどのようなバイト列で表現されるかは、下表のようになっています。 Unicode…

その2