■
何日にもまたがっていて一覧性が悪い、トラックバック送りにくい、ということのようですので、目次を作ってみました。
Unicodeとセキュリティ
- 文字列処理とセキュリティ
- バッファオーバーフロー
- 危険な文字列のチェック漏れ
- UTF-16での注意点
- ドキュメント上の "Unicode" という単語の意味に注意
- 1文字が必ずしも16ビット固定ではない
- 文字数とバイト数の違いに注意
- UTF-8 での注意点
- 非最小形式の不正なエンコーディングに注意
- ISO/IEC 10646 の文字範囲では、最大6バイト
- 見えない文字
- U+FEFF - ZERO WIDTH NO-BREAK SPACE
- U+FEFF のもうひとつの役割 BYTE ORDER MARK
- バックスラッシュと円記号
- バックスラッシュと円記号は個別の文字として定義
- 他の文字コードへの変換
- 他の文字コードとの変換は1対1ではない
- 大文字と小文字
- 大文字、小文字は半角アルファベットだけではない
- 各層の大文字小文字の扱いの差異に注意
- 文字列の正規化
- 4種類の正規化方法
- 正規化により変化する文字に注意
- まとめ