2004-10-06から1日間の記事一覧

UTF-8他、Unicode

10/30に話します。

ISO-2022-JP

ISO-2022-JPの最大の特徴は、エスケープシーケンスを用いて文字集合を切り替える、という点でしょう。おなじバイト列であっても、それ以前に出現したエスケープシーケンスによって文字集合が切り替えられています。ですので、文字列を検索する場合には、バイ…

CP932

検索する対象がいわゆるシフトJISの場合、たいていの場合は単純なバイト列の比較で事足ります。 単純なバイト列の比較だけでは検索できないケースというのは、以下の2つの場合ではないかと思います。 重複して登録されている文字の検索 Windows-31Jではいく…

文字コードな話

思わぬ方面からEnCaseでの日本語検索な話を尋ねられたりしていますが、私にはまったくわかりません。ですので、一般的な範囲での日本語の検索について書いてみましょう。

気を取り直して大急ぎで日記をでっちあげ。