Bypassing of web filters by using ASCII − Bugtraq

charset が指定されていない HTML を Internet Explorer で開いたときには、エンコーディングが暗黙のうちに US-ASCII と判断され、その場合、 "Content-Type: text/html; charset=US-ASCII" のように、明示的にエンコーディングとして US-ASCII を指定された HTML をIEで開いた場合、コンテンツ内の 8 ビット目が自動的に落とされる。サンプル。body 部分のバイト列は

D4 E8 E5 A0 CD E1 E7 E9 E3 A0 D7 EF F2 E4 F3 A0
E1 F2 E5 A0 D3 F1 F5 E5 E1 ED E9 F3 E8 A0 CF F3
F3 E9 E6 F2 E1 E7 E5

となっている。これを IE で開いた場合に最上位ビットが無視され、"The Magic Words are Squeamish Ossifrage" と表示される。
なお、エンコーディングが Content-Type: 応答ヘッダおよび <meta> のいずれでも指定されず、HTML のコンテンツとして US-ASCII なものしか含まれていなかった場合でも、日本語版 Windows では Shift_JIS が、英語版 Windows では ISO-8859-1 つまり ANSI コードページが暗黙のうちに選択され、US-ASCII が選択されることはない。また、Content-Type: 応答ヘッダで US-ASCII 以外の有効なエンコーディングが指定された場合は、<meta> で US-ASCII を指定しても US-ASCII と認識されることはない。

関連: