仕事で面白い。 エンコードを定義するモジュールを調整して、ウェブマスターがHTMLページでどのエンコードを示しているかを分析しました。 もちろん、結果はインターネット全体から一般化されているのではなく、特定のセグメントについてのみ一般化されていますが、いずれの場合も以下を示しています。
だから彼らは何を書くのか
'text / html; charset = $ yycharset ':26、
'text / html; charset = .cp-1251 ':206、
'text / html; charset = .utf8 ':2、
'text / html; 文字セット= 1251 ':6
'text / html; charset = <windows-1251> ':3
'text / html; charset = NONE ':1
'text / html; charset = None ':40、
'text / html; charset = no ':1
'text / html; charset = none ':341、
'text / html; charset = WINDIWS-1251 ':560、
'text / html; charset = WINDOWS-`1251 ':1
'text / html; charset = Windows-31J ':24、
'text / html; 文字セット= X-WINDOWS-949 ':1
'text / html; charset = utf-81 ':6
'text / html; charset = utf-8; ':94、
'text / html; charset = utf-8; 文字セット= utf-8 ':1
'text / html; charset = windows-1251; charset = windows-1251 ':3158、
'text / html; charset = windowns-1251 ':3
'text / html; charset = windws-1251 ':108、
レアリティ:
'text / html; charset = x-mac-ce ':2
'text / html; charset = x-mac-cyrillic ':1
メタに詰め込まれた:
「「UTF-8」:1
'' Windows-1251 ':225、
「koi8-r」:260、
「koi8-u」:258、
'p125':6
「p1251」:15966 + 244 + 50、
'u':24、
'uft-8 "/-":1
'utf-8':9529、
'utf8':703、
windows-1250 ':7
'windows-1251':67996、
'windows-1251 "\ r \ n http-equiv =" content-type ":1
'windows-1251 "http-equiv =" content-type ":1294、
'windows-1251 "http-equiv = content-typ':2137、
'windows c-1253':68、
「windows cyr-1253」:4
'windows-':3、
'windows- \ r \ n1251':1
'windows-koi8-r':2、
'windows-utf-8':2、
'windows12-51':1、
'windows1251':933、
'windows_1251':22、
最もおかしい:
'"。$ config':5
'{$ smarty.const.default_charset}':81、
'' Windows12-51 ':7
'-1251':233、
'_charset':15、
「irillic koi8」:27、
'yrillic(windows)':1
'koi8-win \ n </ titl':56、
'koi8_ru </ t':1
'w \ xb3ndows-125':1(ウクライナ語iを使用)
'\ xca \ xe8 \ xf0 \ xe8 \ xeb \ xeb \ xe8 \ xf6 \ xe0(windows)':7、(キリル文字)
'\ xca \ xe8 \ xf0 \ xe8 \ xeb \ xeb \ xe8 \ xf6 \ xe0(windows)':22、(-//-)
'\ xf6 \ xf9 \ xf2 \ xe2 \ xf9 \ xf6 \ xfb-1251':2}(解読方法がわかりません)