スポンサーサイト
-------- -- --:--
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
この記事のURL | スポンサー広告 | | | ブログトップページへ
文字化けと文字コードの話 (文字化けを直すには?)
2006-04-25 Tue 16:12
 2006年4月25日(火)

 インターネットをしていると、文字化けして読めないページにぶつか
 ることがある。
 ネット上では多種の言語が存在しているから、ブラウザは、そのペ
 ージがどの言語で書かれているかを判断して開いてくれる。
 WEBページのファイルは、通常、どの文字セットを使うかが(ソース
 内のMETA要素で)宣言されているのだが、その宣言と、実際にその
 ページの文書が保存された時に使われた文字コードとが食い違っ
 ている場合に、文字化けが起こる(…と、私は解釈している)。
 ページ内の一部が文字化けする場合も、理屈は同じだ。

 具体例で説明してみよう。
 先日(4/16)、私のブログの検索語について書いたが、これは、その
 検索語を知ることができるアクセス解析のページの一部である。


 楕円で囲んだ部分が検索語など(一番下は記事タイトル名)に当た
 る日本語部分なのだが、文字化けしている。
 赤楕円内はやたら半角カタカナが多く、青楕円内はやたら画数の
 多い漢字が多いのがおわかりだろう。
 文字化けにも種類があるのだ。
 この楕円内の文字を解読するには、どうすればよいか。
 そう、ページを別の文字コードで読み込み直せばよい。
[ 続きはここから… ]

 日本語の文字コードは数種類ある。ブラウザ(ここではインターネッ
 ト・エクスプローラ)のメニューバーの「表示」のボタンから、「エンコ
 ード」を開いてみよう。


 設定では「自動選択」になっていて、ここでは「シフトJIS=shift-
 jis」で読み込まれた状態であるのがわかる。
 すぐ下の Unicode(ユニコード)をクリックして文字コードを変えて
 やると、青楕円内は、ご覧のように正しく表示されて読めるように
 なる。そして赤楕円内は???マークだらけに変わってしまう。


 さらに文字コードを、「日本語EUC(EUC-JP)」に変えてやると、
 次のように、赤楕円内が正しく表示され、青楕円内は、最初とは
 違う新たな文字化けを起こす。


 つまり、このアクセス解析のページは、ページ全体としては
 「shift-jis」で書かれ、青楕円内は「Unicode」で書かれ、
 赤楕円内は「EUC-JP」で書かれているために、同時に全てを
 正しく表示することができないのだ。
 そして、このページがもともと「EUC-JP」で書かれているのであれ
 ば、また、違うパターンの文字化けが起こるということになる。

 なお、自分で作ったWEBページの中で全面的に文字化けが起こっ
 てしまう場合は、ソースの最初の方に幾つかある< >内のMETAタグの
 終わりに着目。
 META http-equiv="Content-Type" content="text/html; charset=○○○"
 で、○○○の部分を、EUC-JP(euc-jp)から shift-jis へ、
 あるいはその逆に直せば、たいていは解決する。
 文字化けの起こっていたあるサイトで、ソースを見たら、この文字
 セット指定のタグが2通り並べて書かれているのを見たことがある。
 そんな場合は、もちろん、間違っている方を消せばOKだ。

 正確には知らないが、日本語のホームページの大半(多分6、7割)
 は、shift-jis(x-sjis)で書かれ、残りはEUC-JPで書かれている印象
 を受ける。
 ホームページビルダーなどで普通にホームページを作ると、shift-jis
 で作られるが、私は自分の本サイトは全てEUC-JPに書き換えて
 ある。
 ブログページの方は、初期設定でEUC-JPになっている。
 ちなみに私は、仕事の原稿は、諸事情からUnicodeで保存している。
 日本語の中にいくつもの文字コードがあるのは厄介この上ないが、
 統一はなかなか難しそうである。
 
スポンサーサイト
この記事のURL | PCネタ・親指シフトネタ | コメント:4 | トラックバック:0 | ブログトップページへ
<<カイヅカイブキの繁みの中に… | ミセス・かんちがいのブログ日記 | 最近のメニューから(小アジの南蛮漬けほか)>>
コメント
-勉強になりますぅ-
かんちがいさんの説明わかりやすいです。
本を読んでもよくわからないのに。すごいです。
2006-04-27 Thu 19:12 | URL | syomin1 #vbu/5PMA[ 内容変更]
-我流解釈です(^^;)-
syominさん
文字化けの話なんて、お友だちの皆さんには退屈だろうなと思い
つつ、こういう記事が必要な初心者もきっといるはず!という
実用志向でアップした記事でした。
アップした当日に、早速「文字化け」「文字コード」などで検索
されていたので、手ごたえも感じました。

でも、身近な所でも、思いがけず文字化け騒動があり、タイムリー?
でしたね^^(笑)
我流の解釈ですが、わかりやすいと言ってもらえると嬉しい~♪

実は私は、Yahoo!ジオシティーズのホームページを立ち上げた日に、
文字化けの洗礼を受けたのですよ。
ホームページビルダーでサイトを作って、全ページをアップロードし、
そこで初めてジオの編集ツール(アドバンストHTMLエディタ)を使って
カウンターをつけたら、いきなり文字化け…!!
泣きそうになりながら必死に調べて、わけもわからずMETAタグを
書き換えました…(^^;)
ビルダーで作ったファイルは shift-JISで作られていたのに、ジオの
編集ツールを使うと、EUC-JPに読み換えられてしまうという理屈は、
後からだんだんわかってきました。
私の記事もかなり大雑把だけど、「文字化け」で検索するような人は
かつての私と同じように、困っている初心者のはずだから…と思い、
ちょっとだけ、知った風に書いちゃいました。
上級者から見ると、突っ込みどころが満載でしょうけどね…(^^;)ゞ 
2006-04-29 Sat 11:23 | URL | ミセス・かんちがい #bhhZubZs[ 内容変更]
-こういうの嬉しいですぅ-
かんちがいさん、本当に心強いです。
いろいろ ありがとう~。

私も この記事を見ていなかったら
絶対 わからなかったよぉ~。

でも、バカだから時間がかかっちゃった。^^;


かんちがいさんは わかるように説明をしてくださるので
わからないまま解決。。とならず、私も一歩前進した気になって
ちょっといい気分♪にさせてもらいました。

ありがとうございます。
今後も 初心者用の記事、楽しみにしています♪

(すみません。。何年たっても初心者と言わずにおれないレベルです^^;)


2006-05-01 Mon 10:53 | URL | syomin1 #vbu/5PMA[ 内容変更]
-私も初心者^^♪-
syominさん
syominさんもおだて上手ね~! もう、図に乗っちゃうよ(´▽`)ゞ

パソコンはいろいろ奥が深くって、知れば知るほど、自分の知らない
世界の広さが見えてくるようなところがあります。
でも、ちょっとしたことでも、「そういうことだったのか~!」って
わかった時って、すごく嬉しいものですよね。
パソコンを始めた頃は、毎日がそういう驚きの連続だった気がする。
最近はちょっと、進歩ないなあ~(^^;)ゞ
何か新しいことに取り組んだ方が、私の場合、ボケ防止の為にも
いいかもなぁ。。(最近、直近の記憶がヤバイ!…笑)

これからも、いろいろと試行錯誤や実験に巻きこんじゃうかもしれ
ないけど、ご協力をば^^!
2006-05-01 Mon 21:01 | URL | ミセス・かんちがい #bhhZubZs[ 内容変更]
コメントの投稿














管理者だけに閲覧

トラックバック
トラックバックURL

FC2ブログユーザー専用トラックバックURLはこちら
| ミセス・かんちがいのブログ日記 |
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。