質問

文字コードとは

文字化けするのはメモ帳が文字コードに対応していないからだ」と言われたことがあるのですが、文字コードとは一体なんでしょうか?

回答

コンピューターで表示される文字に割り当てられた番号、又は文字と対応する番号をまとめた対応表(ルール)のこと。この対応表にはいくつか種類があり、日本語ではJIS・Shift_JIS・EUC-jpなどが有名です。

この文字コードによって、同じ文字でも違う番号が割り振られているので、文字コードの指定が違うと文字化けが起こります。

さらに詳しい情報はWikipedia文字コードで。

コンピュータ内での文字の扱い

「A」「あ」「阿」、これらは文字です。アルファベット、数字、記号、ひらがな、カタカナ、漢字等々、たくさんあります。

一見当たり前のことですが、このままにしておくとコンピュータは大変です。
どの文字かという情報をいちいち画像なりベクトル情報なりでやりとりすると、まずコンピュータに判別させるのが大変ですし、インターネット上で使うなんてことになった日には、膨大な量の情報をやりとりすることになってしまい、回旋が常時混雑しているような状態になってしまいます。

そこで、文字コードです。

コンピュータはなんでもゼロと1で処理します。
そのゼロと1を幾つかごとにまとめて、それと文字を対応させ、あるゼロと1の組み合わせが来たら、特定の文字を表示させるのです。

文字を数値に変換すれば、データ量が少なくなる

つまり、各々の文字のデータ(画像やベクトルの情報)は別に置いておき、コンピュータの中では文字コードというゼロと1の組み合わせで高速にやりとりするのです。

文字を画像で扱うとデータサイズが大きくなって大変なので、文字データではなく数値でやりとりする

コントロール・パネル内の「フォント」フォルダをご覧下さい。そこには様々なフォントが入っているはずです。HTMLでは、「文字コード」でやりとりしていて、表示させる時にはこの「文字コード」と文字のデータとを対応させて、文字を表示させているのです。

参考リンク

メモ帳で文字化けします

編集者

作成 ばあど 2004/11/24
図の追加 105 2004/12/06


添付ファイル: filetext2.gif 88件 [詳細] filetext1.gif 80件 [詳細]

リロード   新規 編集 凍結解除 差分 添付 複製 改名   トップ 一覧 検索 最終更新 バックアップ   ヘルプ   最終更新のRSS
Last-modified: 2006-10-20 (金) 21:21:31 (4047d)