2022.08.25
2025.08.01
文字コード
文字コードについて
コンピューターは数値だけを扱うことができるため、数値と文字を対応する表が必要になります。文字と数値を対応させたものが文字コードです。
日本語の文字コードは、日本工業規格(JIS)で標準化されたJIS(ISO-2022-JP)、EUC、Shift_JISなどがあります。その他に、世界中で使用されているバラバラの文字コードを統一したUnicode(ユニコード)や、アルファベット、数字、記号、制御記号などを1バイトで表すASCII(アスキー)があります。
JISコード(ISO-2022-JP)
EUCコード(EUC-JP)
Shift_JISコード(シフトJIS、シフトジス)
ISO-8859-1 (Latin-1)
Unicode(ユニコード)
世界中の文字を表現するための標準で、UTF-8、UTF-16、UTF-32などの形式があります。
UTF-8
UTF-8は「ユーティーエフエイト」と読みます。
Unicode標準に基づく可変長の文字コードで、世界中のほとんどの文字をカバーしています。UTF-8は、ASCIIコードとの互換性が高く、ASCIIで定義された文字をそのまま使用できるよう設計されています。
文字を、1~4バイトで表現します。
ASCIIコード
EBCDIC
EBCDICは「extended binary decimal interchange code」を略したものです。
IBM社が開発した文字コードです。基本的に半角の英数字や記号、制御文字が収録されていますが日本語向けに半角カナ、漢字などを扱えるよう拡張したものもあります。
主にメインフレームで使用されます。
文字コード表
以下の記事を参考にしてください。
文字コードに関するコンテンツ
「文字コード」に関係があるコンテンツをまとめています。
- 数字「0」から「9」を出力
- 五十音の表作る
- 「AA」から「ZZ」を出力
- ASCIIコード
- アルファベット「A」から「Z」を出力
- 同じマンハッタン距離の座標をプロット
- xy-座標の描画の実装
- プログラム関連技術情報
- 絶対値(abs)グラフの表示
- 立方根(cbrt)グラフの表示
- コサイン(cos)グラフの表示
- 放物線グラフの表示
- 平方根(sqrt)グラフの表示
- タンジェント(tan)グラフの表示
- グラフの表示
- インクリメント、デクリメント演算子
- プログラム関連技術情報
- ソースファイルの作り方
- 乱数で文字列を生成
- 半角スペースと全角スペース
- 文字列→byte配列
- 文字列の作成と初期化
- 文字列前後の空白を削除
- 文字列
- Unicode一覧 0000-0FFF
- Unicode一覧 1000-1FFF
- Unicode一覧 2000-2FFF
- Unicode一覧 3000-3FFF
- Unicode一覧 4000-4FFF
- Unicode一覧 5000-5FFF
- Unicode一覧 6000-6FFF
- Unicode一覧 7000-7FFF
- Unicode一覧 8000-8FFF
- Unicode一覧 9000-9FFF
- Unicode一覧 A000-AFFF
- Unicode一覧 B000-BFFF
- Unicode一覧 C000-CFFF
- Unicode一覧 D000-DFFF
- Unicode一覧 E000-EFFF
- Unicode一覧 F000-FFFF
- Unicode(ユニコード)
関連コンテンツ
オペレーティングシステムは、コンピューターに入っている基本のソフトウェアで、電源を入れると最初に起動します。オペレーティングシステムが持っている機能って何?
2022.07.14