私たちの身の回りには、音声、画像、文字などさまざまな情報があります。
これらの情報をコンピュータで処理するためには、コンピュータが扱える形に変換する必要があります。
このように、現実世界の情報をコンピュータで扱える形に変換することを情報のデジタル化といいます。
コンピュータはデジタルデータを扱う機械であり、内部ではすべての情報を0と1の組み合わせで表現しています。
そのため、音声や画像などの情報も、最終的には0と1の列として表されます。
本記事では、情報Ⅰ(情報1)の情報デザインの単元で学習する、情報のデジタル化について解説します。
アナログデータとデジタルデータ
アナログデータとは
アナログデータとは、値が連続的に変化するデータのことです。自然界で測定されるデータの多くはアナログデータです。
例えば次のようなものがあります。
- 音の大きさ
- 温度
- 光の強さ
これらの値は連続的に変化し、理論上は無数の値を取ることができます。
このような連続的な値をもつデータをアナログデータといいます。
デジタルデータとは
デジタルデータとは、値が飛び飛びの数値で表されるデータのことです。
このような値を離散値といいます。
コンピュータは離散値で表されたデータを扱います。
そのため、連続的に変化するアナログデータも、コンピュータで扱うときにはデジタルデータに変換されます。
コンピュータはなぜデジタルデータを扱うのか
コンピュータ内部の0と1
コンピュータは情報を2進数で表現します。
2進数は、0と1の2つの数字だけで情報を表現します。
この0または1の1桁をビットといいます。ビットは、情報の量の最小単位です。
コンピュータの内部では、すべてのデータがビットの並びとして表現されています。
電圧による0と1の表現
コンピュータの回路では、電気信号を使ってデータを表現します。
一般的には、次のように電圧の状態によって0と1を区別します。
- 電圧が低い状態を0
- 電圧が高い状態を1
このように電圧の状態を使うことで、コンピュータは0と1の情報を確実に扱うことができます。
ビットとバイト
ビットとは
ビットは、コンピュータが扱う情報の最小単位です。
1ビットは、次の2つの状態のどちらかを表します。
- 0
- 1
例えば、8ビットのデータは次のような並びになります。
01011010
0と1との組み合わせによって情報を表現することができます。例えば、1ビットであれば、0 or 1で、2通りの情報を表現できます。2ビットであれば、0 or 1の2通りの組み合わせで、4通りの情報を表現できます。具体的には、00、01、10、11の4通りです。
8ビットであれば、256通りの情報を表現できます
バイトとは
バイトとは、8ビットをひとまとめにした単位です。
多くの場合、文字や数値などのデータはバイト単位で扱われます。
例えば、1文字を1バイトまたは複数バイトで表現する符号化方式があります。
符号化とは何か
数字や文字を0と1で表す仕組み
符号化とは、文字や数字などの情報を、コンピュータで扱えるように0と1の列に変換することです。
例えば、文字コードでは文字ごとに対応するビット列が決められています。
例
A → 01000001
このように、情報とビット列の対応を決めることで、コンピュータは文字や記号を扱うことができます。
データ量の単位と接頭語
コンピュータでは、扱うデータ量を表すためにさまざまな単位が使われます。
SI接頭語
SI接頭語は、10の累乗を基準とした接頭語です。
| 接頭語 | 値 |
|---|---|
| キロ(k) | 1000 |
| メガ(M) | 1000² |
| ギガ(G) | 1000³ |
| テラ(T) | 1000⁴ |
例えば
- 1kB = 1000バイト
- 1MB = 1000²バイト
2進接頭語
コンピュータでは、2の累乗を基準とした接頭語も使われます。
| 接頭語 | 値 |
|---|---|
| キビ(Ki) | 2¹⁰ |
| メビ(Mi) | 2²⁰ |
| ギビ(Gi) | 2³⁰ |
例えば
- 1KiB = 1024バイト
- 1MiB = 1024²バイト
確認問題
【問題1】値が連続的に変化するデータを何というか。
【問題2】値が飛び飛びの数値で表されるデータを何というか。
【問題3】コンピュータ内部で情報を表すときに使われる数字は何と何か。
【問題4】8ビットをまとめた単位を何というか。
答え:【問題1】アナログデータ 【問題2】デジタルデータ 【問題3】0と1 【問題4】バイト
まとめ
情報のデジタル化とは、現実世界の情報をコンピュータで扱える形に変換することです。
コンピュータはデジタルデータを扱う機械であり、内部ではすべての情報を0と1で表現しています。
この0と1の1桁をビットといい、8ビットをまとめた単位をバイトといいます。
また、文字や数値などの情報は符号化によってビット列に変換されます。
このような仕組みによって、コンピュータはさまざまな情報を処理することができます。
