私たちは日常的に画像、動画、文書など多くのデータを扱っています。
しかし、そのままではデータの容量が大きく、保存や通信に時間がかかる場合があります。
そこで利用される技術がデータの圧縮です。
データの圧縮は、情報の内容を保ちながら、または一部を省略することで、データのサイズを小さくする技術です。
メールでファイルを送るときや、インターネットで画像や動画を見るときなど、さまざまな場面で利用されています。
データの圧縮とは
圧縮の意味
データの圧縮とは、元のデータの情報をできるだけ保ちながら、データ量を小さくする処理のことです。
コンピュータでは、同じ情報が繰り返されている部分や、人間にとって重要でない情報を利用してデータを小さくします。
圧縮の主な目的は次のとおりです。
- 保存に必要な容量を減らす
- 通信にかかる時間を短くする
- データの管理をしやすくする
圧縮によって得られる利点
データを圧縮すると、次のような利点があります。
- ストレージの使用量を減らすことができる
- インターネット通信の負荷を減らすことができる
- ファイルの送受信が効率的になる
可逆圧縮と非可逆圧縮
データの圧縮方式は、大きく次の二つに分けられます。
- 可逆圧縮
- 非可逆圧縮
可逆圧縮とは
可逆圧縮とは、圧縮されたデータを元のデータと完全に同じ状態に戻すことができる圧縮方式です。
つまり、圧縮前と復元後のデータが完全に一致します。
この方式は、内容が正確である必要があるデータに利用されます。
- 文書ファイル
- 表計算データ
- プログラムファイル
などでは、データの一部が失われると問題になるため、可逆圧縮が使われます。
非可逆圧縮とは
非可逆圧縮とは、圧縮の過程で一部の情報を削除する圧縮方式です。
そのため、圧縮前と完全に同じデータには戻りません。
ただし、人間が気付きにくい情報を削除することで、データ容量を大きく減らすことができます。
主に次のようなデータで利用されます。
- 画像
- 音声
- 動画
非可逆圧縮は、不可逆圧縮ともいいます。
両者の違いの整理
| 圧縮方式 | 特徴 | 元に戻せるか |
|---|---|---|
| 可逆圧縮 | 情報を失わない | 完全に戻せる |
| 非可逆圧縮 | 一部の情報を削除する | 完全には戻せない |
圧縮率とは
圧縮率の考え方
圧縮率とは、どの程度データを小さくできたかを示す値です。
一般的には次のように考えます。
圧縮後のデータサイズ ÷ 圧縮前のデータサイズ
例えば、100MBのデータが25MBになった場合、圧縮率は0.25または25%となります。
一般に、可逆圧縮より、非可逆圧縮のほうが圧縮率は高くなります。
圧縮率を見るときの注意点
圧縮率は、データの種類によって大きく変わります。
例えば、
- 同じ文字が多いデータは圧縮しやすい
- すでに圧縮されたデータはあまり小さくならない
といった特徴があります。
可逆圧縮の代表例
zip形式
zip形式は、広く利用されている圧縮ファイル形式です。
複数のファイルをまとめて圧縮できるため、ファイルの配布や保存によく利用されます。
多くのOSで標準的に利用できる形式です。
rar形式
rar形式は、zip形式と同様にファイルを圧縮する形式です。
一般的にzipより高い圧縮率になる場合があります。
ただし、解凍には専用のソフトウェアが必要な場合があります。
ランレングス圧縮
ランレングス圧縮は、同じデータが連続している部分をまとめて表現する圧縮方法です。
例えば次のようなデータがあったとします。
AAAAAA
この場合、Aが6回のように表現することでデータ量を減らします。
同じデータが連続する場合に有効な圧縮方法です。
非可逆圧縮の代表例
JPEG
JPEG(Joint Photographic Experts Group)は、主に写真などの画像を圧縮する形式です。
人間の視覚では気付きにくい情報を削除することで、画像データのサイズを小さくします。
そのため、高い圧縮率を実現できます。
MPEG
MPEG(Moving Picture Experts Group)は、動画データを圧縮する方式です。
動画の連続したフレームの中で、変化していない部分を省略することでデータ量を削減します。
インターネット動画配信やDVDなどで広く利用されています。
圧縮方式の使い分け
文書や表計算ファイルに向く圧縮
次のようなデータでは、情報が完全に保持される必要があります。
- 文書ファイル
- 表計算ファイル
- プログラム
この場合は可逆圧縮が適しています。
画像や動画に向く圧縮
次のようなデータでは、多少の情報が失われても問題が少ない場合があります。
- 写真
- 音声
- 動画
この場合は非可逆圧縮がよく利用されます。
圧縮を利用するときの注意点
非可逆圧縮では元に戻せない場合がある
非可逆圧縮では、一度削除された情報は復元できません。
そのため、元のデータが必要な場合は元ファイルを保存しておくことが重要です。
目的に応じて形式を選ぶことが大切
データの種類や利用目的によって、適した圧縮方式は異なります。
そのため、
- 正確さが重要な場合は可逆圧縮
- 容量削減を優先する場合は非可逆圧縮
のように使い分けることが大切です。
動画の圧縮

動画の場合、動きのある部分は画像の一部であることが多いです。
例えば、上の図のように、道路を撮影した場合、動いているのは車だけということがあります。
つまり、連続するフレーム間での差分は、車の部分のみということになります。
この場合、動きのある部分のみを記録するなど、動画ならではの圧縮方法があります。
確認問題
【問題1】データの圧縮とはどのような技術か。
【問題2】可逆圧縮とはどのような圧縮方式か。
【問題3】非可逆圧縮とはどのような圧縮方式か。
【問題4】100MBのデータを圧縮したところ、25MBになった。圧縮率を求めよ。
答え:【問題1】元の情報をできるだけ保ちながら、データ量(ファイルサイズ)を小さくする技術。
【問題2】圧縮したデータを、元のデータと完全に同じ状態に復元できる圧縮方式。
【問題3】圧縮の過程で一部の情報を削除する圧縮方式で、元のデータと完全には同じ状態に戻せない。
【問題4】0.25(25%)
まとめ
データの圧縮は、データ量を小さくして保存や通信を効率化する重要な技術です。
重要なポイントは次のとおりです。
- データの圧縮はデータサイズを小さくする技術である
- 圧縮方式には可逆圧縮と非可逆圧縮がある
- 可逆圧縮は元に完全に戻せる
- 非可逆圧縮は一部の情報を削除する
- 圧縮率はデータがどれだけ小さくなったかを示す
- zipやrarは可逆圧縮、JPEGやMPEGは非可逆圧縮の例である
データの種類や目的に応じて、適切な圧縮方式を選ぶことが重要です。
