見出し画像

画像ファイルの中身ってどうなっているの?

画像データの形式や画jp像ファイルの形式は様々なものがあることを以前こちらの記事でまとめた。

では、画像ファイルの中身はどのようなものになっており、ファイルの形式などによって何が変わるのかについて疑問に思ったのでまとめてみた。

JPEG

画像の構造

構造については以下の写真および引用元のサイトが非常に参考になった。



(https://gigazine.net/news/20200801-jpeg-structure/ より引用)

JPEG画像は以下のように複数のセグメントに分割され、圧縮された画像データを含む構造を持っているとのこと。

  1. マーカーとヘッダー
    JPEGファイルは、複数のマーカーとヘッダーセグメントから構成される。ファイルの先頭には、SOI(Start of Image)マーカー(ffd8の部分)があり、ファイルの終わりには、EOI(End of Image)マーカー(ffd9の部分)がある。

  2. アプリケーションマーカー
    アプリケーション固有の情報を含むアプリケーションマーカーも存在することがある(ffe0から始まる部分)。アプリケーションマーカーには識別子や解像度などの情報が含まれている。

  3. 量子化テーブル
    JPEG圧縮では、量子化テーブルが使用される(ffdbから始まる部分)。このテーブルでは、DCT(離散コサイン変換)によって生成された周波数成分をどのように量子化*するかを定義している。量子化の際は、単純化された後のデータの端数を切り捨て、切り捨てる端数が大きければ大きいほど、JPEG変換後の画質が粗くなる。そのため、このテーブルは画像の品質とサイズのバランスを調整するために使用される。
    ⇒JPEGが非可逆的圧縮なのは、切り捨てのため。
    *量子化:標本化のプロセスで計測されたアナログ値を、離散的なデジタル値(0と1で表現できるような値)に変換するプロセスのこと。

  4. ハフマンテーブル
    ハフマンテーブルは、データをさらに圧縮するためのハフマン符号化を行うための領域。各シンボルに対して割り当てられる符号を定義している。ハフマン符号化は、データの出現頻度に基づいて、短い符号をよく出現するデータに、長い符号をまれに出現するデータに割り当てることで、データを効率的に圧縮する手法である。JPEGだけでなく、GIFなどの画像ファイルや、MP3やAACなどの音声ファイルの圧縮でも使用される。
    ⇒JPEGでは量子化とハフマン符号化の2段階の圧縮行程がある。

メタデータについて

JPEGのメタデータについては、アプリケーションマーカーの部分(APPの部分)に追記される形で含まれる。メタデータには、撮影日時、カメラの種類、露出時間、光度、ISO感度、ファイル名、作者名、著作権情報、GPS情報などが含まれる。

JPEGファイルに含まれるメタデータは、Exif(Exchangeable Image File Format)と呼ばれる規格に基づいて記述される。Exifは、カメラやスマートフォンで撮影された画像に関するメタデータを保存するための規格で、JPEGファイルによく使用される。Exifデータは、画像編集ソフトウェアやファイルビューアーなどのプログラムで表示することができる。

また、JPEGファイルには、IPTC(International Press Telecommunications Council)と呼ばれる規格に基づいたメタデータも含まれることがある。IPTCは、写真業界で使用される規格で、写真のタイトル、キャプション、説明、著作権情報などを保存するために使用される。

さらに、JPEGファイルには、XMP(Extensible Metadata Platform)と呼ばれるメタデータ規格に基づいたメタデータも含まれることがある。XMPは、Adobeが開発したメタデータの規格で、カメラや写真編集ソフトウェアなどで使用される。

TIFF

TIFFファイルは、複数の画像ストリームやメタデータを含むことができる。

画像の構造およびメタデータ

TIFFファイルの基本的な構造は、ヘッダー、イメージデータ、およびオプションのタグデータから構成されている。ヘッダーは、ファイルタイプ、イメージの幅と高さ、およびビットの深度を指定する情報を含む。イメージデータは、実際のビットマップ画像を表す。タグデータは、画像の色空間、圧縮形式、およびその他のメタデータを指定する追加情報を提供する。

マルチページTIFF

マルチページTIFFは、1つのTIFFファイルに複数のページ(画像)を含めることができる、拡張されたTIFF形式の一種である。通常、単一ページTIFFファイルは、1つの画像を含みますが、マルチページTIFFファイルは、複数の画像を含むことができます。マルチページTIFFファイルは、PDFファイルのような多ページ文書を保存するために使用されることがある。

マルチページTIFFファイルは、複数のTIFF画像を含む単一のファイルであるため、ファイルの管理やデータの転送が簡単になる。また、TIFF形式は多くの画像処理ソフトウェアでサポートされているため、マルチページTIFFファイルを扱うことができるソフトウェアも多く存在する。

マルチページTIFFファイルの各ページには、単一ページTIFFファイルと同様に、画像データとタグデータが含まれる。各ページは、異なるサイズ、解像度、色空間、またはフォーマットで保存されることができる。マルチページTIFFファイルのタグには、ページ番号やページ数などの情報が含まれる。


この記事が気に入ったらサポートをしてみませんか?