見出し画像

知らずにやってる?「写真に加工が施される仕組み」について解説!


こんにちは。PLEN Roboticsインターン生の鈴木です!

突然ですが、あなたは普段、写真を加工しますか?
最近は、iPhoneの写真アプリやInstagramでも写真加工が簡単にできちゃいますよね。
でも、実際どんな仕組みで加工が施されているのかはよく知らないはず!

ということで、本日は「画像加工の仕組み」について学んでいきましょう!


◯画像処理とは

ここでは、写真を加工することを「画像処理」と呼ぶことにします。

画像処理とは、デジタル画像データからコンピューターを使って何かの目的のために画像を加工することです。

んん?デジタル画像ってなんぞや?

そうですね、いきなり画像処理について理解するのは難しいので、まずは写真がデジタルデータになる仕組みを学びましょう!


◯一体、写真の正体って?

まず、デジタルカメラ(デジカメ)で写真を撮影することは、アナログ画像をデータ化するということ。そのためには3つのステップを踏みます。

1.サンプリング(Sampling)
2.量子化(Quantization)
3.コード化(Encoding)

1.サンプリング(Sampling)

まず最初のステップ、サンプリングとは連続して変化するアナログ情報を一定の周期で計測することです。
簡単に言うと、元の画像を等間隔でマス目に区切ることですね。

イメージ

2.量子化(Quantization)

画像をマス目状に切り分けたら次のステップ、量子化です。
それぞれの画素は色や明るさなどの情報を持っています。例えばそれらを「黒は0、白は1」というように、色に数値を割り当てていきます。


3.コード化(Encoding)

最後のステップ。コード化とは、先程割り当てた数値を二進数の0か1で表現することです。
二進数の一桁の値を1ビットと言うことから、この結果を「ビットデータとして管理する」と表現します。

例えば数字が二桁になると、00、01、10、11と4種類の数字の組み合わせが考えられ、4色の色が表現できることになります。
そして色が増えるとビット数も増えます。


つまりデジタルカメラで撮影した写真(デジタルデータ)は、究極的にはピクセルの集まりです。
この一つひとつのピクセルが、色の情報を持っており、それがたくさん集まることで意味のある画像になるんですね。

また、ピクセルの持つ色情報とは、カラー画像であれば光の三原色に関するRGB値です。
RGB、つまり赤(Red)、緑(Green)、青(Blue)の3色を混ぜれば全ての色を表現できます。そして、それぞれの色は256段階の数値で表すことができます。
つまり、デジタル画像は数字の集まりであるということですね。


どうですか?写真の正体が分かりましたか?
もう少し詳しく知りたいという方はこちらからどうぞ!↓↓


◯代表的な画像処理

それではやっと、画像処理の方法を見ていきましょう!

「グレースケール変換」

カラー画像を無彩色にする加工のこと。
これは、人間の目が緑色に敏感で、青色に鈍感であることを利用しているようです。

ですがカラー画像を白黒にするのって何の役に立つんでしょう?
実はこれ、人間にとっては意味がないですが、コンピューターにとってはメリットがあります。カラー画像というのは情報量が多すぎる場合があるんですね。画像の容量が多いと計算に時間がかかるし、保存するのも大変です。なのでグレースケール変換という画像処理は便利なのです!


「ノイズ除去」

ノイズ除去とは、ピクセルの持つRGB値や濃淡値の異常を修正するもの。
モノクロ画像で、黒い背景に白い点(ホコリなど)があったとします。それを除去するためには、「収縮処理」といった方法があります。
収縮処理とは、そのノイズの周りにある黒の画素を1画素分だけ内側に伸ばし、白を狭める処理のこと。そうすることで白は消え去ります。

また「膨張処理」といった方法もあります。先程の収縮処理とは反対に、背景となる色の画素を1画素分だけ外側に伸ばしノイズを処理する方法です。


「フィルター処理」

これもノイズ除去と同じようなもので、レンズについたホコリを、画像を滑らかにすることで処理する方法です。
除去したいものの周囲のピクセルの濃淡値の平均値や中央値を抽出し、掛け合わせることで滑らかな画像を作ることが可能。


「エッジ検出」

これは、極端に濃淡値の違う場所には、モノとモノとの境目つまりエッジがあるという考えに基づいています。つまり、白と黒の境目がはっきりした箇所には境界線があるよねということ。
それを利用し、明暗がはっきりと分かれる場所をあえて強調し、同じ程度の明るさの場所を目立たなくする。それがエッジ検出という画像処理です。


「二値化」

冒頭、それぞれの色は256段階の数値で表すと書きました。この256段階のカラー画像を2段階、つまり白黒にする処理、それが二値化です。
最初にご紹介したグレース変換よりさらに無駄なデータを削ぎ落とすことができます。
また、色の情報が0と1の2種類だけになるので、コンピューターにとって計算がしやすくなるという絶大なメリットもあります。
これはコンピューターの文字や数字認識に活用できます。


「ネガポジ反転」

これは、画像内の白い部分と黒い部分を反転させる加工のこと。


「モザイク処理」

これは、画像内の正方形の範囲を同じ色で塗りつぶす処理のこと。


「トリミング」

画像の上下左右といった一部分を切り落とすのも画像処理に入ります。


いかがでしたでしょうか?普段、iPhoneの写真アプリやインスタグラムでできる写真編集機能もこういった技術を使っていたのですね。そう思うとなんだか身近に感じられてインプットしやすいものですね!

最後まで読んでいただきありがとうございました。この記事を気に入ってくれた方はスキとフォローをお願いします!

PLEN Roboticsのnoteは毎週金曜に投稿中!次回もお楽しみに~☆

この記事が参加している募集

企業のnote

with note pro