画像圧縮:その1
画像のもつ情報量は膨大である、だからこれらの情報を効率的に伝送したり保存したりするために画像を圧縮します。
これは一般的にいう言葉ですが、ところで情報とは何かが先ず問題になります。
★ 人が見たり聞いたりして大脳に何らかの刺激を与えるものが情報ではないでしょうか。
そんなことを云うと情報とは個人によって千差万別ということになって話がとぎれてしまうのでこの辺はあまり深入りしません。
「画像の情報量」の項でもお話したように情報を理論的に考えていくと割合楽に扱えるのですが、
最終的に人が見て判断するところまで含めると話が複雑に絡んでくるのです。
★ ここでは、アナログ信号をデジタル信号としてコンピュータの中に取り込んだ時点で、
これをオリジナルの画像情報として扱います。
実際には信号を取り込む度にバラツキが発生するわけですから、
このバラツキの範囲内の信号は冗長になります。
取り込んだ画像情報の中にはこれらを含んで多くの冗長度があり、更には人の視覚特性や曖昧さも考慮に入れて、
その情報の中に含まれる不要と思われる情報を除いていこうとするのが画像圧縮の出発点になります。
先ず画像情報のもつ冗長度についてですが、冗長とは無駄が多いと云うことですから、
たとえば長電話してもそのうちどれだけ情報として伝わったか、大半は不要なものだったかも知れません。
こんなことを云えば、ここでの説明にも無駄が多く、つまりは冗長な説明であることは否定しません。
しかし、簡潔に要点だけ伝えれば、その背景が抜けて相手によく伝わらないこともあるでしょう。
★ 画像情報の冗長度でも同じようなことが云えます。
冗長度として一番分かり易いのは、たとえば文書をスキャナーで読み取ってコンピュータへ入力したとき、
これも画像情報になっています。
この中で相手に伝えたい情報は文章であって何も書かれていない白紙部分は冗長(不要な情報)と云うことになります。
例外として、白紙部分に付着しているゴミの程度が重要ならこれは冗長ではなくなります。
更に、文字の部分を見てもまだ沢山の冗長度があります。
図で示すように白から黒またはその逆の変化点だけが本当に必要な情報となります。
しかし、人は文字をパターンで認識するので、
実際にはある変化点から次の変化点までの画素数だけが必要な情報となり、
それ以外は冗長になる訳です。
たとえば、文字を左端からスキャンしたときの白と黒が(白32黒5白26黒3・・・)に配列された画素群であれば、
32,5,26,3,・・・が必要な情報で、それ以外は不要な情報になります。
★ 画像情報も同じことで注目画素が近傍画素と同じ値ならそれは冗長になります。
同じ値でなく近傍画素とおよそ同じ値でもそれを冗長とみなすこともできますが、
この場合は正確には伝わらないので画像情報としては劣化したことになります。
しかし、そこまで正確に伝わらないといけないのか、と云うことが次の議論になります。
人が物を見るときの曖昧さや、アナログからデジタルへ変換するときのバラツキなどがあって、
それ以上の精度を要求しない。
つまり必要な情報から外してもよい不要な情報が沢山あります。
★ 人の視覚特性を考えてみますと、以前の説明の繰り返しになりますが、
一般論で云えば、人が物を見たとき大脳の働きが作用して、
画像の変化の激しい複雑な部分は平均化するように、
また変化の少ない平坦な部分はその変化点を注視するように見る習性があります。
前者を積分効果、後者を微分効果と云っております。
画像圧縮ではこの性質を巧みに利用しているのです。
このような背景を踏まえて今度は、情報理論とか通信理論という点から見てみます。
情報理論とか通信理論という言葉があり、それに沿って少しだけ数式を見ながら説明します。
(1)式は画像の平均情報量(エントロピー)であって、
その画像に最も適した符号化ができれば、最大情報量から平均情報量だけ情報量を減らすことができ、
これをエントロピー符号化と呼んでいます。
そして、何らかの変換を行なって画像に偏りを持たせることができればエントロピーを更に減らすことができます。
つまり、(1)式で画素値(i)の発生確率であるPiが完全に一様分布をしたとき情報量は最大になります。
一般画像ではそのようなことは有り得ないことであって、何らかの偏りを持っています。
したがって、その偏りの分だけエントロピーを減らすことができ、
更に故意に偏りを持たすことができればエントロピーはもっと減るだろうと云うことです。
★ 一方、通信理論的にみて圧縮することは、能率的な伝送歪みを与えることになります。
情報を伝える伝送路に歪みDを許容したとき、
この歪み内で情報を伝送するに必要な情報量は(2)式で、
そのときの伝送に必要なエネルギーは(3)式で与えられ、
伝送情報量は(4)式だけ減らすことができることを意味しています。
★ その歪みの与え方として、これまで何度も出てきている人の視覚特性を利用しようということになります。
人は物を空間的に見ることと、視覚特性から考えると空間周波数領域で議論した方が分かりやすくなります。
このような背景を踏まえて次回は、
最もよく利用されているJPEGを中心に、上記の事柄がどのように使われているかを掲載していきます。
|