画像の可逆圧縮：その２

画像の可逆圧縮：その２

page ガンマ補正値の埋め込みについて少しお話してみます。
通常ビデオカメラで撮った画像をＣＲＴモニターで見るとき、ビデオカメラに入る光の強度と、その画像をＣＲＴモニターで見るときの光の強度が対応しているときガンマ値は１になります。
しかし通常の系では必ずしも一致するものではないためガンマ補正が必要になります。
★　通常のパソコンで使うＣＲＴモニターのガンマ値は、オフィスの明るさの環境では 2.2、暗い部屋の環境では 2.0 程度が妥当な値と云われています。
実際には画像を見る環境によって影響を受けますが、画像をＣＲＴモニターを通して見るときの光の強度は、画像の各画素値に2.2乗した値がガンマ補正値になります。
すなわち、(ＣＲＴから目に入る光の強度) ＝ (画像の画素値)^2.2　で表すことができます。
また、ビデオカメラで撮ったときの光の強度に対する各画素値のガンマ補正値は次式で表されます。
画素値＝ (ビデオカメラに入った光の強度)^1/2.2
つまり、ビデオカメラを通して得られる画像は(1/2.2)のガンマ値をもつことになります。
★　ビデオカメラで撮影した画像を人がＣＲＴモニターで見るまでの過程で、いろんなガンマ値が入ってきます。　最初はビデオカメラのＣＣＤセンサー（ガンマ：1.0）で撮像した信号がカメラから出力するときのガンマは 1/2.2 になっています。　次にこの画像信号を何らかの処理をしてファイルに保存するときのエンコーディングガンマ、そのファイルを読み取って何らかの処理するときのデコーディングガンマ、ビットマップ展開された画像メモリから画像信号をＣＲＴへ送るときに補正を加えるＬＵＴガンマ、そしてＣＲＴモニターに表示するときのＣＲＴガンマ（2.2）、とＣＲＴモニターシステムによるディスプレイガンマ、最後にその画像信号が光の強弱として人の目に入るときのガンマ、これだけの過程を経ながらガンマ値はそれぞれの積で人の目に伝達されます。

page このような系の中で、光の強度に応じて適当なガンマ値をＰＮＧファイルに保存しておくことができますが、画像を表示するときにこのガンマ値を使って補正するか否かはアプリケーションソフトによって異なります。
現在お使いになっているブラウザがガンマ補正処理を行っているか否かは下の画像で分かります。　下の３枚は同じ画像でガンマ値だけ変えて保存したＰＮＧファイルです。
但し、ＰＮＧファイルをサポートしていないブラウザでご覧になっている場合には、画像は表示されません。
３枚の画像の明るさが違って見えればご覧のブラウザはガンマ補正を行っており、３枚とも同じ明るさに見えればガンマ補正を行っていないブラウザであることが分かります。

ガンマ補正なしガンマ 0.7 ガンマ 1.0 ガンマ 1.3

★　因みに上の画像はＲＧＢ２４ビット画像ですが、ＢＭＰファイルサイズで 49,202 バイトだったものが、ＰＮＧファイルサイズでは 2,988 バイトになっています。　この画像を８ビットに減色してＧＩＦファイルで保存すると 7,710 バイトになっており、ここでもＰＮＧファイルの方が有利なことが分かります。

可逆圧縮について
page ＪＰＥＧでは画像情報をエネルギー的に扱い、主に人の目に応答しないような色成分や周波数成分を積極的にカットする方法で圧縮効果を高めていましたが、ＰＮＧでは可逆圧縮アルゴリズムが使われているため、圧縮画像を再生したときＪＰＥＧのような劣化は起こりません。
したがって、ＪＰＥＧで苦手なイラストやドキュメント画像のように色数の少ない画像では、きわめて有効な画像ファイルと云えます。　或いは、レンダリング処理した３ＤＣＧ画像のように高周波成分が比較的少なく、且つ輪郭部分での劣化を嫌う画像ではＪＰＥＧより効果的と云えるでしょう。

page 可逆圧縮と云うことは、前にも述べたように画像のもつ冗長な情報を取り除いてエントロピー符号化することです。
つまり、画像の冗長な情報を取り除くために先ずは画像に偏りが出るような何らかの変換を行います。
「画像圧縮：その２」でも出てきた、たとえば画素間の線形予測のような変換をしたとき、その変換座標軸上で予測値の発生頻度の分布を見るとそこには何らかの偏りが生じているので、この予測値の分布に最適なハフマン符号を与えてエントロピー符号化を行えば、それが可逆圧縮と云うことになります。
★　画像に冗長度が多いほどこの偏りも大きく圧縮効率もよくなるわけで、このような画像としてイラスト絵や減色したインデックス画像、或いは３ＤＣＧ画像が適していると云うことになります。
しかし、劣化を与えないと云う条件下では、線形予測してもその予測がおよそ当たっていれば良いと云うわけにもいかず、また予測の外れる確率が高いと圧縮にはつながりません。
★　ＰＮＧで使われるＬＺ７７やＧＩＦで使われるＬＺＷでは別の方法で冗長度を除く変換を行っています。

page ＬＺ７７、ＬＺＷ共に基本的には同じ考え方ですが、
たとえば、話を簡単にするため２ビットすなわち４色で表現する画像があって、その４色をＡＢＣＤの記号で表すとします。
そしてその画像を構成する画素の並びが、
A B A B A B A B B B A B A B A A C D A C D A D C A B A A A B A B ･･･
のようになっていたとします。
この例を見ると AB 或いは ABA の並びが繰り返し出てきているので、この辺に何か冗長度がありそうに見えます。
このような画素の並びから画像のもつ冗長度を取り除いて何らかの符号に変換することが、ここで云う可逆圧縮となります。
★　この変換方法として、最も分かり易いのが２値画像です。　ここでは画素列が０と１しか無いので、その並びの中で０が何個、１が何個続くか、つまり変化点までの距離(ランレングス)に変換すれば、かなり冗長度は減らせるような気がします。
ところが、同じ２値画像でも画素の並びが市松模様だったらどうでしょう。　この方法では、冗長度は減るどころかかえって増えてしまうかも知れません。
★　ＬＺ７７では、重複する文字列（たとえば AB とか ABA）を検出する毎にハッシュテーブルを作っておき、次に一致する文字列がでてくれば、それは前の文字列の位置に置き換える方法を採っています。　つまり一致する距離と重複文字列の長さを対にした符号に変換しています。　そして、この距離と長さそれぞれの発生頻度に適したハフマン符号を別々に与えています。
この距離と長さそれぞれの発生頻度の分布を測定してみると、おそらく何らかの偏りを持っているでしょう。　この分布の偏り方が大きいほど圧縮率も大きく、逆に一様分布だった場合には圧縮効果は無いことになります。
★　「画像圧縮：その２」でＪＰＥＧにおけるハフマン符号の割り当て方を説明してきましたが、ここでも同様にこの分布の偏り方に応じて、その発生頻度の多い値には短い符号を、発生頻度の少ない値には長い符号を割り当てるようにすれば冗長度の少ない符号化（エントロピー符号化）ができるようになります。
★　その符号の割り当て方として、距離や長さの値で発生頻度の大きい順に、たとえば
[0,10,1100,11010,11011,11100,11101,11110,111110,111111,･･･]
を割り当てたとすれば、一番発生頻度の高い値は１ビット、２番目に発生頻度の高い値は２ビットの符号で表現できてしまうことになります。
上例の符号間では","で区切りを付けていますが、符号化としてはこれも冗長になるので、実際の符号化では区切りを取り除いて、
[01011001101011011111001110111110111110111111･･･]
のように符号化します。　これでは一見、符号間の区別がつかないように見えますが、同期さえとれておれば復号するときの符号間の区切りは、ＪＰＥＧの復号化と同じようにテーブル参照方法で正確に検出できるようになります。
ＬＺ７７では、ハッシュテーブルは３２ＫＢに、長さは２５６Ｂに制限されています。
尚、ここでは"文字"として表現していますが、これはバイト単位のバイナリーでもかまいません。

page 以上のように、可逆圧縮では先ずは画素列の並びから同じ並びの冗長な情報を除くような値に変換し、次にその変換した値にハフマン符号を与えてエントロピー符号化することで圧縮しています。　この過程では、画素に何ら劣化を与えるような処理系が入っていないので可逆圧縮になるわけです。

－ 1999.12.20. －