画像処理の種類
最初に「画像処理の話」と題して紹介したように、ここでは一般によく利用される画像処理方法の背景や、
基本的な考え方をお話していくことにします。
どんな技術でも掘り下げればとても奥が深いもので、
一般的な画像処理の利用の他には画像計測、認識、宇宙観測、治療、
更には3DCGのような画像生成、など多方面での応用がありますが、
表面上異なるように見えても掘り下げていけば基本的には共通するところに到達することでしょう。
それは、一枚の写真や観測物体をデジタル化して、コンピュータの中へ取り込んだところから話は始まります。
勿論、写真や観測物体の光情報をアナログの電気信号に変え、
更にデジタル信号に変換する過程でもかなりの信号処理が施されており、
このでき具合だけでもコンピュータに取り込んだ画像の品質が違ってきます。
ここがうまくできていないと、その後でどんなに画像処理してもたいした効果は期待できなくなります。
特に、画像の中でよく見えなかった部分を浮き出して見えるようにしたり、
ぼけていて見えにくい画像を鮮明にしてみるなどの操作はよく行なうことですが、
これとても元の画像に、処理に耐えうるだけの情報を含んでいなかったり、
ノイズの多い画像などでは処理が難しくなります。
画像処理の中で最もよく利用する効果的なものに次のような方法があります。
(1) 画像のもつ濃度特性を変えるだけで見た目のよい画像に仕上げられる濃度変換 (階調変換・色調変換)。
(2) 画像の強調(鮮明さ・シャープネス)や平滑化(スムージング)、輪郭抽出などを行なう空間フィルタ。
(3) 画像の大きさや傾き(拡大・縮小、回転、デフォルメ)を変える幾何学変換 (アフィン変換)。
などが最も一般的な画像処理になります。
更に、基本的には空間フィルタと同じことですが、
その特殊な効果として版画のように画像に凹凸をつけることのできるエンボス効果や、
一部または全体を目隠しするモザイク効果などがあります。
(4) これらを基本に少し手を加えて、すなわち画像がもつ色情報の混ぜ合わせ具合を工夫していくと、
画像を部分的に修正したり、複数画像を合成したりの画像加工ができるようになります。
(5) 一枚の写真などをデジタル化したとき、その画像情報は膨大になりますが、
その画像の性質や人の視覚特性を巧みに利用すると画像情報をかなり圧縮することができるようになります。
(6) 少し特殊になりますが画像の色数をできるだけ少なくして、
しかもなるべくフルカラーに近い画質で表現するために画像を減色するという方法があります。
この(5)、(6)はインターネット上ではJPEG、GIF、
PNGといった画像ファイルとして最もよく利用されています。
(7) 更に3次元グラフィックスの画像マッピングやレンダリングというほとんど数式の羅列のようなものですが、
この技術を応用すると写真画像ではとても表現できないような、
たとえば一枚の写真にサンセット/サンライズ効果を付けたり、虹を生成してみたり、
照明効果を与えたり等々の特殊効果をもたらすことができるようになります。
★ 以上が身近な画像処理と云うことになりますが、
デジタル化した写真画像にこれらの処理を施したときどのような効果があるか基本的なところをこれからお話していきますが、
百聞は一見にしかずで、実際に画像処理したサンプル画像を見るのが最も分かりやすいでしょう。
このために実際例を多数用意し、
「画像処理サンプル」ページで掲載していますのでご覧ください。
但し、画像圧縮については非可逆圧縮のJPEGや可逆圧縮のPNGを中心にこのコーナーで扱っていきます。
最近のコンピュータのように処理速度が大幅に向上してくると、
これまで簡単にはできなかったことが実現できるようになり画像処理の応用にも幅が広がってきました。
その一つに3次元グラフィックス (3DGC) をとり上げることができます。 これは既に存在する画像を処理すると云うより、
全く新しい画像を創り出す技術で、たとえばゲーム機のように仮想空間の中でいろんな場面を創り出しています。
コンピュータの処理速度が向上すればするほど、よりリアルな画像が生成できるようになります。
遊び以外でも、実際の空間を3DGCで表現してその中で実際に起こり得る行動をシミュレーションするなどが行われています。
★ しかし、ここまで話を広げると大がかりになってしまいます。
もっと身近な例としては一般写真に3DGCを採り入れることができます。
つまり写真と3DGCを融合させるということです。
3DCGを大まかに云うと、想定する物体の形状を線画 (ワイヤフレーム) で3次元的に作り出すモデリングと、
そのモデルの面上に反射、屈折、透過率など実際と同じような条件で光を照射していくレンダリング技術によって成り立っています。
・・・ これらについては、後半で詳しく掲載する予定です。
一般写真に3DCGを採り入れることは、
3次元空間に配置された線画のモデル物体上に平面写真をテキスチャマッピングという技術で3次元的に貼り付けておき、
更に光源からの光線を現実に近い方法でその物体の上に照射していくことです。
最も簡単な例ですが下の画像(1)は、箱形の形状モデル(2)の右側面に人物写真をマッピングし、
上方より赤光を、下方より緑光を照射して得たサンプル画像です。
また、画像(3)は一部しか示していませんが、
同じく箱形の形状モデル(4)の全体を内側から包むように(4)の壁材写真をマッピングして、
天井右隅に簡単な緑灯を配置してみた例です。
簡単な例ながら、壁の材質感や壁への光の映り込みなどの自然な感じは写真と3DCGの融合効果によるものだと思います。
★ このような例は建物の内装モデルなどによく使われます。 つまりすべてを3DCGで創り上げると、
たとえば壁や柱、床など材質の質感表現が難しい場合に実際の写真をマッピングすることによって、
より豊かな材質感を表現できるようになるからです。
★ このホームページで掲載する照明効果の画像処理サンプルでも、
方法は異なるもののレンダリング技術の理屈だけは多く利用しています。
画像には多くの冗長信号をもっていることは前にも述べました。
一枚の写真をデジタル化してルーペで大きく引き伸ばして観察してみると右図のように、
写真も一つ一つの画素の集合体であることが分かります。
それらの画素をよく見ると、近傍画素同士が非常によく似た場合と全く違う場合が混在していることが分かります。
★ ルーペで覗いたときの平坦部分の一つの画素に注目するとその画素の近傍画素も同じような状態になっていることは、
その近傍画素はそれほど重要な情報源にはなっていないことになります。
一方、変化の激しい部分の近傍画素は注目画素と全く違う状態になっており、
このことはその近傍画素が重要な情報源であることになります。
ここまでは画像の中に含まれる各画素が重要な情報か否かの話ですが、
一方、人には視覚能力と云うものがあって、この特性もよく知っていると画像処理する際に大変役に立ちます。
★ 非常におおざっぱな言い方をすると、大脳の働きが作用して一般には、
画像の変化の激しい複雑な部分は平均化するように、
また変化の少ない平坦な部分でそこから急に状態が変わるような部分は、
その変化点を注視するように見る習性があります。
前者を積分効果、後者を微分効果と云っておりますが、
これもそのときの人の状態によっても見方に差がでてきます。
★ これらのことを踏まえた上で、
つまり各画素の重要性や人の視覚特性をうまく利用して伝送コスト削減に役立っているのが画像圧縮方法です。
画像圧縮の詳しくは別の機会に掲載しますが、
たとえば毎日のように家庭で見る現行方式のテレビでも、これらの特長をうまく利用して伝送コストを削減しています。
NTSC方式において画像のR、G、B信号をわざわざY、I、Q信号に変換して送っているのもこのためです。
次回は、画像のもつ情報量(エントロピー)とその情報量を変えたときの画質の変化、 ディザの効果などについてお話します。
|