HOME > 研究活動・産学官連携 > ネットジャーナル > ネットジャーナル36

ネットジャーナル36

人間の視覚を模した画像を実現する適応的階調補正

――具体的にはどのような技術が使われているのですか。

博士(工学)本村 教授

筒井 主に開発しているのは、Full HD動画像の自動補正に関する技術です。最近のデジタルカメラやスマートフォン搭載カメラなどには逆光でも露出を補正する機能がありますが、私の研究はそれと同じようなことをFull HDの動画像でリアルタイムに行うものです。図1(図1)を見てみましょう。一番左の入力画像(S)は、空が明るく、手前の建物と路面は暗くなっています。これは照明光(L/推定環境光)と反射率(R/色恒常性)がかけ合わさったものだと推定し、入力画像から照明光(L)を抜く(=反射率(R)の成分を抽出する)ことで人間の視覚と同じような見え方に補正するという考え方です。これを「適応的階調補正」と呼んでいます。(解説1)。

適応的階調補正により入力画像の補正手法は確立できましたが、これをFull HD動画像でリアルタイムに行うには、大量のデータを高速で処理する技術が必要です。元の解像度をそのまま使ったのでは処理が間に合わないので、いったん低解像度で処理し、最終的に元の解像度に拡大するという方法を考案しました。

図2で説明しましょう(図2)。元の解像度のフレーム1枚を8分の一に圧縮し、SRAM(S)に一時保持しておきます。次に圧縮したデータの照明光推定(繰り返し処理)を行い照明光を算出。その結果をSRAM(I)に保持します。最後にSRAM(I)の結果を元解像度のフレームに適用して補正処理するのですが、元解像度のフレームはSRAM(S)、SRAM(I)に使われた2枚のフレームの後に来るものを使います。つまり、最終的な補正画像には2フレーム前の処理結果を用いることになるのです。(動画1/解説2

2フレーム前の処理結果といっても1フレーム60分の1秒という短さのためほとんど違和感はありません。しかし、人や車が動いていたり画面が移動している場合は画像のズレが若干生じます。元解像度のデータを2フレーム分バッファリングして処理結果と同期させることも可能なのですが、メモリを大量に使用することなどから実用的とは言えず、今回の提案では採用しませんでした。

ページの先頭へ