メルマガイドよくある質問サイトマップ

2008メルマ!ガ オブ ザ イヤー発表
2008メルマ!ガ オブ ザ イヤー発表

視覚装置(3次元LSI、MIMD/SPMD、同期/非同期)、局所並列画像処理(多色分類、文字抽出)、3自由度回転システム(人工眼球、自在雲台、手先効果器)、盲導犬ロボット(携帯、カメラ、プロジェクタ、視聴触力覚ナビゲーション)、ホムンクルス

RSS
トップ > 自然科学&技術 > 技術 > 視覚装置(3次元LSI、MIMD/SPMD、同期/非同期)、局所並列画像処理(多色分類、文字抽出)、3自由度回転システム(人工眼球、自在雲台、手先効果器)、盲導犬ロボット(携帯、カメラ、プロジェクタ、視聴触力覚ナビゲーション)、ホムンクルス
最新号をメルマガでお届け

この記事の発行者<<前の記事次の記事>>最新の記事

【解説】視覚装置 v.s. 画像処理装置

発行日: 2008/5/25


読者の皆様へ

(株)エッチャンデスの味岡です。
気が付けばいつの間にか読者が200名を越えていました。
初期の頃からお付き合い頂いている方々には心より御礼申し上げますと共に、
最近登録された方々におかれましても末長く宜しくお願い申し上げます。
それにしても、みなさん物好きですね。
実際、どういう人が読者なのか私には断片的にしか判らないのですが、
200名という人数の割りに分布は広範囲に広がっているようです。
何分このメールマガジン、私の気が向くまま、話があっちこっち飛びますから。
尤も、最近もたまに視覚装置や3自由度回転システム(パラドックスベアリング)の
資料請求を頂くのですが、
視覚装置と画像処理装置の違いが良く判らないという方も居られるようでしたので、
このメールマガジンの本来の目的に立ち返って、ここらでちょっと解説なぞをします。
なお、このメールマガジンのお約束ですが、
ここに書かれていることが真実である保証はどこにもありませんので、
あくまで自分の目で見、耳で聞き、頭で考えて、
自らの責任で事の真偽を判断してください。

それではまず、視覚装置というのは、その歴史的背景から、
主に人に映像を見せるものを指します。
例えば、覗き眼鏡や幻灯機、ソードロープなどがこれに当ります。
http://web.kyoto-inet.or.jp/people/b-monkey/misc.html
http://www.meijitaisho.net/magiclantern/
http://www.rakuten.co.jp/crafteriaux/399278/400805/
したがって万華鏡も視覚装置となります。
http://ja.wikipedia.org/wiki/%E4%B8%87%E8%8F%AF%E9%8F%A1
http://kaleido-japan.com/history/
http://cumos.jp/
また、写真を見せる覗き眼鏡のみならず、
ピンホールの原理を応用したカメラ・オブスキュラなど、
実際の映像を射影したようなものも視覚装置に含まれます。
http://ja.wikipedia.org/wiki/%E3%82%AB%E3%83%A1%E3%83%A9%E3%83%BB%E3%82%AA%E3%83%96%E3%82%B9%E3%82%AF%E3%83%A9
http://contest2.thinkquest.jp/tqj2003/60460/rekisi.htm
http://www.akusyu.com/contents_01/workshop/wrokshop04/workshop_04.html
後に、これに複数のレンズが取り付けられた顕微鏡や望遠鏡が発明されますが、
これも視覚装置として扱われます。
http://www001.upp.so-net.ne.jp/artichoke/class/07theoriesP2.html
さらに20世紀に入り、撮像素子の発展によりテレビ技術が進歩すると、
撮影した映像をモニタを介して直接見ることができるようになりましたが、
これ以降、撮像素子(イメージセンサ)が取り付けられた電子機器も
視覚装置と呼ばれるようになります。

さて、撮像素子の発明により
一旦映像が電子的な信号の集まりである画像に変換されるようになると、
この画像に対して様々な電子的操作、
所謂「処理」を行うことができるようになります。
簡単なところでは明るさの調整やエッジの強調からMPEGのような画像圧縮など、
現在では様々な処理が行われているのですが、
主にこの処理を行う装置のことを画像処理装置と呼びます。
つまり、視覚装置と画像処理装置の関係は、
1)画像処理装置は視覚装置の後段の処理を行う
2)画像処理装置は視覚装置の機能の一部を担う
となります。
より厳密に言えば、
画像処理装置が如何にして入力画像を処理するかに主眼が置かれるのに対し、
視覚装置は如何にして出力画像を後段に伝えるか、
さらには適切な出力画像を生成するために如何にして入力画像を撮影するかに
主眼が置かれることになります。
例えばデジタルカメラやビデオカメラを例に挙げると、
撮影された画像を圧縮するものが画像処理装置であるのに対し、
手ブレ補正などを行うものが視覚装置となる訳です。
このとき視覚装置にとってカメラや撮像素子などの光学器機は
必ずしも必須という訳ではありません。
例えば、人の顔を見付け出すものが画像処理装置であるのに対し、
顔の明るさに応じて明るさ補正等を行うものは視覚装置であり、
かつ画像処理装置にもなります。
要は、視覚装置は出力画像がどのように「見られる(処理させる)」のかを
常に念頭に置いており、もし可能であれば、
望むべき結果が得られるように必要な画像を撮影することが重要なのです。
なお、前述のように視覚装置の出力(主に画像)は単純に人間が見る以外に、
コンピュータなどの電子機器にも入力されることになりますので、
このとき電子機器における処理と人間の行動(神経活動)を比較することにより、
人間の行動を再現する、あるいは人間の行動を理解する
ことができるのではないかと次第に考えられるようになり、
これが後に人工知能やロボット工学などへと発展していきます。
http://www.ai-gakkai.or.jp/jsai/whatsai/rloadmap.html
http://www.miyagi-ct.ac.jp/ee/lab/karasawa/3.pdf

ところで、視覚装置が後段の処理を常に意識していることは理解して頂いたとして、
では視覚装置は何を基準に動作すれば良いのでしょうか。
この価値の基準となるべきものが、私が言うところのホムンクルスとなる訳です。
例えば情景画像
http://shm-consortium.renesas.com/jpn/partner_view.php?partner_id=66
に示すように看板や標識などを撮影した場合、果たして何をすれば良いのでしょうか。
「葬祭場」の文字を読み上げることでしょうか。
「南幸2-15」の場所を特定することでしょうか。
バスの行き先を識別することでしょうか。
文字のサイズが小さくて認識しづらい文字列を拡大して撮影することでしょうか。
それとも全部文字認識をして、全てを読み上げればことが済むのでしょうか。
残念ながら現在に至るまで多くの研究者の努力にも係わらず、
この要求を満すことができるコンピュータは存在しません。
丁度3月5日のNatureオンライン版に因りますと、
人がさまざまな画像を見ることによって起こる脳パターンを予測する
コンピュータモデルがカリフォルニア大学バークレー校で開発されたそうですが、
http://wiredvision.jp/news/200803/2008031022.html
実用化されるまでには未だ未だ時間が掛るでしょうね。
そもそも本質的なところに問題があることが予測されるので、
実際どこまで使えるものなのか、、、。
そこでホムンクルスに対する私のアプローチは、
まず、ある人の視覚機能及びホムンクルスを、
コンピュータシステム及び判断をする別の人とのアナロジーと見做し、
この判断をする人がその場の状況に応じて判断をし、
それをコンピュータシステムがサポートするところから初め、
徐々に判断をする人の役割を小さくして行くと共に
コンピュータシステムに置き換えて行くことにより、
何が置き換え不可能であるのかを明らかにしていくことです。
勿論ホムンクルスに到達するには私の死後100年は掛ると思いますが、
只、コンピュータシステムを盲導犬ロボット、
盲導犬ロボットを使う人をユーザ、判断を行う人をサポータとすれば、
視覚支援サービスとして成立させることができるので、
多くの人にとって可能な限り速やかに役に立つものになると思います。
そう言えば、もう30年にもなるか、、、。

さて、最近の動向について簡単に書いておきます。
1)3自由度回転システム(パラドックスベアリング)の
人工眼球/自在雲台/手先効果器兼用標準モデルですが、
現在諸般の事情でお見せできない状態になっています。
何名かの方にはご来社頂いたのですが、お見せできず申し訳ありませんでした。
お見せできるようになりましたら、追ってご連絡致します。
まさか私がここまでメカ設計をすることになるとは当初思いもよりませんでしたが、
6年越しの成果ですのでもうちょっと待っててくださいね。
それにしても安い部品で強度を保ちながら組立と分解を出来るようにするのには
正直骨が折れましたよ。ホント、そろそろプロに頼みたい!!!
また、この関係でコントローラの選定が遅れております。
先日東京ビッグサイトで新商品を見付けてきましたので、
いい加減そろそろ決めたいと思っているのですが、なかなかどうして。

2)5月30日に、シャープさんが業界最小・最薄の
500万画素のCMOSカメラモジュールを発売するそうです。
http://www.sharp.co.jp/corporate/news/080521-a.html
AF機能付きでサイズが9.5mm x 9.5mm x 6.6mmだそうです。
現在標準モデルにおけるロータの空洞が9mm x 9mm x 13mmなのですが、
幅と高さをあと1mm増やすことは可能なので、十分入りますね。
信号線の仕様が不明なので指示棒の中を配線できるか不明ですが、
余程信号線が太くない限り、まぁ何とかなるでしょう。
ちなみに、以前話題に上がったイーメックスさんの人工筋肉を用いた
ゲル可変レンズでも載せられれば、ズーム機能も行けるかも知れませんね。
http://www.melma.com/backnumber_60083_4066020/
さらにこれから3次元LSIが立ち上がってくるので、いよいよ楽しみです。
これなら防振機能付きビデオカメラとか出来そうです。
運動会で並走しながら顔のアップとか取れるかな?

3)5月14日、トヨタ自動車(株)BR制御ソフトウェア開発室 林和彦 室長さんの
講演を聞いてきました。
それにしても自動車の電子化は凄いですね。
http://techon.nikkeibp.co.jp/article/NEWS/20080507/151370/?ST=ATI
http://techon.nikkeibp.co.jp/article/NEWS/20080507/151367/?ST=ATI
これから車載無線はBluetoothだそうです。参考にさせて頂きます。
なお、月末に無線センサーネットワークの会合があるので、
また面白い話が聞けるかと思うと楽しみです。

4)5月24日の中日新聞11版10面に因りますと、
大手メーカーではこの1年ほどで純正カーナビの装着率が約10%上がったそうです。
まぁこうなるのは予想できたことですが、今やカーナビも標準装備なんですね。
頑張ってください。
ちなみに、視覚支援サービスというのもありますので宜しくお願いします。

それでは。

--
                                    (株)エッチャンデス
                                            味岡

この記事の発行者<<前の記事次の記事>>最新の記事

 
  規約   
>> メルマ!の会報誌もお届けします

ブックマーク: はてなブックマークに追加del.icio.usに追加Buzzurlにブックマークニフティクリップに追加ライブドアクリップに追加Yahoo!ブックマークに登録My Yahoo!に追加Add to Google

この記事へのコメント


コメントを書く
コメントはありません。

このメルマガの最近の記事





おすすめメルマガ詰め合わせ2009年 あなたの今年の運命は?ゆく年くる年メルマガ!

メルマ! ガ オブ ザ イヤー 受賞メルマガ2008年度の受賞メルマガ
2007年度の受賞メルマガ
2006年度の受賞メルマガ
2005年度の受賞メルマガ




melma! ご利用規約 │ メールマガジン発行規約 │ マスコミに関するお問い合わせ │ 会社概要 │ プライバシーポリシー
インターネット広告 サイバーエージェント