車の衝突防止やスマホのロック解除…生活に欠かせない「画像認識」どこまで発展する?

技術進展で生活に不可欠なものに

―画像認識技術の用途が広がり、産業分野はもちろん、日常生活でも身近な存在になりました。
「人が得る情報の大部分は視覚情報で全体の8割以上とも言われる。画像認識技術は文字の読み取りや製品検査など限られた領域のみで使われてきたが、技術進化で利用範囲が大幅に拡大した。車の衝突防止機能や顔認証によるスマートフォンのロック解除機能など生活に欠かせない技術になった」

―画像認識の技術変遷は。
「視覚情報の処理を機械で再現する試みは50年以上前に始まった。ただ人間並みの処理性能になったのはここ10年足らずだ。機械が人と同じように対象物を認識するのはそう容易ではなく、例えば『犬』は犬種によって体形や毛色が違うのはもちろん、同じ犬でも角度やしぐさによって画像が異なる。人は無意識かつ瞬時に対象が犬であると判断できるが、機械はこのような多様性を単純な条件のみで判断するのが難しかった」

笠原亮介氏

―ブレークスルーの背景は。
「ディープラーニング(深層学習)の利用が大きい。従来は認識対象を正しく認識するために人が必要なアルゴリズムを作成する必要があった。深層学習により大量の画像データから対象物を正しく認識する手がかりになる『特徴量』を自動抽出できることが分かった。当時主にゲーム向けに使われていた画像処理用半導体(GPU)が深層学習の処理に適していたことも技術進化の契機だ」

―画像認識技術はどのように発展しますか。
「画像認識と大規模言語モデル(LLM)の組み合わせなどマルチモーダル人工知能(AI)に注目している。例えば自然言語で外観検査装置などに指示し、正しく処理できるようになれば、高度なプログラミングが不要になる。今後、視覚情報を基に動作するロボットに自然言語で指示を与えて作業を行わせることができるようになり、幅広い分野に大きなインパクトをもたらす可能性もある」

―22年にスタートアップを立ち上げました。
「リコーからカーブアウトした事業で、全方位に立体映像を映し出す映像装置を手がけている。現実空間上にカラーの輝点を描画することで、自然な3次元(3D)映像を表示する仕組みで、明るい部屋や屋外の日陰でも投影できる表示像の明るさが特徴だ。仮想現実(VR)用ゴーグルのような機器を体に着けずに3D映像が肉眼で見られる手軽さもある」

―今後の事業展開は。
「3Dコンテンツを活用した映像体験事業のほか、オンライン会議や教育、医療用途など幅広い情報伝達分野への展開を検討している。現在は直径15センチ×高さ20センチメートル程度の立体映像を表示できるが、サイズの拡大や高画質化により多用途展開を進めていきたい」

―画像認識技術を生かす考えは。
「例えばユーザーと双方向でのやりとりが可能なインタラクティブ機能やユーザーの顔など特定の対象物だけを切り取り、空間に表示させる機能の付加などが考えられる。デジタルサイネージやコミュニケーションなどの領域で生かせそうだ」(下氏香菜子)

◇笠原亮介氏(かさはら・りょうすけ)氏 ブライトヴォックス取締役最高技術責任者(CTO)
04年(平16)東北大院工学研究科電気・通信工学専攻修士修了、同年リコー入社。各種センシングシステムや画像処理、機械学習などの研究開発に従事。22年ブライトヴォックス取締役最高技術責任者。新潟県出身、43歳。
『トコトンやさしい画像認識の本』(日刊工業新聞社 03・5644・7403)

<書籍紹介>
化石燃料の高騰により電力コストが上昇する中、電力取引市場や再生可能エネルギーなどコスト抑制のための調達契約の進め方、操業計画など工場内の対策、外部事業者の活用法などを詳述する。工場稼働の柔軟性を上げる切り口や新たな生産プロセスの構築、顧客への新規サービス提案に結びつく具体策を図解で指南する

 
書名:今日からモノ知りシリーズ トコトンやさしい画像認識の本
著者名: 笠原亮介
判型:A5判
総頁数:160頁
税込み価格: 1,980円

<販売サイト>
Amazon
Rakuten ブックス
Nikkan BookStore