Y's note

Web技術・プロダクトマネジメント・そして経営について

本ブログの更新を停止しており、今後は下記Noteに記載していきます。
https://note.com/yutakikuchi/

DeepLearningによる画像解析

概要

http://www.image-net.org/challenges/LSVRC/ http://www.image-net.org/challenges/LSVRC/2012/

@yutakikuchi_です。 ILSVRC(ImageNet Large Scale Visual Recognition Challenge)はImageNetが毎年主催するコンピュータを利用した画像解析による物体認識・検出のコンペ。2012年にDeepLearningの手法が登場し、物体認識・検出の技術として3位以降のMachineLearningチームとError率で圧倒的な差をつけて優勝したことから注目を集めた。DeepLearningによる画像解析タスクといっても目的が複数存在するため、言葉の定義を下記にまとめる。

  • 物体認識(Object Recognition・Classification) : 1枚ずつの画像毎に何の物体であるかを認識する。(1枚の画像に対して1つの物体のラベルを付与する。)
  • 物体位置特定(Object Localization) : 1枚の画像の中に物体が何処に映っているかの領域を認識する。
  • 物体検出(Object Detection) : 1枚の画像の中に何が何処に映っているかを検出する。(1枚の画像に対して複数の物体のラベルと領域を認識する。)
  • セグメンテーション(Segmentation) : 1枚の画像の中に何が何処に映っているかをピクセル単位で分離する。

Object Recognition: which object is depicted in the image?
Object detection: where is this object in the image?

Ref : image processing - Object detection versus object recognition - Signal Processing Stack Exchange

画像解析アルゴリズム

f:id:yutakikuchi:20180916233821p:plain:w450 f:id:yutakikuchi:20180917013315p:plain:w450 DeepLearningの画像解析アルゴリズムは目的により多数あり、それぞれで使用目的が異なる。

Ref : Object Localization and Detection - Artificial Inteligence A 2017 Guide to Semantic Segmentation with Deep Learning

物体認識の精度比較

f:id:yutakikuchi:20180917011720p:plain:w450 左図はCNNベースの物体認識(Object Recognition・Classification)の精度比較グラフ(縦軸精度)であり、後発のアルゴリズムほど精度が高い様子が分かる。右図は精度(縦軸)、学習速度(横軸)、メモリ使用量(円の大きさ)を示している。一般的には精度が高くなれば学習速度が遅くなる。精度、学習速度・メモリ使用量はそれぞれtrade offの関係となるようだ。

Ref : Object Localization and Detection - Artificial Inteligence https://arxiv.org/pdf/1605.07678.pdf