難易度:★★★☆☆
当ジムでは、画像認識分野に含まれるタスクの一種である物体検出について学習します。 「独自のデータセットに対して、最先端の物体検出アルゴリズムを実行するためのスキルを身につける」ことが、当ジムにおける目標となります。 (※ 物体検出アルゴリズムの具体的な実装方法については、当ジムにおける学習の対象外です。)
当ジムの後半では、【SOTA】国立国会図書館の画像データレイアウト認識のデータセットを題材に分析を行っています。リンク先からデータセットがダウンロードできるようになっているので、受講後に実際に手元で分析を行いたいという方は、ぜひこちらのコンペティションにチャレンジしてみましょう。
Mission 1
ミッション1では、「物体検出」というタスクの概要について把握することを目標とします。
同じく画像認識分野の1タスクである「画像分類」とは何が違うのか、
どのような基準でアルゴリズムの性能を評価するのか、といった観点から「物体検出」について学びましょう。
物体検出とはどのようなタスクであるのかについて学びます。
物体検出アルゴリズムの予測性能を測る評価指標について学びます。
Mission 2
ミッション2では、どのようなアルゴリズムを用いて物体検出が行われているのかについて把握することを目標とします。
特に、近年深層学習技術が活用されるようになって以降、物体検出向けに構築されたモデルが、どのようなモジュール群で構成されているのかについて学びましょう。
近年、深層学習技術が活用されるようになって以降の物体検出アルゴリズムが、どのようなモジュール群で構成されているのかについての概要を学びます。
Mission 3
ミッション3では、最先端の物体検出アルゴリズムを使い、独自のデータセットに対して物体検出を実行するまでの手順を紹介します。手順は、以下の3つのステップに分かれています。
Step1: 高性能なアルゴリズムを見つける
Step2: アルゴリズムの全体像を把握する
Step3: アルゴリズムに調整を加える
参考URL:
Papers With Coce: https://paperswithcode.com/
GitHub リポジトリ(Yet-Another-EfficientDet-Pytorch) : https://github.com/zylo117/Yet-Another-EfficientDet-Pytorch
Mission 4
ミッション4では、物体検出タスクにおいてアルゴリズムの性能を測る際の標準データセットである「COCO データセット」について学びます。近年ネット上に公開されるアルゴリズムの多くは「COCO データセット」に対して実行することを前提に実装されています。そのため、自分自身が保有するデータセットを「COCO データセット」と同様のフォーマットで保存しておくことで、最先端のアルゴリズムを転用することが容易になります。Task1では、「COCO データセットに対する理解を深めること」Task2では、「独自のデータセットをCOCO データセットと同様のフォーマットに修正する過程を体験すること」をテーマに、課題を作成しています。
COCO Datasetのアノテーションファイルを読み込み、どのようなフォーマットで情報が保存されているのかを確認します。
独自のデータセットのアノテーションデータを再構成し、COCO フォーマットのJSONファイルとして作成し直す方法を学びます。
最後に、当ジムの振り返り及び今後の学習の進め方についての説明を行います。
参考URL:
SOTAコンペティション 「国立国会図書館の画像データレイアウト認識」: https://signate.jp/competitions/262
COCO データセット: https://cocodataset.org/#home