Quest 衛星画像の分類

難易度:★★★★☆

  • 業種
  • 社会インフラ・環境
  • 画像認識
  • 不均衡データ
  • DEEPLEARNING
  • 分類問題

「ビッグデータ」というキーワードの普及とともに、もとより大量のデータを有する衛星データへの注目が高まっています。2019年の2月に、日本発の衛星データプラットフォームTellusが誕生したことからも、今後ますますビジネスレベルでの衛星データ活用が加速することが予想されます。当クエストでは、地球観測衛星であるLandsat-8が観測した衛星画像データを題材に、画像分類モデルの作成に挑戦します。当クエストを通じて、これまで画像認識分野において積み上げられた知見を、衛星画像データに応用することのできる能力を身につけましょう。

※ 当コンテンツは、過去にSIGNATE上で開催されたコンペティション「産業技術総合研究所 衛星画像分析コンテスト(https://signate.jp/competitions/61)」によって得られた知見をもとに作成された教材となっています。

  • 5 時間
  • 3,000 Exp
  • 0 Videos
  • 13 Slides
  • 5 Missions
  • 13 Tasks
  • 47 Operations

はじめに 50 Exp

あなたは国内にてゴルフ場の経営事業を幅広く手掛ける会社に入社した新人データサイエンティストです。あなたは入社早々に上司から「今後の海外展開を見据えて、世界中のどこにゴルフ場があるのかAIで調べてくれ」と頼まれました。あなたは迷った末に、「地球観測衛星 Landsat-8」が観測した衛星データを利用して、衛星画像内にゴルフ場が含まれているか否かを判定する画像分類モデルを作成し、ゴルフ場を見つけ出す作業を自動化する方針を取ることを決めます。「検出の自動化によって、素晴らしい立地条件であるにもかかわらず、近くにゴルフ場がない穴場スポットをたくさん見つけ出せるかもしれない」とあなたは胸を膨らませて分析を始めました。

Slideを見る

Mission 1

テーブルデータの読み込みと探索的分析

あなたは多くの協力者とともに、「衛星画像のファイル名」と「画像内にゴルフ場が含まれているか否かのラベル」の対応をまとめたテーブルデータを作成しました。ここで改めて、作成したテーブルデータの分析を行い、今後の分析の方針に役立てましょう。

Slide 1
ミッション1の概要
    50 Exp
    Slide 2
    ミッション1の振り返り
      50 Exp

      Mission 2

      画像データの読み込みと探索的分析

      テーブルデータの分析を行い、ほとんどの衛星画像にはゴルフ場が含まれていないという事実を確認したあなたは、次に、各衛星画像の探索的分析を行うことにしました。今回データとして使用することに決めた衛星画像は、チャンネルを7つ持ち通常のカラー画像(3チャンネル)とは勝手が違うようです。各画像から読み取ることのできる情報はないか工夫してみましょう。

      Slide 1
      ミッション2の概要
        50 Exp
        Slide 2
        ミッション2の振り返り
          50 Exp

          Mission 3

          前処理とデータセット作成

          探索的分析を終えたあなたは、ディープラーニングフレームワークPyTorchを使って画像分類モデルを作成するという方針を定めました。PyTorchにはディープラーニングモデルの学習を行う際に便利な「前処理」や「データセットの設定」用の道具が多く用意されているようです。あなたはそれらの使い方を学びながら、モデルが学習を行うことのできるような状態にデータを整えるためのプログラムの作成に挑戦します。

          Slide 1
          ミッション3の概要
            50 Exp
            Slide 2
            ミッション3の振り返り
              50 Exp

              Mission 4

              モデリング

              データセットの設定を終えたあなたは、次はいよいよ画像分類モデルを作成し、学習を実行する段階に入ります。当クエストに適したモデルの選定方法や、モデルの学習を行う関数の作成方法を学び、高い精度でゴルフ場を検出することのできる画像分類モデルを作り上げましょう。また、モデルの学習が終わった後は、モデルの学習ログを確認します。精度が100%に至っていない限り、まだ改善の余地は残されているはずです。「どうすればより良い精度を達成するモデルにすることができるのか?」という視点でモデルの学習ログを分析しましょう。

              Slide 1
              ミッション4の概要
                50 Exp
                Slide 2
                ミッション4の振り返り
                  50 Exp

                  Mission 5

                  予測精度の改善

                  そこそこの精度でゴルフ場を見つけ出すことのできるモデルを手に入れたあなたは、より精度を上げる方法はないものかと考えていました。データに加工を施して擬似的にデータの量を増やす「Data Augmentation」という技術の存在を知ったあなたは、なんとかこの技術を使いこなして、モデルの性能を改善しようと試みます。

                  Slide 1
                  ミッション5の概要
                    50 Exp
                    Slide 2
                    ミッション5の振り返り
                      50 Exp

                      おわりに 50 Exp

                      あなたは当クエストを通じて、衛星画像の中にゴルフ場が含まれているか否かを高精度で分類することのできるモデルを作成することができました。最後に、当クエストにて学んだことのまとめと、さらなる予測精度の改善のための提案をスライドにまとめましたのでご覧ください。

                      Slideを見る

                      Competition

                      【SOTA】産業技術総合研究所 衛星画像分析コンテスト

                      これまで学習したことを元に、SIGNATEのSOTAコンペティションに挑戦してみましょう。

                      Competitionに挑戦する