Gym 強化学習入門

難易度:★★★★★

  • 業種
  • 全業種共通
  • コーディング有
  • シミュレーション
  • 強化学習

本講座では、強化学習で良く扱われる問題に触れつつ強化学習の基本的な仕組みを理解し、アルゴリズムを実装して、どのような問題を解くことができるかを実感していただきます。未知の問題に対しても最低限のアルゴリズムを実装できるようになることが目標です。

  • 3 時間
  • 1,750 Exp
  • 0 Videos
  • 4 Slides
  • 3 Missions
  • 7 Tasks
  • 31 Operations

はじめに 50 Exp

本講座の概要とカリキュラムを紹介します。

Slideを見る

Mission 1

強化学習の仕組み

0%

ここでは強化学習の基本的な問題設定や仕組みを説明します。そもそも強化学習とは何か、どのような問題設定で、どのようなアルゴリズムによって問題にアプローチをするかを理解してもらうことが目的です。

Slide 1
強化学習の仕組み
    50 Exp
    Task 1
    強化学習とは
      250 Exp
      Task 2
      迷路で理解する
        150 Exp

        Mission 2

        強化学習アルゴリズム(1)

        0%

        ここでは単純な迷路を題材として、実際に強化学習アルゴリズムを実装してその結果をみます。まずは環境の情報(遷移確率や報酬関数)が分かっている場合に適用できるアルゴリズムを扱い、次に分かっていない状態におけるアプローチとしてモデルフリーのアルゴリズムを扱います。強化学習アルゴリズムの考え方や基本的な仕組みを理解してそれぞれのアルゴリズムを実装できるようになることが目的です。

        Task 1
        環境が既知の場合
          250 Exp
          Task 2
          モデルフリー
            250 Exp
            Task 3
            まとめ
              300 Exp

              Mission 3

              強化学習アルゴリズム(2)

              0%

              ここでは、大きく分けて2つのテーマについて学びます。1つは、本格的に強化学習の問題に取り組む際にはアルゴリズム全体をどのように実装するべきかという点について、もう一つは、観測される状態が連続値である場合の問題への取り組み方についてです。これらについて理解することは、近年注目を集めている深層強化学習への足がかりにもなります。本ミッションを通して、あらゆる種類の強化学習問題に取り組むことができるという自信を身につけましょう。

              Slide 1
              強化学習の実装
                50 Exp
                Task 1
                基本モジュールの実装
                  150 Exp
                  Task 2
                  倒立振子の問題の攻略
                    200 Exp

                    まとめ 50 Exp

                    本講座のまとめです。

                    Slideを見る