Quest 株価を予測せよ

難易度:★★★★☆

  • 業種
  • 金融・保険
  • 時系列
  • DEEPLEARNING
  • 分類問題

株取引は金融機関などの機関投資家だけでなく、一般の人々も参加できるものも多く、身近な経済活動の1つと言うことができるでしょう。一方、この株取引は多様な思惑が交差する場となっているために、株価予測は非常に難しい課題です。しかしながらまた、近年の株取引においては、プログラムで作成したモデルによる機械取引が大きな割合を占めるようになっています。こうしたモデルは株価の推移はもちろんのこと、経済指標やSNSなどの情報を活用しているものも珍しくはありません。本クエストでは、深層学習を用いてこのような機械取引のモデルの作成にチャレンジします。ただし、課題としては「株取引」ではなく、「株価予測」というように簡略化したものに取組みます。クエストを通じて、時系列情報の分析や可視化、深層学習を用いた予測モデルの作成方法を学びます。

  • 5 時間
  • 2,600 Exp
  • 11 Videos
  • 0 Slides
  • 5 Missions
  • 11 Tasks
  • 41 Operations

Introduction 50 Exp

近頃、機械学習に興味を持ち始めたS氏は、モチベーションを高く学び続けるために、実生活への活用を考えていました。検討を重ねた結果、かねてから気になっていた株式投機をサポートするツールとして、機械学習による予測モデルの作成を目標に定めました。ただし、株式の自動売買をいきなり実現することは難しく、損失リスクも許容できないと判断しました。そこで、まずは問題を単純化させて、「将来の株価の上下を予測する」といったモデルの作成に取り組むことにしました。このモデルは、株式の自動売買モデルと比べると素朴なものにはなりますが、もし精度高く予測することが可能であれば、安く仕入れて高く売る、といった投機活動の目安として利用することができそうです。

Videoを再生する

Mission 1

株価データの整形

機械学習モデルを作成するには、適切なデータが必要ということで、まずは信頼性の十分なウェブサイトから株価データを取得しました。ただし、データを取得すればそれで終わりではありません。手に入れた生のデータがそのままモデル学習に使えることは非常にまれであり、また、そもそもデータ内容をきちんと確認しないままにモデルを作成することは、誤認識や不備の検知漏れといったリスクを伴います。このため、データの確認は非常に重要な作業の1つです。本ミッションでは、ライブラリを使ったデータの読み込み方、データ量や種別の確認、用途に応じたデータの並び替え方法などを学びます。

Video 1
データ読み込み
    50 Exp

    Mission 2

    株価トレンドの確認

    取得した生の株価データを変数として読み込み、さらに、扱いやすいようにデータの整形を行いました。次は、この株価がどのような傾向や特徴を持っているのかということを、多角的に眺めながら理解を深めます。本ミッションでは、データを俯瞰して見ることや、データの示唆する情報を多面的に捉える方法(探索的分析やEDAと呼ぶ)を、時系列データのグラフ描画方法と合わせて学びます。

    Video 1
    探索的分析
      50 Exp

      Mission 3

      ドメイン知識の活用

      取得した株価データの内容については、その特徴も含め、一通り確認することができました。ところで、株価予測を成功させるためには、その予測に役立つ情報がデータに含まれている必要があります。株価データそのものも、将来の株価を予測するための立派な情報の1つですが、株取引にはこの他にも様々な予測に役立つ指標が提案されています。本ミッションでは、モデル予測に役立つデータを、ドメイン知識を活用して作成する方法を学びます。

      Video 1
      データ前処理
        50 Exp

        Mission 4

        株価予測モデルの作成

        いよいよモデル作成に移ります。これまでに準備したデータを元に、直近の5日間分のデータから、翌取引日の株価の上下を予測するモデルを作成します。本ミッションでは、モデルに学習させるためのデータ構造の変形や、データのスケールの依存性を除くための標準化を学びます。加えて、時系列データに対して効果的な深層学習モデルとして、LSTMネットワークの作成方法を学びます。

        Video 1
        モデリング
          50 Exp

          Mission 5

          モデルの予測精度の改善

          作成したモデルは一定程度の精度が得られたものの、学習に使われたデータとそうでないデータにおける精度の差が大きくなっていました。将来の株価を予想するという、モデルの有用性という観点で見れば、未知のデータに対する精度も高くあるべきです。そこで本ミッションでは、学習データへの過剰な適合を防ぎながら、モデルの学習を行う正則化のテクニックについて学びます。

          Video 1
          モデリング改善
            50 Exp

            Conclusion 50 Exp

            本クエストでは、株式投機に役立つ機械学習の活用として、将来の株価の上下を予測するモデルの作成に取り組みました。クエスト全編を通じて学んだことをおさらいしましょう。

            Videoを再生する

            Competition

            【練習問題】株価の推移予測

            これまで学習したことを元に、SIGNATEの練習問題に挑戦してみましょう。

            Competitionに挑戦する