Quest 株価予測(ファンダメンタルズ分析)

難易度:★★★★☆

  • 業種
  • 金融・保険
  • テーブル
  • 回帰問題
  • 時系列
  • コーディング有

本クエストでは株価の最高値、および最安値の変化率の予測にチャレンジしていただきます。 クエストの内容の大部分は、日本取引所グループ ファンダメンタルズ分析チャレンジに合わせて用意された株式分析チュートリアル(https://japanexchangegroup.github.io/J-Quants-Tutorial/)の2章をベースに作成しています。

ただし、本クエストで扱うデータの詳細や、金融に関連する知識や用語の詳しい説明は、本コンテンツ内では省略しています。これを確認したい場合は上記のチュートリアルをご参照ください。

監修

・株式会社日本取引所グループ:https://www.jpx.co.jp/

・AlpacaJapan株式会社:https://www.alpaca.ai/ja/index.html

データ提供

・株式会社QUICK:https://corporate.quick.co.jp/

  • 3 時間
  • 1,500 Exp
  • 0 Videos
  • 0 Slides
  • 4 Missions
  • 10 Tasks
  • 30 Operations

Mission 1

データの読み込みと確認

ここでは与えられたデータを読み込み、確認する方法を学びます。データの規模感や欠損値の存在の有無を確認することが目的です。扱うデータは各銘柄の情報に関するデータ、各銘柄の株価情報(始値、高値、安値、終値)に関するデータ、各銘柄のファンダメンタル情報(決算数値データや配当データ等)に関するデータです。

なお、本クエストでは以下4種のデータを扱います。
stock_list:銘柄の情報に関するデータ
stock_price:株価情報に関するデータ
stock_fin:ファンダメンタル情報に関するデータ
stock_labels:目的変数情報に関するデータ

これらのデータは、株式分析チュートリアル(https://japanexchangegroup.github.io/J-Quants-Tutorial/)の「2.2. データセットの説明」に記載された同名のファイルと期間※を除いて同じ内容となっております。
このため、各ファイルの内容の詳細は上記チュートリアルを参照してください。

※本クエストではデータの期間を2019年1月初から2020年12月末に限定しております

Mission 2

データの探索

予測対象は、株価の最高値、最安値の変化率です。どのような要素が株価に影響を及ぼすのか、与えられたデータから特に影響を与える要素を明らかにすべく、ここでは探索的分析のやり方を学びます。

Mission 3

データの前処理、特徴量生成

ここでは、株価の最高値、最安値の変化率を予測するモデルを構築するための準備段階として、データの前処理を行います。データにはいくつか欠損値が確認されていましたが、欠損値はそのままにしておくと、モデル構築ができないため、適切に処理する必要があり、その方法を学びます。また、前の探索的分析の結果を受けて、モデルの予測精度に効くと思われる特徴量の生成方法についても学びます。

Mission 4

モデル構築

ここでは前のMissionで作成した特徴量を用いて株価の最高値と最安値の変化率を予測するモデルを構築します。特に時系列情報を含んだデータに対する学習、検証、評価用への分割の仕方やモデルの選択方法、精度評価の仕方を学びます。

モデル構築のステップは、以下の通りに行います。

1. 銘柄を一つ選ぶ
2. その銘柄に対して、ファンダメンタルズ情報及び株価情報から特徴量を作る
3. 全銘柄に対して同じことを繰り返す
4. 作成したデータを結合する
5. 全データを訓練データ、評価データ、テストデータに分ける
6. 訓練データで予測モデルを学習させる

なお、本クエストにおける訓練データ、評価データ、テストデータは次の期間で分割します。

訓練期間:2019-01-01 - 2019-12-31
評価期間:2020-02-01 - 2020-06-01
テスト期間:2020-07-01 - 2020-12-31