Quest スポーツのチケット価格の最適化

難易度:★★☆☆☆

  • 業種
  • エンタメ・レジャー
  • データ前処理
  • テーブル
  • 重回帰
  • 回帰問題

観客数や集客率は、プロスポーツビジネスにおいて収益を考える上で重要な数字です。例えばJリーグクラブの収益割合は、入場料収入が広告料収入に次いで2割を占めています。入場料収入は観客数に比例するので、クラブは観客数を一人でも増やしたいと考えています。観客数をあらかじめ予測することができれば、観客数が少ないと予測された試合は、チケット価格を下げて観客数を増やしたりといった施策を打つことができます。そこで本クエストでは、この課題への取り組みの1つとして、Jリーグの試合の観客数を予測するモデル作成に挑戦します。本クエストを通じて、データ分析の基本的な手順やモデルの作成方法、さらに、モデルの予測精度向上のために重要な特徴量加工について学びます。

  • 9 時間
  • 4,500 Exp
  • 17 Videos
  • 0 Slides
  • 5 Missions
  • 14 Tasks
  • 73 Operations

Introduction 50 Exp

Jリーグのチケット価格を決めているチケット会社SIGNATEは、チケット価格を状況に応じて変動させるために、観客数を予測できないかと考えています。過去に、チケットが全て売り切れて、スタジアム周りにもチケットを買えなかった人が来ているといった事例や、チケットが売れずに空席が目立つといった事例がありました。もしあらかじめ、観客数が分かっていれば、観客数が多い時はチケット価格を少し高めに設定し、逆に観客数が少ない時はチケットを安くして、観客数を増やすといった施策を打つことができます。そこで、過去の試合情報(2012年3月~2014年4月)とその時の観客数のデータを使って、今後の試合の観客数(2014年5月から7月)を予測するモデルを作成します。※現在は2014年4月30日という設定です。

Videoを再生する

Mission 1

試合データの読み込み・結合

チケット会社SIGNATEでは毎試合、試合情報を記録していたので、それらのデータを使うことにしました。しかし、複数のファイルでデータを管理していたため、予測を行う上でデータを扱いやすいようにこれらを1つにまとめる必要があります。本ミッションでは、分析の第一歩として重要なデータの読み込み方、複数データの結合の仕方を学びます。

Video 1
試合データの読み込み・結合
    50 Exp

    Mission 2

    観客数に影響のある要素を探索

    複数管理されていたデータを1つにまとめることができました。観客数を予測するために、どのような要素が観客数に影響するのかを調べてみましょう。天気やチームは観客数に影響しそうだという風に、ある程度仮説を立てることができます。観客数に影響する要素の仮説を立て、正しいかどうか確認していきましょう。その為の方法論として本ミッションでは、探索的分析について学びます。データ分析ではデータの分布や数値等からデータの特徴を抽出し、それに基づき仮説を立てたり仮説の検証を行います。基本統計量や可視化の方法論についても学んでいきましょう。

    Video 1
    観客数に影響のある要素を探索
      50 Exp

      Mission 3

      試合データの加工

      観客数に影響する要素がわかったので、次は実際に観客数予測モデルの作成を実施することになりました。モデルを作成するためには、モデルが扱えるような形にデータを加工する必要があります。そこで本ミッションではデータ前処理について学びます。ここでの前処理とはモデリングのための前処理についてです。適切な前処理をすることで、モデリングの精度を上げることができます。前処理の種類や、方法にどのようなものがあるのか学んでいきましょう。

      Video 1
      試合データの加工
        50 Exp

        Mission 4

        観客数予測モデルの作成

        データの前処理が出来たため、モデリングが出来る状態になりました。いよいよ本クエストのメインである、観客数の予測をする為のモデル作成を実施することになりました。本ミッションではモデリング手法の1つ、重回帰モデルについて学びます。モデルを作成することで、過去の実績から将来の値を予測することができるようになります。具体的なモデルの作り方や作ったモデルの正しい評価方法について学んでいきましょう。

        Video 1
        観客数予測モデルの作成
          50 Exp

          Mission 5

          観客数予測モデルの改善

          観客数を予測するベンチマークモデルを作成することができましたが、観客数の予測結果を施策に活用していく為には、更に精度の高い予測が必要であるという判断がされました。改善案としてはモデル作成時に残差分析を行っていた為、その結果を手掛かりにもう少し予測精度の高いモデルを作成する方針となりました。本ミッションでは、残差分析の結果得られた知見を活かして、モデルの改善を行いましょう。

          Video 1
          観客数予測モデルの改善
            50 Exp

            Conclusion 50 Exp

            本クエストでは、Jリーグの観客数を予測するモデルを作成しました。ただ予測モデルを作るだけでなく、予測モデルの精度を上げるために、観客数に影響しそうな要因を仮説を立てて検証し、予測精度を改善する試みも行いました。クエストを通じて学んだこと、そしてクエストの成果をおさらいしましょう。

            Videoを再生する

            Competition

            Jリーグの観客動員数予測

            これまで学習したことを元に、SIGNATEの練習問題に挑戦してみましょう。このコンペでは、2012年~2014年シーズン前半までのデータを使用し、「2014年後半戦J1,J2全試合の観客動員数を予測するモデル」作成にチャレンジします。

            Competitionに挑戦する