難易度:★★★☆☆
昨今、スポーツ業界でもデータ分析を用いる例が増えてきています。 スポーツにおける対戦相手やチームの選手の動きなどのデータを分析する人のことをスポーツアナリストと呼び、 野球やサッカー、バスケットなどのスポーツで多く活躍しています。 本Gymでは、過去SIGNATEで開催されたコンペ「ひろしまQuest2020」のアイデア部門の上位作品を分析しながら、データ分析の技術について学んでいきます。 【コンペティションURL】https://signate.jp/competitions/277
今回は過去SIGNATEで開催されたアイデア部門の「ひろしまQuest2020#stayhome【アイデア部門】」を題材にしています。
アイデア部門では「みんなで広島東洋カープを日本一にしよう!」というお題を元に計112人の方に参加していただきました。
上位入賞作品を確認しながら、データ分析の内容を相手に効果的に伝える技術を習得していきましょう。
Mission 1
ひろしまQuest2020#stayhome【アイデア部門】では「みんなで広島東洋カープを日本一にしよう!」というお題の元、様々なアイデアを持った作品が生まれました。
入賞した作品は4つあり、どの入賞作品も素晴らしいものとなっています。
開催されたアイデア部門のお題や審査ポイントについても考慮しながら、上位の4作品を実際に確認し、
どのようにデータの分析を行い、どのようにアイデアを読者に伝えているのかを学んでいきましょう。
いい提案を行うために過去の提案を分析することも大変重要なタスクとなります。
優秀な案とはどのようなものなのかを確認してみましょう。
Mission 2
手元にあるデータを確認せずにやみくもにアイデアを考えたとしても、実現性の低いアイデアとなる可能性があります。
実現性の高いアイデアを生み出すためにも、まずデータを確認し、どのようなデータが手元にあるのかを把握することは大変重要なタスクになります。
今回はpandasと呼ばれるcsv形式のデータを読み込むためのライブラリを駆使しながら、データの読み込みと基本的な基礎集計を行なっていきます。
案を考えることも大切ですが、信頼のできる案を作成するためには数値データも重要となります。
信頼のできる案を元にデータの基礎集計を行っていきましょう。
Mission 3
重回帰分析は多変量解析の1つであり、回帰分析において独立変数が2つ以上のものを言います。
データ分析でも頻繁に用いられ、かつ、昔から使われている分析方法です。
実際にアイデア部門の3位の方は勝率についての重回帰分析を行い、勝率をあげるために必要な要素を検証していました。
今回は重回帰とはどのようなモデルであるのかの理解と重回帰分析の使用方法について学んでいきます。
勝率についての重回帰分析を行うために、まず簡単なデータを使って重回帰分析の方法を学んでいきましょう。
重回帰モデルの作成の仕方についても理解できたと思いますので、勝率についての重回帰分析を行なってみましょう。