Quest 自動車環境性能の改善

難易度:★☆☆☆☆

  • 業種
  • 製造・メーカー
  • テーブル
  • 重回帰
  • 回帰問題

近年の排出ガス規制によって自動車メーカーは燃費性能の改善が求められており、実際の走行実験による燃費性能の改善が義務付けられています。しかし、この測定には様々な走行条件における測定が必要となるため、測定データを得るためには多大な時間とコストがかかることになります。そこで本クエストでは、この問題への解決手段の1つとして、自動車データを利用し、自動車の燃費を精度高く予測するモデルを作成します。本Questを通じて、データ分析の基本的な手順やモデルの作成方法、さらに、モデルの予測精度向上のために重要な特徴量加工について学びます。

  • 6 時間
  • 2,850 Exp
  • 15 Videos
  • 0 Slides
  • 4 Missions
  • 11 Tasks
  • 42 Operations

Introduction 50 Exp

自動車メーカーSIGNATEの新型車開発チームでは、走行実験において排出ガス規制をクリアできずに新型車の開発に失敗するというケースが発生しており、大きな損失を出していました。主な問題は、実際に走行実験を実施しないと排出ガス規制をクリアできる燃費性能であるか評価できない点にありました。あらかじめ燃費性能を計算することができればこの問題を解決できるのですが、燃費は、車の重量やエンジンの仕組みなど、非常に多くの要因が関連して決まるため、計算によって算出することは困難です。そこで新型車開発チームでは、過去の自動車のデータを利用し、燃費を予測する機械学習モデルを作成することで、走行実験前に燃費性能を評価できるようにするプロジェクトを発足しました。走行実験前に燃費性能を評価できれば、効率的に新型車の開発を進めることができ、損失を減らすことができるはずです。実運用可能なモデルを作成することを目標に、プロジェクトを進めていきます。

Videoを再生する

Mission 1

自動車データの読み込み・確認

データ管理部に今回のプロジェクトについて説明し、データを用意してもらったため、データの中身を確認することになりました。データの確認には、Pythonへのデータの読み込みや、データ量等の確認が必要となります。本ミッションでは、ライブラリを使ったデータの読み込み方やデータ量、カラム情報などの確認方法について学びます。

Mission 2

自動車データの特徴把握

データの確認が完了したため、モデルを作成する前の事前分析として自動車データの特徴を洗い出すことになりました。どのような情報が燃費と関係性があるのかわからないため、今回は網羅的に特徴を確認していくことにしました。データの特徴を把握することで、予測に役立ちそうな変数やモデルの予測精度を改善するための方策を見つけることができます。データの特徴を見つけるには、データを多角的に見ることが重要です。そこで本ミッションでは、データを俯瞰して見ることや、データの示唆する情報を多面的に捉える方法(探索的分析、EDAと呼ぶ)について学びます。

Mission 3

燃費予測モデルの作成

特徴の洗い出しから、4つの変数が燃費と強い関係性を持つことがわかったため、次は実際に燃費予測モデルの作成を実施することになりました。モデルは予測傾向を解釈しやすい重回帰モデルを選択し、ひとまず、特徴量の加工等は行わずにモデルを作成してどれくらいの予測精度となるのか検証することにしました。本ミッションでは、データをモデルに渡すことができる形に変換する方法や、モデルの作成、評価方法について学びます。

Video 1
燃費予測モデルの作成
    50 Exp

    Mission 4

    燃費予測モデルの予測精度改善

    作成したモデルは、ある程度の予測精度で燃費を予測できているものの、実運用を想定した場合に現在の予測精度では不十分であると判断されました。そこで、特徴量の加工を行うことで、予測精度の改善を試みることになりました。本ミッションでは、ダミー変数化や対数化といった特徴量加工の方法について学びます。

    Video 1
    燃費予測モデルの予測精度改善
      50 Exp

      Conclusion 50 Exp

      今回のプロジェクトでは、新型車の走行実験前に燃費性能を評価するために、自動車の燃費を精度高く予測する、実運用可能なモデルを作成することがゴールでした。まずはじめに、データの中身を確認し、データ全体を通して特徴の洗い出しを行いました。その後、数値データのみを用いて重回帰モデルを作成し、予測精度を評価しましたが、実運用には不十分な精度のモデルであると判断されました。そこで、いくつかの特徴量に対して、ダミー変数化や対数化といった特徴量加工を行い、再度重回帰モデルを作成、予測精度を評価したところ、予測精度が向上しました。これでようやく、実運用可能なモデルを作成することができました。本プロジェクトの成果とクエスト全体を通じて学んだことをおさらいしましょう。

      Videoを再生する

      Competition

      自動車の走行距離予測

      これまで学習したことを元に、SIGNATEの練習問題に挑戦してみましょう。このコンペでは、自動車の属性データからガソリン1ガロンあたりの走行距離を予測するモデル作成にチャレンジします。

      Competitionに挑戦する