難易度:★★☆☆☆
scikit-learn道場へようこそ! この道場では、Pythonでデータ分析や機械学習モデリングを行う上で欠かすことのできないオープンソースライブラリ「scikit-learn」を学びます。 「scikit-learn」はデータ分析の過程を柔軟かつ効率的に行うための高機能なAPIや機械学習モデリングに使用可能な様々なアルゴリズムを提供しています。 本GYMにて基本的な「scikit-learn」の使い方を学び、様々なQUESTやコンペティションにて実際にモデリングを行い知識の定着化を図りましょう。
データ分析や機械学習モデリングでは同じ内容のコードを何度も使う場面があります。
その際に1からコードを作成すると非常に時間がかかってしまいます。
しかし、「scikit-learn」には多くの機械学習アルゴリズムやモジュールが実装されており、どのアルゴリズムでも同じような書き方で利用することができます。初学者が機械学習を学び始めるには、最適のライブラリと言えます。
本GYMにて基本的な「scikit-learn」に実装されているAPIやアルゴリズムの使い方を学んでいきましょう。
Mission 1
scikit-learnにはデータ分析やモデリングを行う際に必要不可欠である便利関数が実装されています。
この関数たちは非常に使い勝手が良く、利用することでコード作成の省力化や他の可視化や探索的分析に時間を割くことができます。このミッションでは、scikit-learnの便利な関数の使い方、扱い方を学んでいただきます。
scikit-learnにはDataset-APIという、機械学習を用いる上でのテストデータセットがAPI化されています。
そのAPIの使い方を実際にソースコードを動かしていきながら、学んでいきましょう。
scikit-learnには様々なデータ前処理が実装されています。
機械学習モデルを作成する際に、データ前処理は必要不可欠な作業となるので丁寧に学習していきましょう。
機械学習モデルを作成する際に必ずと言っていいほどデータの分割を行います。
またデータの分割にはデータの種類や傾向によって様々な方法が存在します。その方法について学んでいきましょう。
Mission 2
教師あり学習(Supervised Learning)は学習データに正解ラベルを付けて、学習させる方法です。
教師あり学習には線形回帰やロジスティック回帰などのアルゴリズムがあります。
このミッションでは、教師あり学習の様々なアルゴリズムの概要に触れ、さらにはscikit-learnに実装されているアルゴリズムの使い方について学んでいきます。
教師あり学習の中での線形回帰アルゴリズムについて学んでいきましょう。
教師あり学習の中でのロジスティックについて学んでいきましょう。
教師あり学習の中でのランダムフォレストについて学んでいきましょう。
教師あり学習の中でのサポートベクターマシンについて学んでいきましょう。
教師あり学習の中でのK近傍法について学んでいきましょう。
Mission 3
教師なし学習(Unsupervised Learning)は学習データに正解ラベルを付けないで学習する方法です。
教師なし学習にはk-means法やPCAなどのアルゴリズムがあります。
このミッションでは、教師なし学習の様々なアルゴリズムの概要に触れ、さらにはscikit-learnに実装されているアルゴリズムの使い方について学んでいきます。
教師なし学習の中でのPCAについて学んでいきましょう。
教師なし学習の中でのk-meansについて学んでいきましょう。
教師なし学習の中でのt-SNEについて学んでいきましょう。
Mission 4
機械学習のモデルを作成した際に必ず必要となることがモデルの評価についてです。
評価をすることでどのくらいの段階のモデルであるのかを定量的に判断することが可能となります。
また、「scikit-learn」にはモデルの評価を行うための「評価関数」が様々な種類実装されています。
このミッションでは、どのような問題にはどのような評価関数を用いるべきなのかの説明を行いながら、scikit-learnに実装されている評価関数の使い方について学んでいきます。
分類問題に対しての評価方法について学んでいきましょう。
回帰問題に対しての評価方法について学んでいきましょう。