難易度:★☆☆☆☆
データの分析をする上で必要となるライブラリpandasの基礎理解を目的とした初心者向けの講座です。
pandas入門道場へようこそ。
本Gymではデータ分析の際の用いるライブラリ「pandas」の基礎を学び、最終的には実際のデータを使ったデータ分析にチャレンジしていただきます。
まずは本Gymの概要とカリキュラムを紹介します。
Mission 1
初めてpandasを学ぶ方を対象とした導入編です。
pandasパッケージを使ったデータの読み込みやデータの表示などの方法から学んでいきましょう。
csv形式やxlsx形式のデータをpandasを用いて読み込み、データを表示してみましょう。
Mission 2
データ分析の第一歩はデータを注意深く確認することです。
保育園のデータを用いて、データの並び替えやデータの要約統計量の確認の方法を学んでいきましょう。
pandasを用いてデータの確認を行いましょう。
Mission 3
データ分析業務の8割はデータクレンジングと言われるほど重要かつ、頻繁に行う作業です。
pandasを用いてデータ操作を行い、より分析や可視化を行いやすいデータに整理していく方法を学んでいきましょう。
前回まではpandasを用いてデータの読み込みや確認を行ってきました。
今回は、データ追加や削除などの操作や加工方法について学んでいきましょう。
データ分析の際の基本的な処理となりますので、やっていることの意図を考えながら実施していきましょう。
Mission 4
データの数字を追うだけでなく、第3者にデータの持つ意味がわかるように、データの可視化することもデータサイエンティストの重要な作業です。
またpandasには可視化のためのグラフ描画機能が実装されており、各種プロットを簡単に行うことができます。
pandasを使った可視化の方法を学び、データの可視化を行っていきましょう。
pandasではデータの確認や加工の他にも、様々なグラフなどを作成することができます。
今回はpandasを用いて基本的なデータ可視化を行います。
分析作業においてデータの可視化は必要不可欠な作業なのでデータの性質を考えながら可視化を行っていきましょう。