Gym 自然言語処理入門

難易度:★★★☆☆

  • 業種
  • 全業種共通
  • 言語
  • 言語分類
  • データ前処理
  • コーディング有

自然言語処理入門へようこそ! 本Gymでは自然言語処理を行う上で基本となる背景知識の取得を目標としています。 まず始めにテキストデータの基本的な扱い方を学んだ後、機械学習・深層学習を用いた自然言語処理の手法について紹介します。Missisonの終わりには実際に学んだ知識を活かして、英語で書かれた映画レビューデータをネガティブなものであるか、ポジティブなものであるか分類するモデルの作成を行います。本Gymにて自然言語処理の概念について理解し、身近にある言語データやコンペティションで提供される言語データを使って、実際にモデリングやデータ分析を行い知識の定着化を図りましょう。

  • 3 時間
  • 1,650 Exp
  • 0 Videos
  • 2 Slides
  • 5 Missions
  • 14 Tasks
  • 31 Operations

Mission 1

Introduction

自然言語・自然言語処理の特徴について学んだのち、本Gymの概観について説明します。

Mission 2

自然言語処理の基本

自然言語を解析する際に基本となる概念の取得を目指します。テキストデータは解析を行う前に特有の前処理を行う必要があります。文字列操作や前処理を通してテキストデータを解析しやすい形に変更を加えたのち、コンピュータで単語や文章のつながりを解析する方法について学びます。

Mission 3

自然言語処理の手法(機械学習)

自然言語を数値で表す方法として、単語のベクトル化、単語の並び順を確率で表現する等、数多くの手法が考案されてきました。本Missionでは自然言語を数値で表現する際に用いられる、機械学習の代表的なアルゴリズムについて学んでいきます。

Mission 4

自然言語処理の手法(深層学習)

自然言語の特徴として、文章は単語が連なったもの、つまり時系列データとみなすことが出来るという点が挙げられます。時系列データを扱う深層学習の手法が自然言語処理にも数多く応用されており、本Missionでは深層学習を用いた自然言語処理について、言語モデルの発展の流れを紹介します。

Slide 1
自然言語処理の手法(深層学習)
    50 Exp

    Mission 5

    自然言語処理の実践(映画レビュー分類)

    Bag of Wordsのアルゴリズムを用いて、英語で書かれた映画レビューがポジティブなものであるか、ネガティブなものであるか分類するモデルの作成を行います。