DS講座 tidymodels講座

【tidymodels講座1】当講座の概要

こんにちは,shun(@datasciencemore)です!!

機械学習講座はもう読んでいただけましたか?

まだの方はぜひ読んでからこちらに戻ってきてください.

読んでいなくても理解できないということはないですが,読んでいたほうが理解がより深まると思いますので,読んでからをオススメします.

さて,機械学習講座で予測モデリングについて学びました.

あとはその内容をコーディングすれば予測モデリングができます!

コーディングする上で最初に悩ましいことはPythonとR,どちらの言語でコーディングすればいいかということだと思います.

機械学習をするための有名なパッケージとして,Pythonはscikit-learn,Rはtidymodelsが挙げられます.

それぞれメリット,デメリットありますが,当講座ではR(tidymodels)でのコーディングについて学んでいきます!

初回の今回は,概要として本講座の目的,内容,対象層,特徴,環境構築について説明していきたいと思います.

1.目的

機械学習講座で機械学習と予測モデリング仕組みをざっくりと理解できたと思います.

予測モデリングは学習データを使用して評価データの予測をするのでしたね.

あとは,予測モデリングの流れをコーディングするだけです.

そのコーディングを当講座では実施していきます.

当講座では

予測モデリングの各STEPを適切にコーディングし,データから予測したい項目をtidymodelsを使用して予測できるようにする!!

ことを目的とします.

2.内容

当講座はtidymodelsの各パッケージについて使い方を学んだあと,総合演習として実際に予測モデリングを実施します.

tidymodelsの各パッケージとその役割はこんな感じです.

また,tidymodelsのパッケージではないですが,モデル解釈のパッケージとして{DALEX},{DALEXtra}についても紹介いたします.

3.対象層

  • データサイエンス,AI,機械学習に興味がある方
  • ビジネスにおいてデータを使用して,なんらかの予測がしたい方
  • scikit-learnで機械学習に挫折した方
  • Rで機械学習をしてみたい方
  • tidymodelsの使い方がよくわからない方

4.特徴

当講座の特徴はなんと言ってもRのモデリングパッケージであるtidymodelsを使用していることです.

tidymodelsは,tidyverseと親和性がとても高く,モデリングする上で非常に便利なパッケージです!

しかし,残念ながらtidymodelsの情報はとても少ないのが現状です...

なので,当講座ではtidymodelsについてたっぷり説明していきます!!

ただ説明するだけではなく,機械学習講座で学んだモデリングの各STEPとtidymodelsによるコーディングがどのように対応しているかを丁寧に解説いたします!!

そうすることにより,当講座の目的(予測モデリングの各STEPを適切にコーディングし,データから予測したい項目をtidymodelsを使用して予測できるようにする)を達成できると考えております!!

5.環境構築

RとRStudioはインストールされていることを前提とします.

まだの方は以下を参照にRとRStudioをインストールしてください.

まず使用するパッケージをインストールしましょう.

次にインストールしたパッケージを読み込みます.

一部,インストールしたパッケージ以外も読み込んでいますが,細かいことは気にしないでこの通りにすればOKです.

まとめ

今回はRモデリング講座の初回で,以下のことをやりました.

  1. 目的
  2. 内容
  3. 対象層
  4. 特徴
  5. 環境構築

当講座では,tidymodelsというtidyverseと親和性の高いパッケージを使用していきます!

tidymodelsは,情報が非常に少ないものの,使いこなせると非常に便利なパッケージです!

ぜひ当講座でtidymodelsの使い方の基礎を身に着けていただければと思います!!

それでは,お疲れ様でした!!

-DS講座, tidymodels講座