DS講座 tidyverse tidyverse講座

【R前処理講座10】tidyverseってなに??【tidyverse】

こんにちは,shun(@datasciencemore)です!!
前回まで環境構築編とbaseR編をやってきました.
今まで学習してきたこと,きっちり理解できていますでしょうか??
6割くらいできているなら次に進んじゃいましょう!
さて,今回からいよいよtidyverseについてやっていきます.

さてさて,この見慣れない変な文字列,tidyverseとは一体何者なんでしょうか?
これからじっくり丁寧に解説していくんでお楽しみに~

1.tidyverseってなに??

tidyverseってなんですか??

tidyverseは,前処理に特化したパッケージ群のことだよ!!
tidyverseを使用することで,baseRでは難しかった処理がすんなりとできるようになるよ!!

ぼくは声を大にして言いたい.

tidyverse最高!!!

ほんとにね,最高すぎます,tidyverse.
何が最高なのかはこのブログに淡々と記していくので乞うご期待を!
すごく簡単にいうと前処理がくそ楽になります.冗談抜きでやばいです.
冗談抜きでPythonさんと比較して10倍以上楽できます.

上の意見はあくまで僕の主観なのでPythonヘビーユーザの方々は怒らないでくださいね...
むしろ,そのような方々は僕にPythonの良さをぜひ教えていただきたいです.
はぁ,Pythonも使えるようにしないとなぁ笑

僕のイメージによるPythonとRの関係はこのような感じです.

Pythonは,何もパッケージがなければデータ分析には向いていません.(もともとシステム開発用の言語なので)
PythonにNumpyとPandasというパッケージを付与することで,データ分析環境が整います.
一方,Rは単体ですでにデータ分析環境が整っています.
ですので,RとPython+Numpy+Pandasは,大体同じようなデータ分析環境なんですね.
そのRにtidyverseというパッケージが付与すると,スーパーデータ分析環境が整うのです!!

昔,どこかのサイヤ人が言っていました.
「おれは,スーパーベジータだ」 と...
そのサイヤ人は,修行によってスーパーベジータになったのです!
PythonもRも同じことです.
Pythonは修行(Numpy+Pandas付与)によって,ノーマル環境からデータ分析環境へ Rは修行(tidyverse付与)によって,データ分析環境からスーパーデータ分析環境へ それぞれレベルアップしたのです!
この例えがわからないようであれば無視してください,わからなくて全く問題ありません笑

そして,データ分析環境とスーパーデータ分析環境では,前処理のやりやすさが全然異なるのです.

ですから本ブログでは,今後,スーパーデータ分析環境であるtidyverseについてメインで解説していきますね!!

2.tidyverseを構成するコアパッケージ

先ほど,tidyverseは,Rをスーパーデータ分析環境にレベルアップさせるパッケージだと説明しました.
実はtidyveseは細分化するとさらに以下の8つのコアパッケージに分類されます.

こんな感じで全部で8つのコアパッケージがあって,それぞれが異なる用途を持っています.

今後の記事でそれぞれの特徴を詳細に深堀していきますので,楽しみにしていてくださいね.

まとめ

今回はtidyverseについてやっていきました.
tidyverseを使うと,baseRをデータ分析環境からスーパーデーター分析環境にレベルアップさせることができます.
そして,tidyverseは以下に挙げる全部で8つのコアパッケージにて構成されています.

  1. tibble
  2. dplyr
  3. tidyr
  4. ggplot2
  5. stringr
  6. readr
  7. forcats
  8. purrr

各パッケージについて,主要なページのリンクを貼っております.

それぞれ用途が違うのですが,これらを組み合わせることによってデータの前処理を恐ろしく効率的に実施できます.
それぞれのコアパッケージの使い方については,今後の記事でご紹介していきますね!
次回は,tidyverseを使用するための前準備,パイプ処理について書く予定です.
※前準備ばかりで申し訳ないです,これでほんとに前準備最後です笑
それじゃ,お疲れ様でした!

-DS講座, tidyverse, tidyverse講座