Python前処理講座

【Python前処理講座】当講座の概要 

こんにちは,shun(@datasciencemore)です!!
ついにpython前処理講座の第1回目です!!
できる限りわかりやすく伝えていくので,よろしくお願いいたします.
今回は初回なので,概要として本講座の目的,内容,対象層について説明していきたいと思います.

当講座はR前処理講座をPython用にアレンジしたものになります。
なので,文言がR前処理講座とほぼ同じ個所も多々ございます.
申し訳ございませんが,ご承知おきのほどお願いいたします.

1.目的

データ分析のお仕事は,大体は以下のフローに従うのでした.(詳細はこちら

本講座では,これらの中の②処理フェーズの前処理に焦点を絞ってやっていきます!!

なんで前処理だけが対象なんですか??

前処理は,データサイエンス系のどのような仕事でも大部分を占める重要な部分だからだよ!

データサイエンス系のお仕事は多岐にわたるとこれまで何回かお伝えしてきました.(例えばこちら
しかし,それらのどのようなお仕事でも前処理は多くのウェイトを占めるのです.
よく前処理が8割だなんて言われています笑
前処理は野球に例えると,ボールを投げることに該当すると思います.
野球は9人で実施し,ピッチャー,キャッチャー,ファーストなどなど,9つのポジションでそれぞれ役割が違いますが,どのポジションでもボールを投げられないと野球ができないですよね.
データサイエンス系のお仕事もそれと同じです.
以下に挙げるデータサイエンス系の様々なお仕事どれでも前処理が不可欠です.

  • アルゴリズム構築
  • AIシステム開発
  • 可視化ウェブアプリ開発
  • 論文執筆
    などなど

要は前処理ができないと仕事にならないのです.
前処理は、プログラミング言語であるRやPythonで実施されることが多いです。

中でもPythonの使用率が高いです。

なので,当講座ではPythonを使用しこの前処理に特化することで,この講座を終えたら

前処理のほぼすべてに対応できること

を目的としています.

2.内容

当講座をより詳細に分類すると以下のようになります.

  1. 環境構築:Pythonを使用するための環境を整えます.
  2. Python:Pythonの基本的な使い方を学びます.
  3. パッケージ:データサイエンスで非常によく使用するパッケージ(numpy, pandas, plotnine)の使い方を学びます.

3.対象層

当講座の対象層は以下を想定しています.

  • AIや機械学習に興味がある方
  • Pythonを勉強したい方
  • numpyやpandasの使い方を学習したい方
  • データの前処理を効率的にしたい方

まとめ

今回は,記念すべきPython前処理講座の第1回目でした!
やった内容は,以下になります.

  1. 目的
  2. 内容
  3. 対象層

次回からいよいよ環境設定に入っていきます.
これからよろしくお願いしますね!
それでは!!

次回

【環境構築】Google Colaboratory

こんにちは,shun(@datasciencemore)です!! 今回は環境構築について説明していきます. と言ってもやることはほとんどありません笑 なぜならGoogle Colaboratoryとい ...

続きを見る

-Python前処理講座