【機械学習講座1】当講座の概要　　

こんにちは，shun（@datasciencemore）です！！

今回から機械学習講座をやっていきます！

初回の今回は，概要として本講座の目的，内容，対象層，特徴について説明していきたいと思います．

１．目的
２．内容
３．対象層
４．特徴
まとめ

１．目的

DS講座第１弾では，Rとtidyverseを利用した前処理について学びました．

これで前処理については8割程度できるようになったと思います．

さて前処理が終わったら，それで終わりでしょうか？

多くの場合はそんなことないですよね笑

苦労して前処理をしたのには何かしらの目的があったからですよね．

以前の記事で説明したようにデータ分析プロジェクトのフローはこんな感じで，①要件定義，②PoC，③実装の各フェーズを行ったり来たりしながら分析を進めていきます．

前処理をした後によくする作業としてモデリングがあります．

モデリングとは，超ざっくり説明するとデータから何かしらの値やカテゴリを予測することです．

正確に言うとモデリングとは，

データがなんで生成されたかを考察すること！！

です．
予測が主ですが，それ以外にもデータがどんな確率分布に従っているとか，どのようなルールでデータを分類できるのだろうとか，予測以外にも様々な分野があります．
当講座では予測モデリングに焦点を当てます．

なんで予測モデリングをするかというと，ビジネスにおいてとても役立つからです．

ビジネスというのは，とにかく不明確なことが多いです．

例えば

この部品の状態は正常か異常か？？
今週の来客数はどれくらいだろうか？？
この製品はいつ頃出荷できるのだろうか？？

これらの問題に答えてくれる技術こそが予測モデリングなのです！！

これらの問題の答えがわかればビジネスがすごく楽になりますよね！

例えば，

今週の来客数は500人くらい

⇒いつもより2割程度多いから，より多く商品を仕入れよう！！

みたいな感じで，予測から次のアクションを容易にすることができます．

もしモデリングを使用しないと

今週の来客数は全然わからない．．．

⇒どう対策すればいいかわからない．．．

ってことになっちゃいます．

こんな感じで予測モデリングはビジネスに大きな価値をもたらします．

ということで，当講座では

予測モデリングを適切に実施するために，予測モデリングの流れをしっかり理解する！！

ことを目的とします．

予測モデリングを適切に実施するためにはコーディングをする必要がありますが，それについては別講座で実施予定です．
当講座では，コーディングを的確に実施するためにも先立って予測モデリングの流れをしっかり理解することを重視したいと思います．

また，予測モデリングをするうえで役に立つのが機械学習と統計学の知識です．

当講座は機械学習をメインに解説していきます．

なぜなら予測モデリングの主目的である予測は，機械学習（教師あり学習）と非常に相性がいいからです．

統計学の知識も重要なのでそれは別講座で解説しますね！！

一般的に機械学習が予測重視，統計学が解釈重視とよく言われています．
この考え方は間違ってはいないのですが，適切ではないと個人的に思います．
機械学習と統計学の違いは宗教のようなものなので，そんなに深く考えなくていいと思います．
当ブログでも便宜上，機械学習と統計学を分類しましたが，両者は密接につながっています．
なので，できたら両方学習しましょう！！