確率統計講座

【確率統計講座1】当講座の概要

こんにちは,shun(@datasciencemore)です!!

DS講座第2弾,確率統計講座へようこそ!

DS講座第1弾,R前処理講座はいかがだったでしょうか??

もしお役に立てていたら非常にうれしいです♪

さて,今回は,確率統計講座初回なので,概要として本講座の目的,内容,対象層,特徴について説明していきたいと思います.

1.目的

DS講座第1弾では,Rとtidyverseを利用した前処理について学びました.

これで前処理については8割程度できるようになったと思います.

それでは,もうデータサイエンスに関するお仕事ができるでしょうか??

答えはNoです.

もっと正確に答えると

できるお仕事とできないお仕事が半々!

って感じですね.

まず前処理ができるだけでデータサイエンスプロジェクトの最初のカギとなる要件定義をするために必要な現状把握がある程度できるようになります.

詳細はこちら
データサイエンスプロジェクトの業務内容

こんにちは,shun(@datasciencemore)です!! 最近とてもよく聞かれる質問があります. それは, データサイエンスプロジェクトってどんなお仕事なの?? って質問です. わかります,デ ...

続きを見る

 

要件定義は,プロジェクトで何をするのか具体的にするのでしたね.

要件定義をするためには,データをみて,現状どのような状況なのかを把握する必要があります.

そのためにデータをきれいにする前処理が必要となってくるのです!

現状把握はとても大切なお仕事ですが,それと同じくらい重要なお仕事があります.

それは,

データを利用し,付加価値を生み出すこと!!

です!!

前処理は付加価値を生む前の前段階,大事なのはここからです!!

とはいえ,前処理されていない汚いデータから付加価値はまず生まれないので,前処理は超超重要です!

さぁ,それではデータから付加価値を生むには何が必要でしょうか??

色々と答えはあると思いますが,僕が思う正解の一つは

データの特徴を明確にすること!!

だと思っています.

データの特徴を明確にするツールの1つに統計学といわれる学問があります.
統計学がわかるとデータの特徴を定量的に議論できるようになるのです.

ですので,DS講座第2弾はこの統計学をやっていきます!

そして,この講座は

ビジネスに統計学を活かせるようにする!!

ことを目的としています.

なぜ統計学をビジネスに活かすことができるのでしょうか?

それは,ビジネスの多くは確率的に成否が決まるからです.

ビジネスを成功に導くためには,数々の意思決定をする必要があります.

それらの意思決定の場では多くの場合,合理的な判断が求められます.

その合理的な判断に使えるのがまさに統計学というツールなのです!!

具体的には

  • トレンドグラフから,未来の売り上げを予測する!
  • 散布図から来客数と相関がある特徴量を発見する!
  • 仮説検定を利用して,改善前よりも改善後のほうが効果が高いことを説明する!

などなどが挙げられます.

統計学は,ビジネスで遭遇する多種多様な問題に対して,解決策を講じるためのヒントを与えてくれるのですね!

 

2.内容

当講座をより詳細に分類すると以下のようになります.

  1. 確率:確率変数,確率分布,独立,期待値,分散など
  2. 統計:記述統計と推測統計,推定量,最尤推定,仮説検定,信頼区間など

※変更する可能性ありです!!

なお,当講座の名前は,統計学講座ではなくて確率統計講座にします.
統計学講座だと文字通り統計に焦点がいきがちですが,統計学は確率と統計の両方をしっかりと理解する必要があるからです.
まぎらわしくて申し訳ございませんが,ご承知おきくださいね.
※そもそも統計学っていうネーミングがよくないですよね笑
略さないで確率統計学でいいのに...笑

 

3.対象層

当講座の対象層は以下を想定しています.

  • データサイエンスに興味がある方
  • 確率,統計に興味がある方
  • 確率と統計の関係が知りたい方
  • 確率や統計の数式の意味を知りたい方
  • 現実世界と確率統計の理論の関係が知りたい方
  • 統計検定2級,準1級合格を目指している方

 

4.特徴

当講座はとにかく現実世界と理論の関係性を重視します!!

統計学に限らず,データサイエンスを理解するのに一番重要なのが,

現実世界と理論を結びつけて心で納得すること!!

だと思っています.

データサイエンスを学習していくと徐々にわかってくるのですが,この世の中,普段気にしないでやっている多くのことがデータサイエンスの理論と密接に結びついているのです.

例えば 統計学の例を挙げると

  • 味噌汁の味見する ⇒ 推測統計
  • 平均を取る ⇒ 大数の法則
  • これからやる仕事について,どれくらいの時間がかかるか見積もる ⇒ 信頼区間
  • A案とB案を比較する際,B案の悪口を言って,A案を通す⇒ 仮説検定
  • 自分の年齢なら大体これくらいの年収だろうと見積もる ⇒ 回帰分析

などなど

私たちが住んでいる現実世界は,統計学(もっと広く言うとデータサイエンス)の理論と密接に関係しているのです!!

ただ,このことは実は意識しないとなかなか気づきません.

なぜなら,多くの統計学の教科書は,このことにフォーカスしないで,複雑な数式ばかり教えてくるからです.

数式だけ見ても,それが何を表現しているのかわからないと残念ながらほとんど意味はありません.

呪文のように見える数式にも一つ一つ意味があります.

そして,その数式によってデータサイエンスの理論が形成され,現実世界とリンクしているのです.

当講座では,その現実世界とデータサイエンスの理論の関係性を詳細に説明することで,その関係性を心から納得できることを目指します!

 

まとめ

今回は確率統計講座の初回で,以下のことをやりました.

  1. 目的
  2. 内容
  3. 対象層
  4. 特徴

次回からさっそく確率についてやってきますよ~
とにかく基礎重視で書いていきますので,興味があればぜひ読んでみてくださいね♪

それでは!!

 

-確率統計講座