Python前処理講座

【plotnine】geom_point:散布図【可視化】

こんにちは,shun(@datasciencemore)です!!

今回は,geom_point:散布図について学習していきます.

geom_pointは,散布図を作成するためのメソッドです.

イメージとしてはこのようになります.

データフレームにgeom_pointを適用すると散布図が作成されます.

0.準備

1.散布図の基本

散布図は,連続値の2変数の関係の傾向を確認するためのグラフです.

散布図にすることで,2変数の関係の傾向が明確になります.

今回は,例としてirisデータのsepal_lengthとsepal_widthの2変数の散布図を考えます.

このデータフレームをグラフにしたものが散布図です.

散布図の横軸がsepal_length,縦軸がsepal_widthです.

このように散布図にすると2変数の関係を一目で比較することが出来ます.

今回の例だと

散布図が右肩上がりなので,

sepal_lengthが大きくなるにつれて,sepal_widthも大きくなる傾向がある

ということがわかります.

2.コーディング

まとめ

今回は,散布図について学習しました.

散布図は,連続値の2変数の関係の傾向を確認するためのグラフです.

plotnineでは,geom_pointとすればOKです.

これにて,Pythonの前処理講座は終了です,お疲れさまでした!!

長く感じたかもしれないですが,これでも重要事項を厳選したつもりです.

なので,もう少し勉強したほうがいい箇所もありますが,最初からやりすぎるとばててしまうので,とりあえずはこの程度でいいと思います.

あと,個人的な見解ですが,前処理については,PythonよりもRのtidyverseを使用したほうが楽だと思います.

このDX時代,PythonとRは両方使いこなせる必要があると思うので,よろしければぜひRについても理解を深めていただければと思います!

それでは,お疲れさまでした!!

-Python前処理講座