こんにちは,shun(@datasciencemore)です!!
今回は,plotnineの使用方法について学習していきます.
plotnineでは,グラフを3つの要素である,キャンバス,グラフ,体裁で考えます.
そして,これらをレイヤーとしてひとつずつ重ね合わせることで全体のグラフを作成します.
0.準備
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 |
# パッケージ読み込み import pandas as pd import numpy as np import seaborn as sns from plotnine import * from plotnine.themes import * import warnings # データフレームの表示行数を指定 pd.set_option('display.max_rows', 5) # 図のサイズ調整 theme_set(theme( figure_size=(4.2, 3.6), axis_title=element_text(size=15), axis_text=element_text(size=15) ) ) # 警告の非表示 warnings.filterwarnings('ignore') # データ読み込み df = \ sns\ .load_dataset('iris') |
1.基本
1 2 3 4 5 |
# 1.キャンパス ggplot( data = df, mapping = aes(x="sepal_length", y="petal_length") ) |
1 2 3 4 5 6 |
# 1.キャンパス + 2.グラフ ggplot( data = df, mapping = aes(x="sepal_length", y="petal_length") ) +\ geom_point() |
1 2 3 4 5 6 7 8 9 10 11 |
# 1.キャンパス + 2.グラフ + 3.体裁 ggplot( data = df, mapping = aes(x="sepal_length", y="petal_length") ) +\ geom_point() +\ theme( rect=element_rect(fill = 'pink', colour = 'orange', size = 5), axis_title=element_text(size=30), axis_text=element_text(size=30) ) |
2.カテゴリごとに出力
plotnineでは,カテゴリごとのグラフを簡単に作成することができます.
カテゴリごとのグラフは,単数と複数の2種類があります.
単数というのは,1つのキャンパスにカテゴリごとのグラフをまとめて記述すること
複数というのは,複数のキャンパスにカテゴリのグラフをまとめて記述すること
を示しています.
①単数
単数として出力する場合,aesの中でfillかcolorでカテゴリとする列を指定します.
fillかcolorかは,グラフの種類によって変わってきます.
ヒストグラム,棒グラフの場合,fillを
散布図の場合,colorとすればOKです.
例えば,図の左のdfに対し,aesの中でfillをspeciesとして設定すると,
1つのキャンパスのなかにspecies列の3つのカテゴリであるsetosa, versicolor, virginicaごとのグラフが作成されます.
1 2 3 4 5 6 |
# カテゴリごと出力(単数) ggplot( df, aes(x="sepal_length", fill="species") ) +\ geom_histogram(alpha=0.6) |
②複数
複数として出力する場合,facet_wrapの中でカテゴリとする列を指定します.
例えば,図の左のdfに対し,facet_wrapの中でspeciesと設定すると,
species列の3つのカテゴリであるsetosa, versicolor, virginicaごとのグラフが別々に作成されます.
1 2 3 4 5 6 7 |
# sepal_lengthのヒストグラム カテゴリごと出力(複数) ggplot( df, aes(x="sepal_length") ) +\ geom_histogram() +\ facet_wrap("species") |
3.可視化の重要メソッド
こちらに可視化のメソッドのうち,頻出であるものを示しました.
次回からこれらのメソッドの使用方法について詳細に説明していきます.
まとめ
今回はplotnineの基本について,学習しました.
plotnineは,特にカテゴリごとに出力するのが得意です.
カテゴリごとに出力することは,実務では非常によくあるシチュエーションなので,ここでしっかりと慣れておきましょう!
それでは,お疲れさまでした!!
次回
-
【plotnine】geom_histogram:ヒストグラム【可視化】
こんにちは,shun(@datasciencemore)です!! 今回は,geom_histogram:ヒストグラムについて学習していきます. geom_histogramは,ヒストグラムを作成するた ...
続きを見る