Python前処理講座

【plotnine】plotnineってなに??【可視化】

こんにちは,shun(@datasciencemore)です!!

今回からしばらくの間,plotnineについて説明していきます.

0.plotnineってなに??

plotnineってなんですか??

plotnineはデータの可視化のためのパッケージのことだよ!!
plotnineを使用することで,簡単にデータの可視化ができるようになるんだ!!

plotnineはデータの可視化をするためのパッケージです.

plotnineもnumpy,pandasと同様,データ分析に欠かせないパッケージとなります.

1.データの可視化

データの可視化について具体的にみてみましょう.

左にデータフレームがあります.

これはirisの一部を抜粋したものです.

これを可視化すると右図のようになります.

どちらが傾向がわかりやすいか一目瞭然だと思います.

このようにデータの傾向を把握するために,可視化はとても有効なので,データ分析では頻繁に可視化をします.

2.なぜplotnineなのか?

Pythonでは,可視化をするのに様々な方法がありますが,デファクトスタンダードとなっているパッケージはmatplotlibです.

また,seabornというパッケージも良く使用されます.

ただ,これらのパッケージは,構文がとても複雑です.

一方,plotnineは,matplotlibやseabornと比較し,構文が簡単です.

また,Rの可視化パッケージにggplot2というものがあるのですが,plotnineの構文は,ggplot2とほぼ同じです.

なので,Rを使う人限定ですが,plotnineをマスターすれば,同時にRのggplot2もマスターできるので,学習コストの削減が図れます.

以上の理由により,当講座ではplotnineを採用しました.

もちろん,matplotlibやseabornがplotnineに劣っているというわけではなく,グラフによってはmatplotlibやseabornのほうが書きやすいということもあります.
できたら全てのパッケージを紹介したいのですが,時間の都合上,主にplotnineを紹介させていただければと思います.

まとめ

今回は,plotnineについて説明しました.

plotnineは,データの可視化のためのパッケージです.

データ分析では,可視化が頻繁に行われます.

なので,plotnineをマスターすることは,データ分析をするうえで必要不可欠と言っても過言ではありません.

しっかりとマスターしましょう!

それでは,お疲れ様でした!

次回

【plotnine】plotnineの使用方法【可視化】

こんにちは,shun(@datasciencemore)です!! 今回は,plotnineの使用方法について学習していきます. plotnineでは,グラフを3つの要素である,キャンバス,グラフ,体裁 ...

続きを見る

-Python前処理講座