polars講座

【polars】概要【データフレーム処理】

こんにちは,shun(@datasciencemore)です!!

これからしばらくpolarsのデータフレーム処理について,学習していきます.

今回はこれから学習していくpolarsのデータフレーム処理の概要について説明していきます.

polarsは主にデータフレーム処理のためのパッケージでした.

データフレーム処理とは,以下のようにデータフレームに対して様々な加工を加えることで新しいデータフレームを作成する処理のことです.

この様々な加工というのは,色々考えられます.

例えば,このスライドの例のように行を抽出したり,列を追加したり,それ以外にもデータフレーム同士をくっつけたり,重複を削除したりなど

が挙げられます.

これらの様々な加工は,pandasのメソッドを使用することで実現することができます.

1.データフレーム処理の重要メソッド

以下がデータフレームに対し様々な加工をするための重要メソッドとなります.

もちろん,ここに示したものはほんの一例です.

全部やってるときりがないし,ぼくも全部把握しているわけではありません.

超頻出のところに限定していますが,これだけでもかなりのデータフレーム処理をカバーできます.

とにかくここに挙げたメソッドはとてもよく使います.

このコースは前処理の8割をカバーすることを目的としていますが,こちらのメソッドだけで前処理の5~6割をカバーできるかもしれません.

それくらいこれらのメソッドは重要です.

なので,ぼくもできるだけ丁寧に解説することを心がけますので,皆様もぜひついてきてください.

まとめ

今回は,polarsのデータフレーム処理の概要について説明しました.

データフレーム処理はpolarsの中でも最もよく使用する機能です.

ここは必ずマスターするようにしましょう!

それでは,お疲れ様でした!

次回

-polars講座