こんにちは,shun(@datasciencemore)です!!
これからしばらくpolarsのデータフレーム処理について,学習していきます.
今回はこれから学習していくpolarsのデータフレーム処理の概要について説明していきます.
polarsは主にデータフレーム処理のためのパッケージでした.
データフレーム処理とは,以下のようにデータフレームに対して様々な加工を加えることで新しいデータフレームを作成する処理のことです.
この様々な加工というのは,色々考えられます.
例えば,このスライドの例のように行を抽出したり,列を追加したり,それ以外にもデータフレーム同士をくっつけたり,重複を削除したりなど
が挙げられます.
これらの様々な加工は,pandasのメソッドを使用することで実現することができます.
1.データフレーム処理の重要メソッド
以下がデータフレームに対し様々な加工をするための重要メソッドとなります.
もちろん,ここに示したものはほんの一例です.
全部やってるときりがないし,ぼくも全部把握しているわけではありません.
超頻出のところに限定していますが,これだけでもかなりのデータフレーム処理をカバーできます.
とにかくここに挙げたメソッドはとてもよく使います.
このコースは前処理の8割をカバーすることを目的としていますが,こちらのメソッドだけで前処理の5~6割をカバーできるかもしれません.
それくらいこれらのメソッドは重要です.
なので,ぼくもできるだけ丁寧に解説することを心がけますので,皆様もぜひついてきてください.
まとめ
今回は,polarsのデータフレーム処理の概要について説明しました.
データフレーム処理はpolarsの中でも最もよく使用する機能です.
ここは必ずマスターするようにしましょう!
それでは,お疲れ様でした!