polars講座

【polars】fill_null:欠損値置換【欠損値処理】


こんにちは,shun(@datasciencemore)です!!

今回はfill_nullについて学習していきます.

fill_nullは,欠損値を指定した値に置換するメソッドです.

イメージとしてはこのようになります.

データフレームに置換後の値を指定してfill_nullを適用すると,欠損値を指定した値に置換します.

この例だと置換後の値を0と設定しているので,欠損値が0に置換されています.

置換後の値の指定方法は,主に2つあります.

1つ目は,引数をvalueとする方法です.

引数をvalueとすると,置換後の値を直接指定することができます.

引数valueは省略することができます.

また,シリーズで指定することもできます.

2つ目は,引数をstrategyとする方法です.

引数をstrategyとすると,様々な方法で欠損値を置換します。

例えば

  • mean:各列の平均で置換
  • forward:欠損値の上の値で置換
  • backward:欠損値の下の値で置換

などが挙げられます。

0.準備

1.value:置換後の値を直接指定

2.strategy:置換後の値を計算して補完

まとめ

今回はfill_nullについて学習してきました.

fill_nullは,欠損値を指定した値に置換するメソッドです.

引数にvalueかstrategyを設定することで,柔軟に置換後の値を指定することが出来ます.

さて,これで欠損値処理の説明が終了となり,晴れてpolars編が終了となります.

polarsは,データ分析のメインパッケージの中でも一番よく使用するパッケージです.

なので,学習すべき事項もとてもたくさんあります.

1回では絶対に習得できないので,何回も復習しましょう!

それでは,お疲れさまでした!!

-polars講座