こんにちは,shun(@datasciencemore)です!!
今回はuniqueについて学習していきます.
uniqueは,重複削除をするメソッドです.
重複削除で抽出される行は,各カテゴリの最初の行となります.
ということで,uniqueについてはそんなに学習することがありません.
サクッと終わらせてしまいましょう.
0.準備
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
# パッケージ読み込み import numpy as np import polars as pl import seaborn as sns # データフレームの表示行数を指定 pl.Config.set_tbl_rows(7) # データ読み込み # x列, y列, z列を削除 df = \ pl\ .from_pandas(sns.load_dataset("diamonds"))\ .select(pl.exclude(["x", "y", "z"])) |
1.uniqueの使い方
基本的に重複を削除したい列を指定すればOKです.
1 2 |
# cut列の重複削除 df.unique(subset="cut") |
列は複数指定することもできます.
1 2 |
# cut列, color列の重複削除 df.unique(subset=["cut", "color"]) |
まとめ
今回はuniqueについて学習しました.
uniqueは,重複削除をするメソッドです.
uniqueは,使用頻度はそこまで高くないものの意外と重要で忘れがちなメソッドですので,しっかり押さえておきましょう!
それではお疲れさまでした!!