【polars】unique：重複削除【データフレーム処理】

7月 20, 2023

こんにちは，shun（@datasciencemore）です！！

今回はuniqueについて学習していきます．

uniqueは，重複削除をするメソッドです．

重複削除で抽出される行は，各カテゴリの最初の行となります．

ということで，uniqueについてはそんなに学習することがありません．

サクッと終わらせてしまいましょう．

０．準備
１．uniqueの使い方
まとめ
次回

０．準備

# パッケージ読み込み
import numpy as np
import polars as pl
import seaborn as sns

# データフレームの表示行数を指定
pl.Config.set_tbl_rows(7)

# データ読み込み
# x列, y列, z列を削除
df = \
pl\
.from_pandas(sns.load_dataset("diamonds"))\
.select(pl.exclude(["x", "y", "z"]))

# パッケージ読み込み

import numpy as np

import polars as pl

import seaborn as sns

# データフレームの表示行数を指定

pl.Config.set_tbl_rows(7)

# データ読み込み

# x列, y列, z列を削除

df = \

pl\

.from_pandas(sns.load_dataset("diamonds"))\

.select(pl.exclude(["x", "y", "z"]))

１．uniqueの使い方

基本的に重複を削除したい列を指定すればOKです．

# cut列の重複削除
df.unique(subset="cut")

1 2	# cut列の重複削除 df.unique(subset="cut")

列は複数指定することもできます．

# cut列, color列の重複削除
df.unique(subset=["cut", "color"])

1 2	# cut列, color列の重複削除 df.unique(subset=["cut", "color"])

まとめ

今回はuniqueについて学習しました．

uniqueは，重複削除をするメソッドです．

uniqueは，使用頻度はそこまで高くないものの意外と重要で忘れがちなメソッドですので，しっかり押さえておきましょう！

それではお疲れさまでした！！

次回

: 【polars】melt, pivot：縦横変換【データフレーム処理】
こんにちは，shun（@datasciencemore）です！！今回はmeltとpivotについて学習していきます． meltとpivotは，縦横変換をするメソッドです．縦横変換というのは，データ ...