【pandas】drop_duplicated：重複削除【データフレーム処理】

8月 28, 2022

こんにちは，shun（@datasciencemore）です！！

今回はdrop_duplicatesについて学習していきます．

drop_duplicatesは，重複削除をするメソッドです．

重複削除で抽出される行は，各カテゴリの最初の行となります．

ということで，drop_duplicatesについてはそんなに学習することがありません．

サクッと終わらせてしまいましょう．

０．準備
１．drop_duplicatedの使い方
まとめ
次回

０．準備

# パッケージ読み込み
import pandas as pd
import numpy as np
import seaborn as sns

# データフレームの表示行数を指定
pd.set_option('display.max_rows', 5) 

# データ読み込み
df = sns.load_dataset('diamonds')

# パッケージ読み込み

import pandas as pd

import numpy as np

import seaborn as sns

# データフレームの表示行数を指定

pd.set_option('display.max_rows', 5)

# データ読み込み

df = sns.load_dataset('diamonds')

１．drop_duplicatedの使い方

基本的に重複を削除したい列を指定すればOKです．

# cut列の重複削除
df.drop_duplicates("cut")

1 2	# cut列の重複削除 df.drop_duplicates("cut")

列は複数指定することもできます．

# cut列, color列の重複削除
df.drop_duplicates(["cut", "color"])

1 2	# cut列, color列の重複削除 df.drop_duplicates(["cut", "color"])

まとめ

今回はdrop_duplicatesについて学習しました．

drop_duplicatesは，重複削除をするメソッドです．

drop_duplicatesは，使用頻度はそこまで高くないものの意外と重要で忘れがちなメソッドですので，しっかり押さえておきましょう！

それではお疲れさまでした！！

次回

: 【pandas】melt, pivot：縦横変換【データフレーム処理】

こんにちは，shun（@datasciencemore）です！！今回はmeltとpivotについて学習していきます． meltとpivotは，縦横変換をするメソッドです．縦横変換というのは，データ ...

続きを見る