こんにちは,shun(@datasciencemore)です!!
今回はdrop_duplicatesについて学習していきます.
drop_duplicatesは,重複削除をするメソッドです.

重複削除で抽出される行は,各カテゴリの最初の行となります.
ということで,drop_duplicatesについてはそんなに学習することがありません.
サクッと終わらせてしまいましょう.
0.準備
1 2 3 4 5 6 7 8 9 10 |
# パッケージ読み込み import pandas as pd import numpy as np import seaborn as sns # データフレームの表示行数を指定 pd.set_option('display.max_rows', 5) # データ読み込み df = sns.load_dataset('diamonds') |
1.drop_duplicatedの使い方
基本的に重複を削除したい列を指定すればOKです.
1 2 |
# cut列の重複削除 df.drop_duplicates("cut") |

列は複数指定することもできます.
1 2 |
# cut列, color列の重複削除 df.drop_duplicates(["cut", "color"]) |

まとめ
今回はdrop_duplicatesについて学習しました.
drop_duplicatesは,重複削除をするメソッドです.
drop_duplicatesは,使用頻度はそこまで高くないものの意外と重要で忘れがちなメソッドですので,しっかり押さえておきましょう!
それではお疲れさまでした!!
次回
-
-
【pandas】melt, pivot:縦横変換【データフレーム処理】
こんにちは,shun(@datasciencemore)です!! 今回はmeltとpivotについて学習していきます. meltとpivotは,縦横変換をするメソッドです. 縦横変換というのは,データ ...
続きを見る