こんにちは,shun(@datasciencemore)です!!
今回はdropnaについて学習していきます.
dropnaは,欠損値の行を削除するメソッドです.
イメージとしてはこのようになります.
データフレームにdropnaを適用すると,欠損値がある行を削除します.
なお,引数subsetで削除対象とする列を指定することができます.
0.準備
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
# パッケージ読み込み import pandas as pd import numpy as np # データフレームの表示行数を指定 pd.set_option('display.max_rows',5) # データフレームを定義 df = pd.DataFrame( { "x":[1, 3, 2, 8, 10], "y":[10, 4, np.nan, 6, np.nan], "z":[np.nan, 8, 7, 8, np.nan] } ).astype("float") |
1.dropnaの基本
1 2 |
# 欠損値がある行を削除 df.dropna() |
1 2 |
# z列に欠損値がある行を削除 df.dropna(subset=["z"]) |
まとめ
今回はdropnaについて学習してきました.
dropnaは,欠損値がある行を削除するメソッドです.
そんなに難しくないと思います.
それでは,お疲れさまでした!!
次回
-
【pandas】fillna:欠損値置換【欠損値処理】
こんにちは,shun(@datasciencemore)です!! 今回はfillnaについて学習していきます. fillnaは,欠損値を指定した値に置換するメソッドです. イメージとしてはこのようにな ...
続きを見る