2020年7月30日 星期四

使用pandas去除資料中的缺失值

當我們要開始作資料分析,一定會遇到碰上有缺失資料的狀況,這個時候,我們就需要用pandas來把包含缺失值的數據刪除。
假設我們現在讀入了一個dataframe df,我們先把空格填入nan
df['<column name A>', '<column name B>'].replace('', np.nan, inplace=True)
 再來就是把是空格的欄位去掉。
df_new = df.dropna(inplace=True)
重設index,(這是為了要走for loop的時候不會出錯,如果只是資料分析其實可以略過)
df_new.reset_index(drop=True, inplace=True)

沒有留言:

張貼留言