旗下產(chǎn)業(yè): A產(chǎn)業(yè)/?A實習(xí)/?A計劃

全國統(tǒng)一咨詢熱線：010-5367 2995

就業(yè)保障

學(xué)員成果

關(guān)于我們

全國校區(qū)

首頁 > 熱門文章 > 大數(shù)據(jù)分析 > 大數(shù)據(jù)分析常用pandas函數(shù)有哪些

產(chǎn)品經(jīng)理

大數(shù)據(jù)分析

原畫設(shè)計

平面設(shè)計

新媒體運營

大數(shù)據(jù)分析常用pandas函數(shù)有哪些

時間：2020-12-11來源：5wd995.cn點擊量：次作者：Sissi

時間：2020-12-11點擊量：次作者：Sissi

　　熟練掌握pandas函數(shù)都能幫我們在數(shù)據(jù)分析過程中節(jié)省時間。pandas還有很多讓人舒適的用法，這次就為大家介紹5個pandas函數(shù)!

　　大數(shù)據(jù)分析常用pandas函數(shù)有哪些由Python大數(shù)據(jù)分析編譯。

一、 explode

　　explode用于將一行數(shù)據(jù)展開成多行。比如說dataframe中某一行其中一個元素包含多個同類型的數(shù)據(jù)，若想要展開成多行進行分析，這時候explode就派上用場，而且只需一行代碼，非常節(jié)省時間。

　　用法：

大數(shù)據(jù)分析常用pandas函數(shù)有哪些

　　參數(shù)作用：

　　column ：str或tuple

　　以下表中第三行、第二列為例，展開[2,3,8]：

大數(shù)據(jù)分析常用pandas函數(shù)有哪些

　　使用explode輕松將[2,3,8]轉(zhuǎn)換成多行，且行內(nèi)其他元素保持不變。

大數(shù)據(jù)分析常用pandas函數(shù)有哪些

二、 Nunique

　　Nunique用于計算行或列上唯一值的數(shù)量，即去重后計數(shù)。這個函數(shù)在分類問題中非常實用，當不知道某字段中有多少類元素時，Nunique能快速生成結(jié)果。

　　用法：

大數(shù)據(jù)分析常用pandas函數(shù)有哪些

　　參數(shù)作用：

　　1)axis：int型，0代表行，1代表列，默認0;

　　2)dropna：bool類型，默認為True，計數(shù)中不包括NaN;

　　先創(chuàng)建一個df：

大數(shù)據(jù)分析常用pandas函數(shù)有哪些

　　對year列進行唯一值計數(shù)：

大數(shù)據(jù)分析常用pandas函數(shù)有哪些

　　輸出：10 對整個dataframe的每一個字段進行唯一值計數(shù)：

大數(shù)據(jù)分析常用pandas函數(shù)有哪些

三、infer_objects

　　infer_objects用于將object類型列推斷為更合適的數(shù)據(jù)類型。

　　用法：

大數(shù)據(jù)分析常用pandas函數(shù)有哪些

　　pandas支持多種數(shù)據(jù)類型，其中之一是object類型。object類型包括字符串和混合值(數(shù)字及非數(shù)字)。

　　object類型比較寬泛，如果可以確定為具體數(shù)據(jù)類型，則不建議用object。

大數(shù)據(jù)分析常用pandas函數(shù)有哪些

　　使用infer_objects方法將object推斷為int類型：

大數(shù)據(jù)分析常用pandas函數(shù)有哪些

　　4. memory_usage

　　memory_usage用于計算dataframe每一列的字節(jié)存儲大小，這對于大數(shù)據(jù)表非常有用。

　　用法：

大數(shù)據(jù)分析常用pandas函數(shù)有哪些

　　參數(shù)解釋：index：指定是否返回df中索引字節(jié)大小，默認為True，返回的第一行即是索引的內(nèi)存使用情況;deep：如果為True，則通過查詢object類型進行系統(tǒng)級內(nèi)存消耗來深入地檢查數(shù)據(jù)，并將其包括在返回值中。

　　首先創(chuàng)建一個df，共2列，1000000行。

大數(shù)據(jù)分析常用pandas函數(shù)有哪些

　　返回每一列的占用字節(jié)大?。?/p>

大數(shù)據(jù)分析常用pandas函數(shù)有哪些

　　第一行是索引index的內(nèi)存情況，其余是各列的內(nèi)存情況。

五、replace

　　顧名思義，replace是用來替換df中的值，賦以新的值。

　　用法：

大數(shù)據(jù)分析常用pandas函數(shù)有哪些

　　參數(shù)解釋：

　　1)to_replace：被替換的值

　　2)value：替換后的值

　　3)inplace：是否要改變原數(shù)據(jù)，F(xiàn)alse是不改變，True是改變，默認是False

　　4)limit：控制填充次數(shù)

　　5)regex：是否使用正則,False是不使用，True是使用，默認是False

　　6)method：填充方式，pad,ffill,bfill分別是向前、向前、向后填充

　　創(chuàng)建一個df：

大數(shù)據(jù)分析常用pandas函數(shù)有哪些

　　將A全部替換為D：

大數(shù)據(jù)分析常用pandas函數(shù)有哪些

　　將B替換為E，C替換為F：

大數(shù)據(jù)分析常用pandas函數(shù)有哪些

預(yù)約申請免費試聽課

填寫下面表單即可預(yù)約申請免費試聽！怕錢不夠？可先就業(yè)掙錢后再付學(xué)費！怕學(xué)不會？助教全程陪讀，隨時解惑！擔(dān)心就業(yè)？一地學(xué)習(xí)，可推薦就業(yè)！

?2007-2021/北京漫動者教育科技有限公司版權(quán)所有
備案號：京ICP備12034770號

熱門文章今日必讀行業(yè)資訊

?2007-2022/ 5wd995.cn 北京漫動者數(shù)字科技有限公司備案號：京ICP備12034770號監(jiān)督電話：010-53672995 郵箱：bjaaa@aaaedu.cc

京公網(wǎng)安備 11010802035704號

網(wǎng)站地圖