旗下產(chǎn)業(yè): A產(chǎn)業(yè)/?A實(shí)習(xí)/?A計(jì)劃
全國(guó)統(tǒng)一咨詢(xún)熱線:010-5367 2995
首頁(yè) > 熱門(mén)文章 > 大數(shù)據(jù)分析 > 大數(shù)據(jù)分析常用pandas函數(shù)有哪些

大數(shù)據(jù)分析常用pandas函數(shù)有哪些

時(shí)間:2020-12-11來(lái)源:5wd995.cn點(diǎn)擊量:作者:Sissi
時(shí)間:2020-12-11點(diǎn)擊量:作者:Sissi



  熟練掌握pandas函數(shù)都能幫我們?cè)跀?shù)據(jù)分析過(guò)程中節(jié)省時(shí)間。pandas還有很多讓人舒適的用法,這次就為大家介紹5個(gè)pandas函數(shù)!
 

  大數(shù)據(jù)分析常用pandas函數(shù)有哪些由Python大數(shù)據(jù)分析編譯。
 

一、 explode


  explode用于將一行數(shù)據(jù)展開(kāi)成多行。比如說(shuō)dataframe中某一行其中一個(gè)元素包含多個(gè)同類(lèi)型的數(shù)據(jù),若想要展開(kāi)成多行進(jìn)行分析,這時(shí)候explode就派上用場(chǎng),而且只需一行代碼,非常節(jié)省時(shí)間。
 

  用法:

大數(shù)據(jù)分析常用pandas函數(shù)有哪些
 

  參數(shù)作用:
 

  column :str或tuple

  以下表中第三行、第二列為例,展開(kāi)[2,3,8]:
 

大數(shù)據(jù)分析常用pandas函數(shù)有哪些
 

  使用explode輕松將[2,3,8]轉(zhuǎn)換成多行,且行內(nèi)其他元素保持不變。


大數(shù)據(jù)分析常用pandas函數(shù)有哪些

二、 Nunique
 

  Nunique用于計(jì)算行或列上唯一值的數(shù)量,即去重后計(jì)數(shù)。這個(gè)函數(shù)在分類(lèi)問(wèn)題中非常實(shí)用,當(dāng)不知道某字段中有多少類(lèi)元素時(shí),Nunique能快速生成結(jié)果。
 

  用法:

大數(shù)據(jù)分析常用pandas函數(shù)有哪些
 

  參數(shù)作用:
 

  1)axis:int型,0代表行,1代表列,默認(rèn)0;

  2)dropna:bool類(lèi)型,默認(rèn)為T(mén)rue,計(jì)數(shù)中不包括NaN;

  先創(chuàng)建一個(gè)df:


大數(shù)據(jù)分析常用pandas函數(shù)有哪些

  對(duì)year列進(jìn)行唯一值計(jì)數(shù):

大數(shù)據(jù)分析常用pandas函數(shù)有哪些

 

  輸出:10 對(duì)整個(gè)dataframe的每一個(gè)字段進(jìn)行唯一值計(jì)數(shù):

大數(shù)據(jù)分析常用pandas函數(shù)有哪些
 

三、infer_objects
 

  infer_objects用于將object類(lèi)型列推斷為更合適的數(shù)據(jù)類(lèi)型。
 

  用法:

大數(shù)據(jù)分析常用pandas函數(shù)有哪些
 

  pandas支持多種數(shù)據(jù)類(lèi)型,其中之一是object類(lèi)型。object類(lèi)型包括字符串和混合值(數(shù)字及非數(shù)字)。
 

  object類(lèi)型比較寬泛,如果可以確定為具體數(shù)據(jù)類(lèi)型,則不建議用object。

大數(shù)據(jù)分析常用pandas函數(shù)有哪些
 

  使用infer_objects方法將object推斷為int類(lèi)型:

大數(shù)據(jù)分析常用pandas函數(shù)有哪些
 

  4. memory_usage
 

  memory_usage用于計(jì)算dataframe每一列的字節(jié)存儲(chǔ)大小,這對(duì)于大數(shù)據(jù)表非常有用。
 

  用法:

大數(shù)據(jù)分析常用pandas函數(shù)有哪些
 

  參數(shù)解釋?zhuān)篿ndex:指定是否返回df中索引字節(jié)大小,默認(rèn)為T(mén)rue,返回的第一行即是索引的內(nèi)存使用情況;deep:如果為T(mén)rue,則通過(guò)查詢(xún)object類(lèi)型進(jìn)行系統(tǒng)級(jí)內(nèi)存消耗來(lái)深入地檢查數(shù)據(jù),并將其包括在返回值中。
 

  首先創(chuàng)建一個(gè)df,共2列,1000000行。

大數(shù)據(jù)分析常用pandas函數(shù)有哪些
 

  返回每一列的占用字節(jié)大?。?/p>

大數(shù)據(jù)分析常用pandas函數(shù)有哪些
 

  第一行是索引index的內(nèi)存情況,其余是各列的內(nèi)存情況。
 

五、replace


  顧名思義,replace是用來(lái)替換df中的值,賦以新的值。
 

  用法:

大數(shù)據(jù)分析常用pandas函數(shù)有哪些



  參數(shù)解釋?zhuān)?br />  

  1)to_replace:被替換的值

  2)value:替換后的值

  3)inplace:是否要改變?cè)瓟?shù)據(jù),F(xiàn)alse是不改變,True是改變,默認(rèn)是False

  4)limit:控制填充次數(shù)

  5)regex:是否使用正則,False是不使用,True是使用,默認(rèn)是False

  6)method:填充方式,pad,ffill,bfill分別是向前、向前、向后填充
 

  創(chuàng)建一個(gè)df:

大數(shù)據(jù)分析常用pandas函數(shù)有哪些
 

  將A全部替換為D:

大數(shù)據(jù)分析常用pandas函數(shù)有哪些
 

  將B替換為E,C替換為F:
 

大數(shù)據(jù)分析常用pandas函數(shù)有哪些




 

預(yù)約申請(qǐng)免費(fèi)試聽(tīng)課

填寫(xiě)下面表單即可預(yù)約申請(qǐng)免費(fèi)試聽(tīng)!怕錢(qián)不夠?可先就業(yè)掙錢(qián)后再付學(xué)費(fèi)! 怕學(xué)不會(huì)?助教全程陪讀,隨時(shí)解惑!擔(dān)心就業(yè)?一地學(xué)習(xí),可推薦就業(yè)!

?2007-2021/北京漫動(dòng)者教育科技有限公司版權(quán)所有
備案號(hào):京ICP備12034770號(hào)

?2007-2022/ 5wd995.cn 北京漫動(dòng)者數(shù)字科技有限公司 備案號(hào): 京ICP備12034770號(hào) 監(jiān)督電話(huà):010-53672995 郵箱:bjaaa@aaaedu.cc

京公網(wǎng)安備 11010802035704號(hào)

網(wǎng)站地圖