旗下產(chǎn)業(yè): A產(chǎn)業(yè)/?A實(shí)習(xí)/?A計(jì)劃
全國統(tǒng)一咨詢熱線:010-5367 2995
首頁 > 熱門文章 > 大數(shù)據(jù)分析 > 大數(shù)據(jù)分析R語言7種數(shù)據(jù)可視化方式

大數(shù)據(jù)分析R語言7種數(shù)據(jù)可視化方式

時(shí)間:2020-08-07來源:5wd995.cn點(diǎn)擊量:作者:Sissi
時(shí)間:2020-08-07點(diǎn)擊量:作者:Sissi



  這篇大數(shù)據(jù)分析R語言7種數(shù)據(jù)可視化方式文章介紹了7種基本數(shù)據(jù)可視化的方式,以及如何結(jié)合使用基本R函數(shù)和一些常見軟件包來重新創(chuàng)建它們。
 

  數(shù)據(jù)可視化是一個(gè)創(chuàng)新而令人興奮的領(lǐng)域。盡管它需要很長(zhǎng)時(shí)間才能在計(jì)算機(jī)屏幕后進(jìn)行操作,并且需要掌握數(shù)字,但它是一項(xiàng)非常有價(jià)值的職業(yè),它處于早期階段,并且每天都在增長(zhǎng)。
 

  盡管幾乎沒有專門的程序用于可視化數(shù)據(jù),但是許多數(shù)據(jù)科學(xué)家使用一種稱為R的編程語言,并且該程序及其許多可用的包為幾乎可以想象到的每種情況提供了許多不同形式的可視化。
 

  以下是7種基本數(shù)據(jù)可視化的方式,以及如何結(jié)合使用基本R函數(shù)和一些常用軟件包來重新創(chuàng)建它們。所有示例均使用默認(rèn)R base安裝中包含的數(shù)據(jù)集。
 

一、數(shù)據(jù)可視化方式:條形圖
 

  您可能已經(jīng)熟悉小學(xué),中學(xué)和大學(xué)的基本條形圖。R中的條形圖的概念與過去的方案相同,以顯示兩個(gè)或多個(gè)變量之間的分類比較。但是,有幾種不同類型的條形圖需要了解和理解。
 

  水平和垂直條形圖已經(jīng)很常見并且很熟悉-它們是大多數(shù)學(xué)術(shù)或?qū)I(yè)演講中的標(biāo)準(zhǔn)格式。但是R提供了一個(gè)堆積的條形圖,可讓您為每個(gè)類別引入不同的變量。
 

  數(shù)字<-表格(mtcars $ cyl,mtcars $ gear)

  barplot(Numbers,main = '按汽缸數(shù)量分組的汽車汽缸編號(hào)',

  col = c('red','orange','steelblue'),legend =行名(數(shù)字),xlab = '齒輪數(shù)',

  ylab = 'count')

大數(shù)據(jù)分析R語言7種數(shù)據(jù)可視化方式
 

二、數(shù)據(jù)可視化方式:直方圖
 

  直方圖在某些學(xué)術(shù)領(lǐng)域是標(biāo)準(zhǔn)的,但通常保留給最高級(jí)別的學(xué)生。這些圖表最適合R中具有高度精確或準(zhǔn)確的數(shù)字。
 

  它最終提供了變量的概率估計(jì),例如,在項(xiàng)目完成之前的時(shí)間段。R也為此提供了一個(gè)簡(jiǎn)單的功能。
 

  #``空氣質(zhì)量''數(shù)據(jù)集中的臭氧值頻率直方圖

  hist(空氣質(zhì)量$ Temp,col = 'steelblue',main = '最高每日溫度',

  xlab = '溫度(華氏度)')

大數(shù)據(jù)分析R語言7種數(shù)據(jù)可視化方式
 

三、數(shù)據(jù)可視化方式:熱圖
 

  熱圖是R中 最創(chuàng)新的數(shù)據(jù)可視化之一,它強(qiáng)調(diào)顏色強(qiáng)度以可視化多個(gè)變量之間的關(guān)系。
 

  結(jié)果是易于解釋的有吸引力的2D圖像。作為一個(gè)基本示例,熱圖通過根據(jù)競(jìng)爭(zhēng)產(chǎn)品的原始投放市場(chǎng)日期對(duì)其進(jìn)行排名來突出顯示競(jìng)爭(zhēng)產(chǎn)品的受歡迎程度。它通過提供一段時(shí)間內(nèi)的銷售統(tǒng)計(jì)數(shù)據(jù)和數(shù)字來進(jìn)一步細(xì)分。
 

  #模擬10個(gè)點(diǎn)的數(shù)據(jù)集

  x < -rnorm(10,平均值= rep(1 :5,每個(gè)= 2),sd = 0.7)

  ÿ < - RNORM(10,平均值=代表(C(1,9),每個(gè)= 5),SD = 0.1)

  dataFrame < -data.frame(x = x,y = y)

  set.seed(143)

  DATAMATRIX < - as.matrix(數(shù)據(jù)幀)的樣品(1 :10),] #轉(zhuǎn)換到類“矩陣”,然后洗牌矩陣的行

  熱圖(數(shù)據(jù)矩陣)通過熱圖#形象化分級(jí)聚類

大數(shù)據(jù)分析R語言7種數(shù)據(jù)可視化方式
 

四、數(shù)據(jù)可視化方式:散點(diǎn)圖
 

  繪圖是圖表或圖形的一種流行替代方法。它提供了涉及各種點(diǎn)的獨(dú)特可視化效果。最標(biāo)準(zhǔn)的迭代-散點(diǎn)圖-在一段時(shí)間內(nèi)跟蹤兩個(gè)連續(xù)變量。散點(diǎn)圖的基本應(yīng)用涉及跟蹤多年來兒童的身高和體重。
 

  當(dāng)試圖避免可視化中的錯(cuò)誤信息時(shí),散點(diǎn)圖很有用。僅當(dāng)您確定受眾熟悉該類型的圖表并且始終謹(jǐn)慎使用時(shí),才使用圖表。如有疑問,請(qǐng)選擇其他選項(xiàng)之一。
 

  #僅繪制九月月份的臭氧和溫度測(cè)量圖,

  其中(subset(airquality,Month == 9),plot(Wind,Ozone,col = 'steelblue',pch = 20,cex = 1.5))

  標(biāo)題(“ 1973年9月紐約市的風(fēng)和溫度”)

大數(shù)據(jù)分析R語言7種數(shù)據(jù)可視化方式
 

五、數(shù)據(jù)可視化方式:箱形圖
 

  該箱線圖類似于在許多方面的柱狀圖。箱形圖不再關(guān)注分類數(shù)據(jù),而是提供分類數(shù)據(jù)和連續(xù)變量數(shù)據(jù)的可視化。
 

  在現(xiàn)實(shí)世界中,箱形圖提供了有關(guān)天氣模式及其隨時(shí)間變化的詳細(xì)信息。
 

  mtcars < -變換(mtcars,CYL =因子(CYL)) #轉(zhuǎn)換'CYL'從類'數(shù)字'類'因子'列

  類(mtcars $ CYL) #'CYL'現(xiàn)在是一個(gè)分類變量

  箱線圖(MPG ? CYL ,mtcars,xlab = '氣缸數(shù)',ylab = '每加侖英里',

  main = “汽車中不同氣缸的每加侖英里數(shù)”,cex.main = 1.2)

  library(dplyr)#數(shù)據(jù)處理

  library(ggplot2)#數(shù)據(jù)可視化

  庫(Corrplot)#相關(guān)圖

大數(shù)據(jù)分析R語言7種數(shù)據(jù)可視化方式
 

六、數(shù)據(jù)可視化方式:相關(guān)圖
 

  相關(guān)數(shù)據(jù)最好通過corrplot可視化。2D格式類似于熱圖,但突出顯示直接相關(guān)的統(tǒng)計(jì)信息。
 

  大多數(shù)相關(guān)圖會(huì)突出顯示各個(gè)時(shí)間點(diǎn)的數(shù)據(jù)集之間的相關(guān)程度。比較不同月份或年份之間的銷售數(shù)據(jù)是一個(gè)基本示例。
 

  #data(“ mtcars”)

  corr_matrix < -cor(mtcars)

  #帶圓圈

  corrplot(corr_matrix)

  #帶數(shù)字及以下

  corrplot(corr_matrix,

  方法= '數(shù)字',

  type = “ lower”)

大數(shù)據(jù)分析R語言7種數(shù)據(jù)可視化方式
大數(shù)據(jù)分析R語言7種數(shù)據(jù)可視化方式
 

七、數(shù)據(jù)可視化方式:面積圖
 

  區(qū)域圖表示不同變量或數(shù)據(jù)集之間的連續(xù)性。它類似于您從小學(xué)就知道的傳統(tǒng)折線圖,并且以類似的方式使用。
 

  大多數(shù)面積圖會(huì)突出顯示趨勢(shì)及其隨時(shí)間的演變,從而在試圖揭示潛在趨勢(shì)(無論是正面還是負(fù)面)時(shí)非常有效。
 

  #data(“ airquality”)#使用的數(shù)據(jù)集

  空氣質(zhì)量%>%

  group_by(Day)%>%

  摘要(mean_wind =平均值(風(fēng)))%>%

  ggplot()+

  geom_area(aes(x = Day,y = mean_wind))+

  labs(title = “平均面積圖每天風(fēng)”,

  副標(biāo)題= “使用空氣質(zhì)量數(shù)據(jù)”,

  y = “平均風(fēng)”)

大數(shù)據(jù)分析R語言7種數(shù)據(jù)可視化方式
 

  數(shù)據(jù)可視化正在進(jìn)入主流
 

  研究表明,與單調(diào)的電子表格和過時(shí)的報(bào)告相比,圖表,圖形和其他可視化提供了一種輕松記住數(shù)據(jù)的方式。
 

  不僅在專業(yè)領(lǐng)域如此,而且許多學(xué)術(shù)機(jī)構(gòu)也在學(xué)生論文,演示文稿和論文中采用了下一代數(shù)據(jù)可視化。
 

  數(shù)據(jù)可視化似乎幾乎沒有觸及的領(lǐng)域,而且該領(lǐng)域仍處于起步階段。


 

預(yù)約申請(qǐng)免費(fèi)試聽課

填寫下面表單即可預(yù)約申請(qǐng)免費(fèi)試聽!怕錢不夠?可先就業(yè)掙錢后再付學(xué)費(fèi)! 怕學(xué)不會(huì)?助教全程陪讀,隨時(shí)解惑!擔(dān)心就業(yè)?一地學(xué)習(xí),可推薦就業(yè)!

?2007-2021/北京漫動(dòng)者教育科技有限公司版權(quán)所有
備案號(hào):京ICP備12034770號(hào)

?2007-2022/ 5wd995.cn 北京漫動(dòng)者數(shù)字科技有限公司 備案號(hào): 京ICP備12034770號(hào) 監(jiān)督電話:010-53672995 郵箱:bjaaa@aaaedu.cc

京公網(wǎng)安備 11010802035704號(hào)

網(wǎng)站地圖