旗下產(chǎn)業(yè): A產(chǎn)業(yè)/?A實(shí)習(xí)/?A計(jì)劃
全國(guó)統(tǒng)一咨詢熱線:010-5367 2995
首頁 > 熱門文章 > 大數(shù)據(jù)分析 > 大數(shù)據(jù)分析線性回歸模型

大數(shù)據(jù)分析線性回歸模型

時(shí)間:2020-09-10來源:5wd995.cn點(diǎn)擊量:作者:Sissi
時(shí)間:2020-09-10點(diǎn)擊量:作者:Sissi



  大數(shù)據(jù)分析有很多的模型,今天我們給大家分享大數(shù)據(jù)分析線性回歸模型,我們?cè)趯W(xué)校學(xué)習(xí)了許多有趣且有用的概念,但有時(shí)我們?cè)诂F(xiàn)實(shí)生活中如何使用它們尚不十分清楚。
 

  線性回歸是一種可能被廣泛低估的概念/工具。
 

  (你可能還對(duì)一個(gè)相關(guān)主題感興趣:回歸與相關(guān))。
 

  假設(shè)你正計(jì)劃與兩個(gè)最好的朋友一起前往鄭州。你從北京出發(fā),大約要行駛9個(gè)小時(shí)。當(dāng)你的朋友負(fù)責(zé)聚會(huì)的運(yùn)作時(shí),你將負(fù)責(zé)所有的后勤工作。你必須計(jì)劃每個(gè)細(xì)節(jié):日程安排,何時(shí)停止以及在何處,確保按時(shí)到達(dá)……
 

  那么,你要做的第一件事是什么?你偷偷摸摸地從地球上消失了,不再接聽朋友的電話,因?yàn)楫?dāng)你成為派對(duì)警察時(shí),他們會(huì)很有趣嗎?不,你會(huì)得到一張白紙,然后開始計(jì)劃!
 

  你清單上的第一項(xiàng)?預(yù)算!這是9小時(shí)(約1200英里)的有趣旅程,因此在旅途中總共需要18小時(shí)。后續(xù)問題:我應(yīng)該為汽油分配多少錢?
 

  這是一個(gè)非常重要的問題。你不想在高速公路的中間停下來,可能只是因?yàn)槠陀帽M而走了幾英里!
 

  你應(yīng)該為汽油分配多少錢?
 

  你以科學(xué)為導(dǎo)向的思維方式來解決此問題,認(rèn)為必須有一種方法可以根據(jù)你旅行的距離估算所需的資金量。
 

  首先,你查看一些數(shù)據(jù)。
 

  去年,你一直在努力跟蹤自己的汽車效率-因?yàn)檎l沒有!—因此,你計(jì)算機(jī)中的某處有此電子表格

大數(shù)據(jù)分析線性回歸模型
 

  至此,這些只是數(shù)字。從此電子表格中獲取任何有價(jià)值的信息并非易事。

大數(shù)據(jù)分析線性回歸模型
 

  但是,像這樣繪制,很明顯,在不加油箱的情況下,你可以行駛多遠(yuǎn)。并不是說你還不知道,但是現(xiàn)在-有了數(shù)據(jù)-這很清楚。
 

  你真正想知道的是:如果我行駛1200英里,我將支付多少汽油費(fèi)?
 

  為了回答這個(gè)問題,你將使用到目前為止收集的數(shù)據(jù),并使用它來預(yù)測(cè)你將花費(fèi)多少。這個(gè)想法是,你可以根據(jù)過去的數(shù)據(jù)(你一直在努力記錄的數(shù)據(jù)點(diǎn))對(duì)未來(前往鄭州的旅程)做出估計(jì)的猜測(cè)。
 

  最后,你得到一個(gè)數(shù)學(xué)模型,該模型描述了行駛里程與填充油箱所花費(fèi)的資金之間的關(guān)系。
 

  定義該模型后,你可以為其提供新信息-從北京到鄭州要行駛多少英里-該模型將預(yù)測(cè)你需要多少錢。

大數(shù)據(jù)分析線性回歸模型
 

  該模型將使用過去的數(shù)據(jù)來了解行駛的總里程和支付的汽油總金額之間的關(guān)系。
 

  當(dāng)為它提供一個(gè)新的數(shù)據(jù)點(diǎn)時(shí),即你從北京到鄭州的行駛距離,該模型將利用從過去所有數(shù)據(jù)中獲得的知識(shí)并提供最佳的猜測(cè)-一個(gè)預(yù)測(cè),即你的數(shù)據(jù)點(diǎn)來自未來。
 

  回顧一下數(shù)據(jù),你通常會(huì)發(fā)現(xiàn),你在汽油上的花費(fèi)越多,則在空轉(zhuǎn)之前可以行駛的時(shí)間就越長(zhǎng)-假設(shè)汽油的價(jià)格保持不變。
 

  如果要最好地描述 ?(或“解釋”)上圖中的關(guān)系,則該關(guān)系應(yīng)如下所示:

大數(shù)據(jù)分析線性回歸模型
 

  顯然,行駛里程與總汽油支付之間存在線性關(guān)系。由于這種關(guān)系是線性的,因此,如果你花更少/更多的錢(例如,一半vs滿油),你將能夠行駛更少/更多的里程。
 

  而且由于這種關(guān)系是線性的,并且你知道從北京到鄭州的車程為多長(zhǎng)時(shí)間,因此使用線性模型將有助于你預(yù)測(cè)要為汽油預(yù)算的預(yù)算。
 

  線性回歸模型
 

  能夠最好地描述總行駛里程與汽油總支付量之間的關(guān)系的模型類型是線性回歸模型。之所以有“回歸”位,是因?yàn)槟阋A(yù)測(cè)的是一個(gè)數(shù)值。
 

  這里有一些概念需要分解:
 

  1)因變量

  2)自變量

  3)截距

  4)系數(shù)
 

  你必須為汽油預(yù)算的金額取決于你要從北京到鄭州的行駛里程數(shù)。因此,支付的天然氣總費(fèi)用是模型中的因變量。
 

  在另一方面,鄭州是不會(huì)去任何地方,你需要這么多少英里從北京到鄭州開車是獨(dú)立的,你在加油站支付的金額-的行駛里程是自變量的模型。讓我們暫時(shí)假設(shè)汽油價(jià)格保持不變。
 

  由于我們只處理一個(gè)自變量,因此可以將模型指定為:

大數(shù)據(jù)分析線性回歸模型
 

  這是線性組合的簡(jiǎn)單版本,其中只有一個(gè)變量。如果你想更嚴(yán)格地進(jìn)行計(jì)算,則還可以在此模型中將油桶的價(jià)格作為自變量添加,因?yàn)樗鼤?huì)影響天然氣的價(jià)格。

大數(shù)據(jù)分析線性回歸模型
 

  有了模型的所有必要部分后,剩下的唯一問題是:B0,B1和B2呢?
 

  B0(表示為“ Beta 0”)是模型的截距,意味著它是你的自變量在每個(gè)因變量等于零時(shí)所取的值。你可以將其可視化為一條穿過軸原點(diǎn)的直線。

大數(shù)據(jù)分析線性回歸模型
 

  線性模型的不同截距值:y = Beta0 + 2x
 

  “ Beta 1”和“ Beta 2”是被稱為系數(shù)。你的模型中每個(gè)自變量都有一個(gè)系數(shù)。它們確定你的回歸線(描述模型的線)的斜率。
 

  如果我們以上面的示例為例,該模型由y = Beta0 + Beta1x指定,并使用不同的Beta 1值,我們將得到類似

大數(shù)據(jù)分析線性回歸模型
 

  線性模型的不同系數(shù)值:y = 1 + Beta1x
 

  系數(shù)說明因變量的變化率,即你將要支付的費(fèi)用,因?yàn)槊總€(gè)自變量以一個(gè)單位變化。
 

  因此,在上述藍(lán)線的情況下,每當(dāng)自變量x改變單位時(shí),因數(shù)值y就會(huì)改變1倍。
 

  對(duì)于綠線,該影響是因變量x單位變化的4倍。
 

  普通最小二乘
 

  至此,我們已經(jīng)討論了線性模型,甚至嘗試對(duì)截距和系數(shù)插入不同的值。
 

  但是,要弄清楚你要去鄭州旅行時(shí)要支付多少汽油,我們需要一種機(jī)制來估算這些值。
 

  有多種估算模型參數(shù)的技術(shù)。最受歡迎的之一是普通最小二乘(OLS)。
 

  普通最小二乘法的前提是最小化模型殘差的平方和。數(shù)據(jù)集中的預(yù)測(cè)值和實(shí)際值之間的差異(思考距離)。
 

  這樣,模型將計(jì)算最佳參數(shù),以便回歸線中的每個(gè)點(diǎn)都盡可能靠近數(shù)據(jù)集。

大數(shù)據(jù)分析線性回歸模型
 

  在預(yù)算練習(xí)結(jié)束時(shí),有了模型參數(shù),你可以插入預(yù)計(jì)要行駛的總里程,并估算需要分配多少汽油。

大數(shù)據(jù)分析線性回歸模型
 

  太好了,現(xiàn)在你知道應(yīng)該為汽油預(yù)算114.5美元!
 

  你會(huì)注意到,我們的模型中沒有參數(shù)Beta0。在我們的用例中,截距-或因變量等于零時(shí)為常數(shù)是沒有意義的。為此特定型號(hào),我們強(qiáng)迫它經(jīng)過原點(diǎn),因?yàn)槿绻悴婚_車,你將不會(huì)花費(fèi)任何汽油費(fèi)用。
 

  下次你遇到需要根據(jù)直線描述的多種因素來估計(jì)數(shù)量的情況時(shí),你知道可以使用線性回歸模型。


 

預(yù)約申請(qǐng)免費(fèi)試聽課

填寫下面表單即可預(yù)約申請(qǐng)免費(fèi)試聽!怕錢不夠?可先就業(yè)掙錢后再付學(xué)費(fèi)! 怕學(xué)不會(huì)?助教全程陪讀,隨時(shí)解惑!擔(dān)心就業(yè)?一地學(xué)習(xí),可推薦就業(yè)!

?2007-2021/北京漫動(dòng)者教育科技有限公司版權(quán)所有
備案號(hào):京ICP備12034770號(hào)

?2007-2022/ 5wd995.cn 北京漫動(dòng)者數(shù)字科技有限公司 備案號(hào): 京ICP備12034770號(hào) 監(jiān)督電話:010-53672995 郵箱:bjaaa@aaaedu.cc

京公網(wǎng)安備 11010802035704號(hào)

網(wǎng)站地圖