旗下產(chǎn)業(yè): A產(chǎn)業(yè)/?A實習/?A計劃
全國統(tǒng)一咨詢熱線:010-5367 2995
首頁 > 熱門文章 > 大數(shù)據(jù)分析 > 大數(shù)據(jù)分析學習策略

大數(shù)據(jù)分析學習策略

時間:2020-05-08來源:5wd995.cn點擊量:作者:Sissi
時間:2020-05-08點擊量:作者:Sissi



  大數(shù)據(jù)分析家的需求量很大。截至2020年,美國的大數(shù)據(jù)分析家的平均年收入超過113,000美元,舊金山的大數(shù)據(jù)分析家的年收入超過14萬美元。學習大數(shù)據(jù)分析,您將發(fā)現(xiàn)自己在這個有前途且得到了充分補償?shù)念I域中工作。

大數(shù)據(jù)分析
 

  但是,即使您對成為大數(shù)據(jù)分析家不感興趣,學習數(shù)據(jù)技能和提高數(shù)據(jù)素養(yǎng)也會在您當前的職業(yè)中帶來巨大的收益。幾乎任何行業(yè)都需要具備數(shù)據(jù)技能并可以幫助其公司成為更多數(shù)據(jù)驅(qū)動型員工。
 

  如何學習大數(shù)據(jù)分析
 

  那么,您如何開始學習大數(shù)據(jù)分析呢?從線性代數(shù)或統(tǒng)計學開始,對該問題的回答往往是一門很長的課程和一本必讀的書。幾年前,當我學習時,我自己經(jīng)歷了這一過程。我沒有編程背景,但是知道我想使用數(shù)據(jù)。
 

  我無法完全解釋在沒有任何上下文的情況下獲得大量資源會多么令人沮喪。這類似于老師遞給您一堆教科書并說“閱讀所有這些內(nèi)容”。在學校的時候,我為這種方法而苦苦掙扎。如果我已經(jīng)開始以這種方式學習大數(shù)據(jù)分析,我將永遠不會繼續(xù)前進。
 

  有些人通過閱讀一本書會學到最好的東西,但是我通過構建和嘗試東西可以學到最好的東西。當我有動力時,我就會學習,當我知道為什么要學習一些東西時,我就會學習。通過多年來與新學習者的交談,我知道許多其他學習者也有同樣的感覺。這背后也有一些科學。研究表明,大多數(shù)人通過做事學到最好的東西。
 

  另外,這種方法還有另一個很大的優(yōu)勢。當您以這種方式學習時,您會立即獲得有用的技能。
 

  這就是為什么我認為您的首要目標不應是學習線性代數(shù)或統(tǒng)計學。如果您想學習大數(shù)據(jù)分析或只是學習一些大數(shù)據(jù)分析技能,那么您的首要目標應該是學習熱愛數(shù)據(jù)。有興趣了解如何?繼續(xù)閱讀以了解如何實際學習大數(shù)據(jù)分析。
 

大數(shù)據(jù)分析
 

一、學會愛數(shù)據(jù)
 

  沒有人談論學習動機。大數(shù)據(jù)分析是一個廣闊而模糊的領域,這使得它很難學習。真的很難。沒有動力,您最終會中途停下來,并認為自己做不到。發(fā)生這種情況時,問題不在于您,而在于教學。
 

  即使在午夜時分,公式開始變得模糊,您仍需要能夠激發(fā)您繼續(xù)學習的東西,并且您想知道神經(jīng)網(wǎng)絡是否會有意義。
 

  您需要一些可以幫助您找到統(tǒng)計量,線性代數(shù)和神經(jīng)網(wǎng)絡之間聯(lián)系的東西。某些事情將使您無法應對“接下來我要學什么?” 題。你需要動力。不是以鼓舞人心的報價形式,而是以激情項目的形式,您可以用來推動學習。
 

  我進入大數(shù)據(jù)分析的切入點是預測股市,盡管當時我還不知道。我編寫的用來預測股市的第一個程序幾乎沒有統(tǒng)計數(shù)據(jù)。但是我知道他們的表現(xiàn)不佳,所以我日以繼夜地努力使他們變得更好。
 

  我癡迷于提高程序的性能。我沉迷于股市。那是我的動力。
 

  當我工作時,我正在學習熱愛數(shù)據(jù)。因為我正在學習熱愛數(shù)據(jù),所以我有動力學習任何我需要的東西,以使我的程序變得更好。
 

  我知道,并不是每個人都著迷于預測股市。但重要的是要找到能讓您學習的東西。
 

  它可以找出有關您的城市的新奇有趣的事物,映射互聯(lián)網(wǎng)上的所有設備,查找NBA球員所扮演的真實位置,按年份映射難民等。有關大數(shù)據(jù)分析的偉大的事情是,有真正無限的有趣的事情去努力。這完全是提出問題并找到獲得答案的方法,您可以提出任何想要的問題。
 

  通過根據(jù)您的需求量身定制學習來控制您的學習,而不是相反。

 

AAA教育
 

二、通過學習來學習大數(shù)據(jù)分析
 

  了解機器學習,神經(jīng)網(wǎng)絡,圖像識別和其他前沿技術非常重要。但是大多數(shù)大數(shù)據(jù)分析都不涉及其中任何一個。作為工作大數(shù)據(jù)分析家:
 

  a.您90%的工作將用于數(shù)據(jù)清理。

  b.真正了解一些算法比了解一些算法要好。如果您很好地了解線性回歸,k均值聚類和邏輯回歸,可以解釋和解釋它們的結果,并且實際上可以從頭到尾完成一個項目,那么與您知道每種算法相比,您的就業(yè)能力將大大提高。,但不能使用它們。

  c.大多數(shù)時候,當您使用算法時,它將是庫中的一個版本。您很少會編寫自己的SVM實現(xiàn)代碼-花費的時間太長。
 

  所有這些意味著,最好的學習方法是從事項目。通過從事項目工作,您將獲得立即可用和有用的技能,因為現(xiàn)實世界中的大數(shù)據(jù)分析家必須從頭到尾地查看大數(shù)據(jù)分析項目,并且大多數(shù)工作都在清理和管理數(shù)據(jù)等基礎知識上。
 

  那么如何找到一個好的項目呢?啟動項目的一種技術是找到所需的數(shù)據(jù)集。嘗試回答一個有趣的問題。沖洗并重復。
 

  這里是一些尋找免費數(shù)據(jù)集的好地方,可以幫助您入門:
 

  a.19個查找免費數(shù)據(jù)集的地方

  b.數(shù)據(jù)集subreddit

  c.UCI機器學習存儲庫
 

  另一種技術(這是我的技術)是發(fā)現(xiàn)一個深層次的問題,預測股市,可以分解為小步驟。我首先連接到Yahoo Finance API,然后提取了每日價格數(shù)據(jù)。然后,我創(chuàng)建了一些指標,例如過去幾天的平均價格,并用它們來預測未來(此處沒有真正的算法,僅是技術分析)。效果不是很好,所以我學習了一些統(tǒng)計數(shù)據(jù),然后使用了線性回歸。然后,我連接到另一個API,逐分鐘收集數(shù)據(jù),并將其存儲在SQL數(shù)據(jù)庫中。依此類推,直到算法運行良好。
 

  很棒的是我有學習的背景。我不僅學習了抽象的SQL語法。我用它來存儲價格數(shù)據(jù),因此僅學習語法就可以學習到10倍的數(shù)據(jù)。沒有應用的學習很容易忘記。更重要的是,如果您沒有積極地運用所學知識,那么您的學習將無法使您做好實際的大數(shù)據(jù)分析工作的準備。

大數(shù)據(jù)分析




三、學習交流見解
 

  大數(shù)據(jù)分析家經(jīng)常需要向其他人展示他們的分析結果。做得好,這可能是一名優(yōu)秀的大數(shù)據(jù)分析家與一名出色的大數(shù)據(jù)分析家之間的區(qū)別。如果您可以說服公司中的其他人對發(fā)現(xiàn)的內(nèi)容采取行動,那么數(shù)據(jù)分析通常僅在業(yè)務環(huán)境中有價值,這意味著學習通信數(shù)據(jù)。
 

  交流見解的一部分是理解主題和理論-您將永遠無法向他人解釋您不了解自己的東西。另一部分是了解如何清楚地組織結果。最后一步是能夠清楚地解釋您的分析。
 

  很難有效地交流復雜的概念,但是您應該嘗試以下一些操作:
 

  a.創(chuàng)建一個博客。發(fā)布數(shù)據(jù)分析的結果?;蛱岢鼋ㄗh并為Dataquest的博客撰寫文章!

  b.嘗試向不那么精通技術的朋友和家人傳授有關大數(shù)據(jù)分析概念的知識。令人驚訝的是,有多少教學可以幫助您理解概念。

  c.嘗試在聚會上講話。

  d.使用GitHub托管和共享您的所有分析。

  e.積極參與Quora,Dataquest學習社區(qū)和機器學習subreddit等社區(qū)。

  4.向同齡人學習
 

  與他人合作可以學到多少,真是太神奇了。在大數(shù)據(jù)分析中,團隊合作在工作環(huán)境中也非常重要。大數(shù)據(jù)分析家通常是團隊的一部分,而規(guī)模較小的公司中的孤獨大數(shù)據(jù)分析家通常會與公司中的其他團隊一起解決特定的問題。大數(shù)據(jù)分析家在為公司不同部門回答數(shù)據(jù)問題時會在團隊之間移動是不尋常的,因此對于大數(shù)據(jù)分析家而言,能夠進行協(xié)作可能比幾乎任何其他人都更為重要!
 

  這里的一些想法:
 

  a.在聚會上找人一起工作。

  b.貢獻開源軟件包。

  c.向?qū)懹腥さ臄?shù)據(jù)分析博客的人發(fā)送消息,以查看您是否可以協(xié)作。

  d.試用機器學習競賽網(wǎng)站Kaggle,看看是否可以找到隊友。

  5.不斷提高難度
 

  您對正在進行的項目完全滿意嗎?您是一周前最后一次使用新概念嗎?現(xiàn)在是時候去做更困難的事情了。大數(shù)據(jù)分析是要爬的陡峭山峰,而且很容易停止攀爬。但是,當然,如果您停止攀爬,就永遠無法登頂!
 

  如果您覺得自己不太習慣,這里有一些想法可能會增加幾乎所有大數(shù)據(jù)分析項目的復雜性和挑戰(zhàn)性。嘗試將其中一項或多項添加到您的計劃中,以使自己脫離舒適區(qū):
 

  a.處理更大的數(shù)據(jù)集。學習使用火花。

  b.看看是否可以使算法更快。

  c.您如何將算法擴展到多個處理器?你可以做到嗎?

  d.了解您正在使用的算法的理論。這會改變您的假設嗎?

  e.嘗試教一個新手去做與現(xiàn)在相同的事情。
 

  最后一個挑戰(zhàn)確實是一個被低估的挑戰(zhàn),如果您嘗試一下,您將很快看到對于試圖學習的人來說,有價值的教學是多么有價值。與以往相比,您可能會從體驗中獲得對主題的更深刻的理解,并且您還將提高溝通和解釋能力。
 

  您需要大數(shù)據(jù)分析證書嗎?
 

  在履歷表上取得認證不會幫助您找到工作。對雇主來說重要的是您擁有的技能。證書本身不會告訴雇主有關您的技能的任何信息。它只是告訴他們您學習了一個主題。
 

  但是,如果證書計劃可以有效地教您所需的技能,它們?nèi)匀粫哂胁豢伤甲h的價值。
 

  提供認證的程序和平臺仍然可以是一筆巨大的投資,但是請務必記住,它們的價值在于可以教給您的技能。
 

  當雇主查看您的簡歷時,他們將查看您的技能,項目組合以及相關經(jīng)驗。證書不太可能影響他們的決定,因此請專注于獲得合適的技能并建立出色的項目。
 

  這是有關大數(shù)據(jù)分析證書以及是否需要證書的更多信息。
 

  您需要大數(shù)據(jù)分析學位嗎?
 

  在簡歷上擁有大數(shù)據(jù)分析學位可能會幫助您找到工作。然而,得到一個通常要花費數(shù)年,并且花費數(shù)萬美元甚至數(shù)十萬美元。
 

  大學也可能會受制于機構的慣性和適應的緩慢,因此您可能會浪費時間去研究在當前商業(yè)環(huán)境中不相關的舊技術。
 

  值得慶幸的是,有很多例子,他們都是靠自己成功地學習了大數(shù)據(jù)分析,并且在不需要專門學位的情況下就達到了行業(yè)的高水平。
 

  例如,在啟動Dataquest之前,我本人曾在EdX擔任機器學習工程師。但是我沒有大數(shù)據(jù)分析或機器學習的學位。我自學了那些技能。
 

  我們的Dataquest學習者故事還包含學習者的示例,這些學習者在編程領域零背景且沒有大數(shù)據(jù)分析學位的情況下獲得了行業(yè)工作。我們的2020年調(diào)查涵蓋了數(shù)百名無需獲得學位即可達到其大數(shù)據(jù)分析學習目標的受訪者。
 

  如果您有足夠的時間和金錢來獲得大數(shù)據(jù)分析的大學學位,那么將其添加到簡歷中絕對可以為您提供幫助。但它很可能學習所有的必要的技能,更快,很多更經(jīng)濟。只要您具備相關技能,就沒有大數(shù)據(jù)分析學位也不會傷害您的就業(yè)市場。
 

  大數(shù)據(jù)分析家需要什么技能才能成功?
 

大數(shù)據(jù)分析
 

  屬于“大數(shù)據(jù)分析”的技能列表非常多!您可能已經(jīng)在網(wǎng)絡上的某處看到了這個令人生畏的圖像:
 

  但是不用擔心,您不需要學習所有這些知識!
 

  根據(jù)職位發(fā)布和大數(shù)據(jù)分析家報告的工作成果,最基本的大數(shù)據(jù)分析技能是:
 

  a.使用Python或R編程(都可以)
 

  b.流利的流行軟件包和工作流以您選擇的語言進行大數(shù)據(jù)分析任務。例如,如果您選擇Python,則應該熟悉pandas,NumPy,matplotlib或Plotly之類的庫以及scikit-learn,并且應該熟悉使用它們進行數(shù)據(jù)的清理,分析和可視化的工作。

  c.編寫SQL查詢

  d.統(tǒng)計知識與方法

  e.基本的機器學習和建模技能

  f.工作流程和協(xié)作技能(Git,命令行/ bash等)
 

  如果您可以將這些基礎知識添加到您的技能組合中,那么您將很容易獲得第一份大數(shù)據(jù)分析工作。有關這些的更多信息,您可以查看我們的大數(shù)據(jù)分析家學習路徑,該路徑旨在為Python學習者教授所有重要的大數(shù)據(jù)分析技能。
 

  在這里,您可以根據(jù)自己的興趣更深入地研究自然語言處理,圖像分類,深度學習等專業(yè),以及各種其他選項。
 

  底線
 

  本文并不是要確切說明要做什么。而是將其視為在您自己的道路上學習大數(shù)據(jù)分析時要遵循的粗略準則。如果您將所有這些事情都做好,就會發(fā)現(xiàn)您自然在發(fā)展大數(shù)據(jù)分析專業(yè)知識。但是不要被他們束縛!如果您找到了一種可以保持動力和學習的不同方法,請毫不猶豫地將其納入您的長期計劃中。
 

  我通常不喜歡“這里有很多東西”的方法,因為這種方法很難弄清楚下一步該怎么做。我已經(jīng)看到很多人在面對大量教科書和MOOC時放棄學習。
 

  我個人認為,任何人只要以正確的心態(tài)來處理大數(shù)據(jù)分析,就可以學習大數(shù)據(jù)分析。
 

  我還是Dataquest的創(chuàng)始人,該網(wǎng)站可幫助您在瀏覽器中學習大數(shù)據(jù)分析。它封裝了本文中討論的許多思想,以創(chuàng)造更好的學習體驗。您可以通過分析有趣的數(shù)據(jù)集(例如CIA文件和NBA球員數(shù)據(jù))來學習。在完成我們的課程時,您還將完成項目并建立項目組合。
 

  如果您不知道如何編碼,請不要擔心 -我們從頭開始教Python和R,不需要任何經(jīng)驗!我們教Python和R是因為它們是適合初學者的語言,并且它們是現(xiàn)實世界大數(shù)據(jù)分析中使用最廣泛的語言。

大數(shù)據(jù)分析




 

預約申請免費試聽課

填寫下面表單即可預約申請免費試聽!怕錢不夠?可先就業(yè)掙錢后再付學費! 怕學不會?助教全程陪讀,隨時解惑!擔心就業(yè)?一地學習,可推薦就業(yè)!

?2007-2021/北京漫動者教育科技有限公司版權所有
備案號:京ICP備12034770號

?2007-2022/ 5wd995.cn 北京漫動者數(shù)字科技有限公司 備案號: 京ICP備12034770號 監(jiān)督電話:010-53672995 郵箱:bjaaa@aaaedu.cc

京公網(wǎng)安備 11010802035704號

網(wǎng)站地圖