一談到大數(shù)據(jù)技術(shù),很多人首先想到的是數(shù)學(xué),我覺得是因?yàn)閿?shù)字在數(shù)學(xué)體系中穩(wěn)固的位置吧,而大數(shù)據(jù)技術(shù)也和數(shù)學(xué)緊緊地結(jié)合在一起。今天千鋒互聯(lián)向大家介紹大數(shù)據(jù)中的數(shù)學(xué)基礎(chǔ)知識(shí)。
1.概率論與數(shù)理統(tǒng)計(jì):
這部分與大數(shù)據(jù)技術(shù)開發(fā)的關(guān)系非常密切,條件概率、獨(dú)立性等基本概念、隨機(jī)變量及其分布、多維隨機(jī)變量及其分布、方差分析及回歸分析、隨機(jī)過程(特別是Markov)、參數(shù)估計(jì)、Bayes理論等在大數(shù)據(jù)建模、挖掘中就很重要。大數(shù)據(jù)具有天然的高維特征,在高維空間中進(jìn)行數(shù)據(jù)模型的設(shè)計(jì)分析就需要一定的多維隨機(jī)變量及其分布方面的基礎(chǔ)。Bayes定理更是分類器構(gòu)建的基礎(chǔ)之一。除了這些這些基礎(chǔ)知識(shí)外,條件隨機(jī)場(chǎng)CRF、隱Markov模型、n-gram等在大數(shù)據(jù)分析中可用于對(duì)詞匯、文本的分析,可以用于構(gòu)建預(yù)測(cè)分類模型。
當(dāng)然以概率論為基礎(chǔ)的信息論在大數(shù)據(jù)分析中也有一定作用,比如信息增益、互信息等用于特征分析的方法都是信息論里面的概念。
2.線性代數(shù):
這部分的數(shù)學(xué)知識(shí)與大數(shù)據(jù)技術(shù)開發(fā)的關(guān)系也很密切,矩陣、轉(zhuǎn)置、秩塊矩陣、向量、正交矩陣、向量空間、特征值與特征向量等在大數(shù)據(jù)建模、分析中也是常用的技術(shù)手段。
在互聯(lián)網(wǎng)大數(shù)據(jù)中,許多應(yīng)用場(chǎng)景的分析對(duì)象都可以抽象成為矩陣表示,大量Web頁(yè)面及其關(guān)系、微博用戶及其關(guān)系、文本集中文本與詞匯的關(guān)系等等都可以用矩陣表示。以矩陣為基礎(chǔ)的各種運(yùn)算,如矩陣分解則是分析對(duì)象特征提取的途徑,因?yàn)榫仃嚧砹四撤N變換或映射,因此分解后得到的矩陣就代表了分析對(duì)象在新空間中的一些新特征。所以,奇異值分解SVD、PCA、NMF、MF等在大數(shù)據(jù)分析中的應(yīng)用是很廣泛的。
3.優(yōu)化方法:
模型學(xué)習(xí)訓(xùn)練是很多分析挖掘模型用于求解參數(shù)的途徑,基本問題是:給定一個(gè)函數(shù)f:A→R,尋找一個(gè)元素a0∈A,使得對(duì)于所有A中的a,f(a0)≤f(a)(zui小化);或者f(a0)≥f(a)(zui大化)。優(yōu)化方法取決于函數(shù)的形式,從目前看,優(yōu)化方法通常是基于微分、導(dǎo)數(shù)的方法,例如梯度下降、爬山法、zui小二乘法、共軛分布法等。
4.離散數(shù)學(xué):
它是所有計(jì)算機(jī)科學(xué)分支的基礎(chǔ),自然也是大數(shù)據(jù)技術(shù)的重要基礎(chǔ)。
由于經(jīng)濟(jì)增長(zhǎng)有限,國(guó)家在未來10年甚至更長(zhǎng)的時(shí)間內(nèi),一個(gè)新的經(jīng)濟(jì)增長(zhǎng)點(diǎn)是來自于科技的增長(zhǎng)、創(chuàng)新創(chuàng)業(yè)的一些增長(zhǎng),以科技創(chuàng)新為主導(dǎo)的增長(zhǎng),一定離不開人才的培養(yǎng),企業(yè)有大量的資金投入到這些創(chuàng)新創(chuàng)業(yè)的領(lǐng)域,同樣也會(huì)需要大量的人才去做這樣的工作,那么這些人才就是我們今天講到的IT人才或DT人才,這是千鋒培訓(xùn)的主戰(zhàn)場(chǎng)。那么為什么要選擇千鋒大數(shù)據(jù)開發(fā)培訓(xùn)呢?
千鋒面向的是全棧式人才培養(yǎng),不只是教你大數(shù)據(jù)基礎(chǔ),因?yàn)榇髷?shù)據(jù)技術(shù)是需要有一定的技術(shù)基礎(chǔ)的,你必須要在學(xué)完傳統(tǒng)的IT開發(fā)技術(shù)之上,我們?cè)偃?duì)IT系統(tǒng)進(jìn)行一些改造和升級(jí),來做一些大數(shù)據(jù)的開發(fā)。 所以千鋒的核心優(yōu)勢(shì)就是基于6年中積累的成熟的IT技術(shù)基礎(chǔ)的課程產(chǎn)品,這些IT技術(shù)基礎(chǔ)的課程產(chǎn)品里面,千鋒培養(yǎng)出的學(xué)員既參加了基礎(chǔ)的培訓(xùn),又參加了大數(shù)據(jù)課程的培訓(xùn),是一個(gè)全棧式的人才培養(yǎng),而不是基于一點(diǎn)的人才培訓(xùn)。
關(guān)于大數(shù)據(jù)培訓(xùn),千鋒互聯(lián)是專業(yè)的!>> http://kaoshi.china.com/xuexiao/bjqf/
課程咨詢
咨詢老師:金老師
咨詢電話:010-64707530 / 15110074071
相關(guān)推薦
北京大數(shù)據(jù)開發(fā)培訓(xùn)機(jī)構(gòu)
“SQL 2014”管理與性能調(diào)優(yōu)實(shí)踐班
北京大數(shù)據(jù)云計(jì)算開發(fā)培優(yōu)班