大數(shù)據(jù)具有4V特性,即體量(大量)、速度(高速)、多樣性(多樣)、準(zhǔn)確性(精確),其核心在于對(duì)這些有意義的數(shù)據(jù)進(jìn)行專業(yè)化處理。比如,微碼鄧白氏通 過(guò)數(shù)據(jù)分析發(fā)現(xiàn),購(gòu)買產(chǎn)品A的用戶,80%也會(huì)同時(shí)購(gòu)買產(chǎn)品B,購(gòu)買周期在3個(gè)月左右,這樣每三個(gè)月就可以向購(gòu)買產(chǎn)品A的客戶推送信息。推送時(shí),會(huì)推送產(chǎn)品A的信息和產(chǎn)品b的信息。
大數(shù)據(jù)的顯著特點(diǎn)是數(shù)據(jù)量大。
大數(shù)據(jù)的明顯特征是數(shù)據(jù)規(guī)模巨大。隨著信息技術(shù)的發(fā)展和互聯(lián)網(wǎng)的不斷擴(kuò)大,每個(gè)人的生活都被記錄在大數(shù)據(jù)中,數(shù)據(jù)本身也呈現(xiàn)出爆炸式的增長(zhǎng)。其中大數(shù)據(jù)的計(jì)量單位逐漸發(fā)展起來(lái),現(xiàn)在大數(shù)據(jù)的計(jì)量已經(jīng)到了EB。
在大量互聯(lián)網(wǎng)用戶等因素的影響下,大數(shù)據(jù)的來(lái)源非常廣泛,因此大數(shù)據(jù)的類型也是多樣的。大數(shù)據(jù)按照因果關(guān)系的強(qiáng)弱可以分為三種,即結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),統(tǒng)稱為大數(shù)據(jù)。數(shù)據(jù)顯示,結(jié)構(gòu)化數(shù)據(jù)占整個(gè)大數(shù)據(jù)的75%,但能產(chǎn)生高價(jià)值的大數(shù)據(jù)是非結(jié)構(gòu)化數(shù)據(jù)。
大數(shù)據(jù)的所有價(jià)值在大數(shù)據(jù)的特征中占據(jù)核心地位,大數(shù)據(jù)的總量與其價(jià)值密度成反比關(guān)系。同時(shí),任何有價(jià)值的信息都是經(jīng)過(guò)海量基礎(chǔ)數(shù)據(jù)處理后提取出來(lái)的。在大數(shù)據(jù)蓬勃發(fā)展的今天,人們一直在探索如何提高計(jì)算機(jī)算法處理海量大數(shù)據(jù)、提取有價(jià)值信息的速度。
大數(shù)據(jù)的高速特性:
主要體現(xiàn)在數(shù)據(jù)的快速增長(zhǎng)和處理。與傳統(tǒng)媒體相比,在當(dāng)今的大數(shù)據(jù)時(shí)代,信息的生產(chǎn)和傳播方式發(fā)生了巨大的變化。在互聯(lián)網(wǎng)和云計(jì)算的影響下,大數(shù)據(jù)可以被快速生產(chǎn)和傳播。此外,由于信息的時(shí)效性,要求在處理大數(shù)據(jù)的過(guò)程中快速響應(yīng),無(wú)延遲地輸入和提取數(shù)據(jù)。