作者:張千帆
大數(shù)據(jù)產(chǎn)業(yè)是基于當(dāng)前社會互聯(lián)網(wǎng)發(fā)展中暴漲的數(shù)據(jù)所衍生出的新興行業(yè)。數(shù)據(jù)是比語言文字更精確的描述事物本質(zhì)的工具。數(shù)據(jù)時代人類的所有記錄,無論是機構(gòu)化的文字、文檔還是非結(jié)構(gòu)化的圖片、音頻、視頻,都是以數(shù)據(jù)的形式存在。
而大數(shù)據(jù)是計算機和網(wǎng)絡(luò)科學(xué)行業(yè)內(nèi)的術(shù)語,從原有的技術(shù)語義上理解指的是巨量數(shù)據(jù)集合。而根據(jù)Wikipedia的定義“大數(shù)據(jù)是值在無可承受的時間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉管理和處理的數(shù)據(jù)集合”。在維克托(2012)撰寫的《大數(shù)據(jù)時代》中指明大數(shù)據(jù)是一種數(shù)據(jù)處理的方式,它與其他傳統(tǒng)方式的不同之處是采用所有數(shù)據(jù)來做分析而不是采用隨機分析法(抽樣調(diào)查)。而研究機構(gòu)Gartner定義大數(shù)據(jù)是:“需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)”。從以上定義來看大數(shù)據(jù)的定義包涵了兩個方面:第一是基于數(shù)據(jù)的本身和特點,在互聯(lián)網(wǎng)社會中數(shù)據(jù)作為一種新的信息資產(chǎn)它自身擁有4V特性--:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值);第二是對海量數(shù)據(jù)的處理和挖掘產(chǎn)生的價值,對海量數(shù)據(jù)本體來說它若未被挖掘處理形成價值,則不具有影響力;而通過數(shù)據(jù)的采集、存儲,傳輸,處理、挖掘,則能提取出數(shù)據(jù)中潛在的知識和有價值的信息。而這個處理的過程和能力才是人們談?wù)摯髷?shù)據(jù)的真正意義。而相比西方研究者強調(diào)的預(yù)測是大數(shù)據(jù)的核心,當(dāng)前的大數(shù)據(jù)則成為一種思考和行為模式,國內(nèi)客戶觀念上的轉(zhuǎn)變遠(yuǎn)比技術(shù)手段的影響要更深遠(yuǎn)。
報告全文請點擊PDF在線閱讀: