隨著云時代的來臨,大數(shù)據(jù)(big data)也吸引了越來越多的關(guān)注。那么,大數(shù)據(jù)究竟是什么呢?它的定義、結(jié)構(gòu)、特點是什么呢?它又能應(yīng)用在哪些方面呢?相信通過這篇文章你可以對大數(shù)據(jù)有一個全新全面的認識。
一、關(guān)于定義
大數(shù)據(jù)(big data),指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。
二、關(guān)于特點
國際商業(yè)機器公司(簡稱:IBM)提出了大數(shù)據(jù)的5V特點,即:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。
三、關(guān)于結(jié)構(gòu)
大數(shù)據(jù)包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)越來越成為數(shù)據(jù)的主要部分。據(jù)IDC的調(diào)查報告顯示:企業(yè)中80%的數(shù)據(jù)都是非結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)每年都按指數(shù)增長60%。
想要系統(tǒng)的認知大數(shù)據(jù),必須要全面而細致的分解它,著手從三個層面來展開:
第一層面是理論,理論是認知的必經(jīng)途徑,也是被廣泛認同和傳播的基線。在這里從大數(shù)據(jù)的特征定義理解行業(yè)對大數(shù)據(jù)的整體描繪和定性;從對大數(shù)據(jù)價值的探討來深入解析大數(shù)據(jù)的珍貴所在;洞悉大數(shù)據(jù)的發(fā)展趨勢;從大數(shù)據(jù)隱私這個特別而重要的視角審視人和數(shù)據(jù)之間的長久博弈。
第二層面是技術(shù),技術(shù)是大數(shù)據(jù)價值體現(xiàn)的手段和前進的基石。在這里分別從云計算、分布式處理技術(shù)、存儲技術(shù)和感知技術(shù)的發(fā)展來說明大數(shù)據(jù)從采集、處理、存儲到形成結(jié)果的整個過程。
第三層面是實踐,實踐是大數(shù)據(jù)的最終價值體現(xiàn)。在這里分別從互聯(lián)網(wǎng)的大數(shù)據(jù),政府的大數(shù)據(jù),企業(yè)的大數(shù)據(jù)和個人的大數(shù)據(jù)四個方面來描繪大數(shù)據(jù)已經(jīng)展現(xiàn)的美好景象及即將實現(xiàn)的藍圖。
四、它的應(yīng)用
1.洛杉磯警察局和加利福尼亞大學合作利用大數(shù)據(jù)預測犯罪的發(fā)生。
2.google流感趨勢(Google Flu Trends)利用搜關(guān)鍵詞預測禽流感的散布。
3..統(tǒng)計學家內(nèi)特.西爾弗(Nate Silver)利用大數(shù)據(jù)預測2012美國選舉結(jié)果。
4..麻省理工學院利用手機定位數(shù)據(jù)和交通數(shù)據(jù)建立城市規(guī)劃。
5.梅西百貨的實時定價機制。根據(jù)需求和庫存的情況,該公司基于SAS的系統(tǒng)對多達7300萬種貨品進行實時調(diào)價。
6.醫(yī)療行業(yè)早就遇到了海量數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的挑戰(zhàn),而近年來很多國家都在積極推進醫(yī)療信息化發(fā)展,這使得很多醫(yī)療機構(gòu)有資金來做大數(shù)據(jù)分析。
通過以上幾個方面說明:現(xiàn)在已經(jīng)迎來了大數(shù)據(jù)時代。因此大數(shù)據(jù)開發(fā)成為各企業(yè)非常看重的一部分,對這方面的人才需求也逐漸增多。那么,如何在眾多競爭對手中脫穎而出呢?華清遠見大數(shù)據(jù)課程給了你答案。
華清遠見大數(shù)據(jù)項目
大數(shù)據(jù)開發(fā),我只認準華清遠見,心動就來報名吧!