繼物聯網、云計算之后,“大數據”已迅速成為近期市場爭相傳誦的熱門科技概念。根據維基百科的定義,大數據是指無法在可承受的時間范圍內用常規軟件工具進行捕捉、管理、處理的數據集合。從產業角度,常常把這些數據與采集它們的工具、平臺、分析系統一起被稱為 “大數據” 。
IDC認為,某項技術要想成為大數據技術,必須滿足IBM所描述的三個 “V”:多樣性(variety)、大容量(volume)和時效性高(velocity)。多樣性是指數據應包含結構化的和非結構化的數據;大容量是指聚合在一起供分析的數據量必須是非常龐大的;時效性高則是指數據處理的速度必須很快。
在2011年,“大數據”的概念已經賺足了人氣,IDC數字宇宙在今年6月的報告顯示,全球數據量在2011年已達到1.8ZB,在過去5年里增加了5倍,而到2015年將達到近8ZB。
2010年以來,全球IT巨頭紛紛通過收購大數據相關廠商來實現技術整合,亦可見其對大數據的重視。其中最大的要數2011年8月惠普宣布的以103億美元收購英國非結構化信息處理軟件公司Autonomy,包括IBM、EMC、Teradata等公司也相繼進行了數億至幾十億美元的收購。

Hadoop被認為是應對大數據難題的利器
盡管限于產業鏈位置等原因,國內企業在大數據上的布局尚無法如此全面。但大規模數據處理的代表技術Hadoop被很多中國最大互聯網公司所追捧,百度的搜索日志分析,騰訊、淘寶和支付寶的數據倉庫都可以看到 Hadoop的身影。而Hadoop也被認為是應對大數據難題的利器。
展望2012年,大數據不會放緩增長的腳步,全球IT巨頭通常也會走在技術發展的前沿方向。大數據的廣闊市場空間,已吸引了眾多全球IT巨頭的青睞,包括惠普、IBM、微軟、Oracle、SAP、Teradata都先后發布了重量級產品來應對大數據的挑戰,幾這些巨頭幾乎囊括了所有的服務器、數據庫、存儲設備、企業解決方案的主要提供商,足見大數據技術已成為各大IT巨頭爭奪的下一個制高點。