當人們還在置疑大數(shù)據(jù)的空穴來風時,沃爾瑪?shù)慕?jīng)典營銷案例“啤酒與尿布”已經(jīng)在業(yè)內廣為流傳。當人們還在置疑大數(shù)據(jù)的行業(yè)應用時,以互聯(lián)網(wǎng)為代表的電商行業(yè)已經(jīng)在利用大數(shù)據(jù)進行掘金。國金證券TMT行業(yè)分析師趙國棟表示,傳統(tǒng)企業(yè)在大數(shù)據(jù)的應用上確實沒有電商有先知先覺,因為電商的主要資產就是數(shù)據(jù),有消費者的行為記錄,能夠快速了解消費者的需求。
大數(shù)據(jù)在電商的三種應用方式
“用戶好不容易來了,死活也不能讓他走”,這是所有電商的愿望,如何快速準確的吸引用戶找到想要的商品;如何加大商品的有效曝光;如何滿足用戶的需求,推薦其偏好的商品;如何提高用戶的活躍度,降低用戶的棄單率,這些都是令電商一直很頭疼的問題。
亞馬遜通過自己研發(fā)的精準推薦系統(tǒng)每秒賣出的商品達72.9件,如此誘人的數(shù)字,令國內很多電商企業(yè)饞涎不已。亞馬遜的經(jīng)驗有一個很奇怪的名字叫“鬼打墻式的推薦”,就是一路跟著你,所有瀏覽行為幾乎都看得到。
所有電商都在學習亞馬遜的經(jīng)驗,目前在電商中常用的推薦方式有1.買了還買2.看了還看3.瀏覽后買的4.對其它相關的感興趣5.個性化郵件,據(jù)蘭繆內衣技術總監(jiān)田旭介紹,目前這些方式基本能滿足需求,相關推薦主要集中在商品頁和購物車頁面。

據(jù)蘭繆內衣技術總監(jiān)田旭介紹,在Apache推出Hadoop之后,才開始有“推薦引擎”這種服務,之前只是谷歌、亞馬遜有自己的一套東西。
推薦引擎是電商在大數(shù)據(jù)應用的一個主要方式,基于用戶在網(wǎng)站上的瀏覽行為,對用戶進行分門別類,有哪些用戶購買了哪些商品,有哪些用戶瀏覽了哪些商品,根據(jù)這些瀏覽、購買、評價行為為不同的用戶推薦不同的商品。
智能郵件推送也是常用的一個方式,針對某個人的瀏覽行為推送一款產品。根據(jù)你的瀏覽和搜索記錄,即使你沒有產生購買行為,最終會把可能是你要買的產品發(fā)到你的郵箱。據(jù)田旭介紹,亞馬遜在這方面做的更極致,,一般的直郵發(fā)一百萬份,每一個都一樣,但亞馬遜是每一個人都不一樣,他們會把單獨一件商品直接發(fā)郵件推薦給用戶,這個人看到馬上崩潰了,立馬就買了。
商品預測是亞馬遜獨有的一種方式。在新產品上線后,經(jīng)過前5天的交易記錄,就能得出一個分析結果,這個商品多長時間能賣完,是正常商品、熱銷的還是滯銷的。如果商品沒達到相應的標準,亞馬遜可以根據(jù)和商家簽訂的退貨協(xié)議,把剩余的商品全部退還商家。田旭說到,這個目前在國內還沒有人能做到如此,這也是亞馬遜能立于不敗之地的原因。
電商的大數(shù)據(jù)作為
在大數(shù)據(jù)推動的商業(yè)革命暗涌中,要么學會使用大數(shù)據(jù)的杠桿創(chuàng)造商業(yè)價值,要么被大數(shù)據(jù)驅動的新生代商業(yè)格局淘汰。這是天賜良機,更是生死之戰(zhàn)。目前大部分電商都有自己的“大數(shù)據(jù)”策略,在愈演愈烈的市場競爭上占取更有利的地位。
據(jù)知意圖產品經(jīng)理魏平介紹,在國內做得不錯的有淘寶、京東這樣的公司,他們有足夠的資金和能力去自行研發(fā),但是對于大部分電商企業(yè)來說自行研發(fā)消耗的成本巨大,中小型電商企業(yè)考慮其它的方式,自行研發(fā)是沒必要的。
蘭繆內衣技術總監(jiān)田旭告訴記者,目前大數(shù)據(jù)在國內只有一種產品就是推薦引擎,從技術架構分為兩種,一是廠商提供一體機的集成方案直接安裝到本地的機房,如果數(shù)據(jù)量增大,可以直接加服務器,廠商會提供相應的監(jiān)控和其它服務。二是云服務分析,用戶只需要把服務廠商提供代碼嵌入到網(wǎng)站上即可,進行分析之后,會有相應結果反饋回來。對于會不會擔憂有數(shù)據(jù)的安全性的問題,田旭表示肯定是會擔心,也需要未來在相關法律和法規(guī)的完善。此外,還有一個好處,采用這種分析方式,還會抓取同類網(wǎng)站上的數(shù)據(jù),通過比對分析,得出相應的推薦結果。田旭說到,“采用大數(shù)據(jù)技術,可以提高轉化率,一般可以在原有轉換率的基礎上提高15%,比如你現(xiàn)在的轉換率是2% ,在使用推薦引擎以后會提高到2.3%。”
淘寶“云梯”計劃
淘寶無論在人才、技術方面都有強大的實力,目前已經(jīng)擁有國內最大的Hadoop集群,采用x86服務器,存儲容量50PB。這個集群還有一個很好聽的名字“云梯”,短短四年時間,已經(jīng)由300臺擴張到近2900臺規(guī)模。

淘寶還根據(jù)自身的業(yè)務需求,開發(fā)了自己的Hadoop分支——ADFS。主要解決HDFS NameNode在設計上存在單點故障、內存瓶頸,以及集群重啟時間過長,期間無法對集群進行寫操作等問題。
阿里集團技術共享平臺核心系統(tǒng)研發(fā)部海量數(shù)據(jù)技術專家羅李認為,在Hadoop技術的使用上,還是應該從業(yè)務解決出發(fā),有海量數(shù)據(jù)需要處理,并且計算模型并不太復雜,對數(shù)據(jù)進行處理的過程可以分成一個個小的步驟去完成,就可以嘗試Hadoop 技術。
京東“電商云“布局
京東商城目前正在構建一個“電商云”,用云計算給大數(shù)據(jù)提供一個開放式的、分布式的計算的技術支撐。據(jù)京東商城副總裁李曦介紹在分析和建模都投入了大量的力理,如何把分析結果快速的通過報表工具展現(xiàn),如何為數(shù)據(jù)進行實時的建模,比如用戶買了一段奶粉,當她再買的時候,仍會推薦一段奶粉,而不是二段、三段的奶粉。
京東商城數(shù)據(jù)部資深架構師李松林在數(shù)據(jù)收集方面早已實現(xiàn)了全面自動化,同時為了保證數(shù)據(jù)質量,以給最后的數(shù)據(jù)挖掘和分析,以及最終呈現(xiàn)給用戶的關聯(lián)搜索和個性化營銷,他們采取了3種方法。一種是首先保證數(shù)據(jù)源的質量,其次是通過一些手段對初級收集的數(shù)據(jù)進行清洗,第三是從審計方面再次保證數(shù)據(jù)的質量。
當當網(wǎng)對于大數(shù)據(jù)的探索
當當網(wǎng)副總裁胡毅表示,數(shù)據(jù)挖掘其實最大的價值是讓我們更多的去了解我們的用戶。一方面是借助數(shù)據(jù)挖掘,使我們知道用戶是一個什么樣的情況,有些什么樣的變化。第二方面,數(shù)據(jù)挖掘會對于改善我們的用戶體驗,幫助我們發(fā)現(xiàn)一些新的機會。


