免費試用

寶寶樹

Babytree

寶寶樹網站是中國受關注的育兒網站。瞄準的是快速增長的6000萬中國上網父母以及由此輻射到的價值540億美金的母嬰經濟規模。通過為父母提供高質量、多類型的線上及線下服務,寶寶樹旨在搭建獨一無二的全方位平臺,讓父母們在這里進行有價值的經驗分享以及育兒方法,得到愉快的和有意義的育兒及成長體驗,為千萬新手爸爸媽媽提供資源共享的交流平臺,同時滿足他們多層次、全方位、適應時代進步的育兒需求。
如今。寶寶樹已經轉型做電商。目前,寶寶樹是中國受關注的母嬰社區和電商平臺。

http://www.babytree.com

項目背景

寶寶樹的訂單數據在SQLServer里,客戶數據在MySQL里,跨數據源整合數據技術復雜,采用Excel整合。分析指標經常變化而復雜,如環比、同比、用戶快照分析、沉睡率、喚醒率、平均回購周期等,極大耗費人工成本。數據分析需求的變化給研發人員很大負擔,經常影響核心業務系統的開發。數據分析需求的變化需要幾周才能得到響應,不能得到及時的數據以支撐業務發展。

項目內容

1.基于Yonghong Z-Suite搭建母嬰社區大數據平臺。
2.分析基礎數據、用戶UGC數據和用戶行為數據,完善用戶畫像。
3.分析結果成功用于產品預測和指導新產品開發。

客戶收益

1.跨數據源整合數據、配置復雜指標均可通過配置快速實現。
2.任意分析需求均可在一天內實現,工作效率提高了數十倍。
3.沒有技術背景的運營人員和業務人員可進行自服務分析。
4.研發人員不再有修改報表負擔,可專注于核心業務系統開發任務。
一個強大的可視化分析工具。基于Yonghong Z-Suite,電商企業可以進行以下主題分析:凈收入、貢獻毛利、利潤等收入分析; 變動成本、優惠券、送禮、促銷、營銷成本等成本分析; cohort、生命周期價值、流失率等客戶分析。

—— 電商行業用戶

案例詳情

國內母嬰社區寶寶樹副總裁魏小巍:為什么敏捷BI是我們的必然選擇

導語:寶寶樹——我們國內的母嬰社區,幾年來獲得如此快速的成長,與其重視數據化運營戰略密不可分。寶寶樹不僅希望IT人員懂得運用數據,還希望實現全員使用。寶寶樹副總裁魏小巍認為,敏捷BI是寶寶樹的必然選擇。那么,寶寶樹為何會做出這樣的選擇嗎?寶寶樹因此獲得了哪些收益呢?

Q:能否簡要介紹下寶寶樹的數據部?

A:我們的數據團隊在三年前就已經成立,一方面是給我們搭建IT基礎設施,另外一方面是梳理我們現在的數據,把數據結構化。因為講到大數據,更多的還是結構化數據,非結構化的數據的利用率非常低的,去年我們這個部門做了一個升級,把大數據的算法、一些數據方面的升級應用,包括內部用數據的這些工具,落實App精準化部署工具等任務都歸到這一部門,現在該部門不到三十人。

Q:那你們公司是自己做數據分析還是和第三方合作?

A:更多的是要借助外力。因為數據是公司的核心,特別是業務數據。更多的工作還是要與第三方合作。我們選擇了和國內的數據可視化分析廠商永洪科技合作,基于Yonghong Z-Suite搭建了自己的數據分析系統,在我的理解來看,永洪BI實際上為我們提供了一個系統平臺。然后我們要根據需求,在這個平臺上進行二次開發。

Q:那你們為什么選擇了這個合作伙伴?

A:之前數據后臺系統不是沒有,但是不夠敏捷,和永洪科技合作是看到了它的敏捷性。只是一群做數據的人運用數據是不夠的,希望全公司的人都可以用。所以敏捷是必須的。第二是我覺得這些數據也要敏捷,這個前提是要有精準的大數據開發能力。我們用排除法排除掉其他產品,認為Yonghong Z-Suite最符合我們的需求。

Q:運用這個產品前后給你們帶來的最明顯的變化是什么?

A:工作效率得到了顯著提高。比如說之前我們任何部門想跑數據的時候,服務器的負荷比較大,比如半夜12點以后到凌晨7點之前去跑這個數據,一等就是24小時,現在我們隨時都可以解決,而且運營得都很好。

Q:你們會怎么進行數據分類?

A:我們自己的大數據大概分成三類,第一類叫做用戶基礎數據,尤其是用戶的性別、年齡、孕期,有了這些就能對用戶進行70%的畫像。
第二類數據是UGC數據,因為我們本身是社區網站,所以用戶產生了大里的內容,通過他們發的這些內容的語意分析,可以進一步地了解他的需求,其實所有的需求只不過是完善之前的基礎數據分析,經過長時間的用戶積累的分析,把這個定位做得更精準,精準是跟時間相關的,沒有公司可以說加一個系統,一天之內就可以把數據分析完,這是不可能的,這跟時間息息相關。時間越長,用戶畫像就越完備。
第三類數據叫做瀏覽型數據。也就是用戶行為數據前兩類數據非常精準地定義了用戶80%-90%的需求,這類分析實際上是以量取勝的,比如如果用戶連續3天在看關于奶粉的討論帖,這個用戶一定是在選擇奶粉,或者是想換一個品牌。大家把三類的數據一分析,可以基本上定義90%以上的用戶。

Q:數據處理過程有沒有什么壓力?

A:數據處理的壓力現在可能還不是那么大,我們定期會清除,說白了數據是有保存期的,是會過期的,我們現在基本上三個月清理一下數據,在這三個月內,經過我們分析,整理數據,對用戶管理相關的我們儲存起來,因為三個月之前的數據基本上沒用了,我們在11月份積累了幾十億用戶的需求,一點用沒有,就過期了。我們之所以壓力不大,是因為充分地了解了數據的保鮮期,我們定義這個保鮮期是三個月。所有數據都有保鮮期,不一樣的行業保鮮期是不一樣的。

Q:那你們在分析數據的時候是否涉及到用戶隱私?

A:比如說電話號碼、家庭住址等隱私,后臺人員只有極個別的人有權限可以看到個人隱私的數據,運營人員最多的是看到用戶行為數據。

Q:數據分析給你們帶來了什么?

A:我們現在通過分析洞察客戶需求、指導產品研發。比如,我們發現當大家開始提霧霾和空氣污染的時候,三個月到半年以后,過敏和濕疹這個詞也大大提起。所以我們預測在2014年的時候,預防過敏或者是促進腸道消化的的奶粉業務加大,2014年統計整體奶粉銷量的時候,有兩個品牌的銷量非常快,他們兩個的競爭點都是預防孩子過敏。這個說的是對于用戶需求洞察存在哪些優勢。另外。我們一個月會出一個排名靠前的用戶關鍵詞,比如孕酮這個詞大概在三年前,前二百名都進不了,但是自從去年起開始進入前十名,我們做了調研之后發現污染導致孕酮異常,我們就在想是不是可以開發產品來調整孕酮的異常。于是我們與中科院對接看是否應該根據這個需求來研發一款孕婦奶粉。需求這一塊,有一些我們能自己做成的就自己做。當我們發現一個需求但自己做不了的。所以我們就找合作伙伴。

Q:你們的數據來源都是一些所謂的關鍵用戶數據嗎?

A:暫時我們只用自己的數據,但是,因為SEO做得好,所以很多百度搜索關鍵詞被導到我們數據庫里。除了這個以外,全是自己的數據。

Q:你們會有像數據科學家這樣的角色嗎?

A:其實不叫數據科學家,一個是算法工程師,會搭數據中心。第二類是算法分析人員,他要能看到數據背后反映的是什么。再有是真正把這個東西實現的人,就是工程師。而這個工程師還要有一定的數據分析基礎。所以這三類人是必須的。另外還有一些去享受他們這些成果的人,比如說專門做提問的人,這非常關鍵,另外就是題目的設置也是非常關鍵。不會問類似那種你有健身需求嗎這種問題,所有人都會回答有,然后就就就敢去建健身中心,這百分百會失敗,不能通過不科學的調研和不靠譜的問題去挖掘所謂的客戶洞察。

Q:你們通過這三年的發展,你們對大數據的最新認識是什么?

A:首先我覺得公司的高層一定要有人對大數據有相對深刻的認知,這個人既要懂大數據又要有商業敏感度,比如當環境污染越來越嚴重時,環境污染這個關鍵詞到底和什么其他的關鍵詞最相關,它才產生了奶粉案例。如果沒有人給大方向,生看數據,是什么都看不見的。所以大數據分析首先要建立在假設的基礎上,然后再去證明或者駁斥一些人的假設。還有就是這種假設要迅速變化。我們任何算法和模型都不是一次成型,有一些小的細節要根據實際情況調整的,其實最后那版成型的是我們認為靠譜的算法,你再跟第一版相比,完全是兩個方向。所以我們真正建立這么一支團隊,每天在調整這些,這是很瑣碎的一件事。

Q:大家都在做數據分析,您覺得咱們最大的區別是什么?

A:精準化程度不一樣。比如以廣告舉例,大數據可以使社區的流量轉換為電商銷量,轉化率更高。經過后臺算法,現在最好的CTR記錄是從千分之三提升到百分之五點五。這個應該是大多數人認知到的大數據分析。寶寶樹現在已經進化到開始通過大數據進行深入用戶洞察,從而進行廣告推送指導、產品指導。一方面廣告算法非常精準,讓用戶在他最恰當的時間,正好需要這個產品的時候,看到這個廣告。比如貸款廣告,我們要做到怎么把貸款廣告推到正好需要貸款的十個人身上。這就是精準營銷。我們現在已經做到1.5了,業內平均的值大概是1%左右。另外就是選品指導,可以通過大數據來知道用戶需要什么,比如縮陰儀,我們發現產后媽媽頻繁提到縮陰這個關鍵詞,我們趕緊聯系廠家,一下子賣出去三千多臺縮陰儀,銷量非常好。

Q:你們現在對大數據的定位是什么?

A:在我看來現在大數據基本上是寶寶樹最主要的產品之一,在未來的5年之內使用大數據,成為寶寶樹的驅動力。

Q:你們現在會給整個行業提供相關報告嗎?

A:對,我們現在基本每個月都能拿出一個小白皮書,每個季度會出一個相對大的白皮書,跟空氣污染、跟二胎、跟過節有關等等。白皮書里的數據都是可以讓大家作為行業指導。

Yonghong的價值觀:以卓越的數據技術為客戶創造價值,實現客戶成功。