免費試用
banner

用文本挖掘技術分析電商非結構化的評論數據

作者: afenxi來源: afenxi時間:2016-11-23 13:43:160

用文本挖掘技術分析電商非結構化的評論數據-數據分析網

電商平臺中有海量的非結構化文本數據,如商品描述、用戶評論、用戶搜索詞、用戶咨詢等。這些文本數據不僅反映了產品特性,也蘊含了用戶的需求以及使用反饋。通過深度挖掘,可以精細化定位產品與服務的不足。下面描述了電商平臺下機器學習在文本挖掘的應用例子。

1、用戶評論分類

場景

用戶評論能反映出用戶對商品、服務的關注點和不滿意點。評論從情感分析上可以分為正面與負面。細粒度上也可以將負面評論按照業務環節進行分類,便于定位哪個環節需要不斷優化。

機器學習模型

主題聚類、詞向量計算。傳統的機器學習分類模型在評論分類上的精度表現一般,但基于語義的角度進行分類可以有效提高精度。即便如此,在語義類別描述的特征挖掘時,機器學習中的主題聚類、詞向量挖掘技術也不可或缺。

2、搜索詞的需求識別

場景

用戶搜索行為是電商平臺上用戶購物的常用入口,是用戶需求的強體現。將用戶搜索詞分別歸一到具體的品類需求,這是對搜索詞的需求分類。

機器學習模型

基于用戶點擊模型和文本語義關聯的模型,在整個過程中應用到回歸預測、文本分類等。

3、商品標簽挖掘

場景

通常電商平臺需要對商品的功能或風格加上直觀的標簽,便于用戶查找。那么如何從海量的商品描述去挖掘標簽并給商品打上合適的標簽呢。

機器學習模型

聚類與分類技術能大幅減輕人工上的操作。先對商品描述文本預處理,然后進行標簽主題聚類,找出標簽主題的詞分布概率作為特征庫。再根據主題標簽對應的詞分布概率,利用機器學習分類模型去預測商品所屬的標簽。

4、商品咨詢挖掘

場景

商品咨詢可以體現用戶對商品的需求點,有利于需求與服務精確定位。

機器學習模型

不管是咨詢語料的特征詞庫挖掘,還是咨詢短文本的意圖識別,始終要以機器學習與自然語言處理技術作為基礎。

另外,深度學習作為機器學習中的熱門分支,不僅在圖像和語音上有卓越的表現,在自然語言處理上也有應用亮點。 以用戶的負面評論分類為例,淺析深度學習在自然語言處理上的應用。電商平臺上,用戶的負面評論的是千千萬萬細微而散落的點,但我們要將這些點聚集成若干個團,這是一個聚類問題。聚類處理后的點與團,如何直觀的展示出來,這是個數據可視化問題。

用文本挖掘技術分析電商非結構化的評論數據-數據分析網 如圖所示,我們抽取負面評論中與業務環節相關的語料進行訓練,用WORD2VECTOR生成詞向量,再通過PCA降維,將高維詞向量低維化,然后將詞在二維圖上展示出來。可以直觀的看出物流、售后、促銷環節是關注點。

原創文章,作者:古思特,如若轉載,請注明出處:《用文本挖掘技術分析電商非結構化的評論數據》https://www.afenxi.com/post/6111

banner
看過還想看
可能還想看
熱點推薦
Yonghong的價值觀:以卓越的數據技術為客戶創造價值,實現客戶成功。