壹沓AI探索:后疫情時代,細粒度情感分析技術何以賦能電商運營?
2020年突發的新冠疫情雖然對我國實體經濟產生了巨大影響,但由此刺激線上經濟快速發展,在很大程度上對沖了消極影響。根據2021年1月國家統計局的最新數據——2020年,我國實物商品網上零售額97590億元,增長14.8%,對比城鎮消費品零售總額比上年下降4.0%,無疑進一步揭示了電商流通加速替代傳統零售的大趨勢。后疫情時代,無論是新潮牌還是傳統品牌都在加碼電商渠道的投入,伴隨線上銷售的占比節節攀高,面向電商平臺的精細化運營管理必然越來越重視消費者產生的海量評價意見數據。通過大數據技術,對多個平臺的商品品類或SKU采集這些評論數據在今天已經不是一件難事,然而要精準、快速地理解消費者意見的內涵,真正驅動銷售運營或產品創新目前市場上還鮮有能夠滿足普遍需求的AI產品和服務。
壹沓科技的AI團隊在多年以來積累的面向傳播的篇章級情感分析技術的基礎上,研究自然語言處理(NLP)技術最新成果和行業實踐經驗,正在研發接近無監督模式的細粒度通用情感分析引擎。下文將為讀者揭示細粒度情感分析這一技術的前世今生,并分享壹沓科技在該任務方向上的經驗認知——
在自然語言處理(Natural Language Processing,NLP)領域,文本情感分析,也被稱為觀點挖掘(Opinion Mining),是對實體(包括產品、服務、組織、個人、議題、事件、話題及他們的屬性等)表達的觀點、評價、態度和情感進行計算的專項任務。伴隨互聯網和電子商務的誕生,自2000年以來,情感分析逐漸發展成為的一個基礎研究和產業實踐都非常重視的技術方向。
近年來,以海量訓練數據作為基礎,對于評論語料的整體情感分析已經達到了可實際商用的精度,行業對該技術提出進一步深入發展的需求,研究熱點已經逐步聚焦到方面級別的細粒度情感分析(Aspect Based Sentiment Analysis - ABSA),國際語義評測大會SemEval從2014年起連續三年將ABSA任務作為其子任務,梳理了四項任務,提供了一系列人工標注的基準數據集。最近,基于深度學習技術的方面級情感分析研究蓬勃興起,取得了突破性進展。
什么是細粒度情感分析和觀點挖掘?
評論整體情感分析不同細粒度情感分析和意見挖掘更注重于屬性詞和情感詞的識別和抽取,對評論中的多個實體或屬性分別計算情感傾向,從而獲得多維度情感信息量,進而獲得更有效的信息,充分展現了評論文本數據的應用價值。比如給定一句產品評論,我們需要能夠從中確定哪些詞是用戶所評價的產品屬性,哪些詞是用戶的態度。
例如,在評論“XX 手機真的很不錯,但是就是屏幕有點差”中,“手機”和“屏幕”都是用戶所評價的產品屬性,即“評價對象”;而“不錯”和“差”則都是用戶的態度,即“評價詞語”。我們需要做的是提取出這幾個詞語,并確定詞語之間的搭配關系。
? 細粒度情感分析技術更具面向運營的商業價值
就電商而言,目前主流的電商平臺在處理商品評論的情感分類時,僅直接將商品評論整體分為好評、差評、中評,然而用戶在針對一件商品發表評論時,除了會給出總體評價,通常會針對該實體的屬性進行評價。比如“這家餐廳的口味很不錯,就是服務態度太差了”,針對口味這個評價對象給出了好評,針對服務這個評價對象卻給出了差評。類似主流的分類方法如圖所示,針對手機質量本身給出了好評,卻對服務態度給出了差評。而該平臺僅將整條評論語句情感傾向性歸為中評類。通過這兩個實例會發現如果僅對整體語句進行情感分類不僅會導致該條評論信息的重點缺失,還會導致情感分類結果的準確度下降,如果采用細粒度情感分析和意見挖掘這項技術方法對商品評論信息進行細粒度的情感劃分即按照不同情感對象進行情感分類,就能為品牌電商運營方提供更多維度的有效信息,通過在線數據分析OLTP可以針對不同品類、不同商品、不同渠道、不同營銷活動分別建立洞察,甚至可以對比競品的消費者動向,即時根據市場反饋調整運營重點和產品迭代。
(上例:消費者對產品基本滿意,但對代言人廣告不滿)
同時,細粒度情感分析是也能夠加強品牌方和消費者的連接。電商商品的褒貶口碑往往決定了其銷售的命運,通過對產品評論的細粒度情感分析可以深入地了解用戶對產品的反饋,實現企業對產品設計的改進。若能快速定位用戶評價中所說的問題,并且快速進入運營處理流程,會帶來消費者對企業服務質量有顯著的體驗提升。
具體來說,就是可以將原始評論信息進行NLP分析處理之后,由AI技術抽取觀點、分類聚合,給出具備明確情感傾向(好、中、差)的評價數據,再由企業管理部門分配給售后、物流、服務報表等環節,進行服務人員的評分考核、產品改進。
電商評論的細粒度情感分析技術行業現狀?
目前,可實用的評論情感分析大都集中在粗粒度層面上,即只能進行對單條評論整體的情感分類,如正向和負向等等。而且對于粗粒度層次的情感分析的研究也停留在篇章級以及句子級的層面上,這就導致了其不能從更加細致的層面上分析出事物主體的各個屬性以及特征之間的關系,或者說是情感極性。顯然,粗粒度情感分析層面的研究已經不能滿足人們的需要,社會大眾以及商家、生產商需要從更細致的層面上了解產品以及其他事物主體,這就要求我們從更加細致層面上對事物主體進行分析,使用戶更加直觀的獲取所需的信息,減少信息獲取量。
現在各大云平臺都有推出了自然語言處理相關項目的服務。如阿里云的自然語言處理、騰訊云的自然語言處理NLP,還有百度AI開放平臺的自然語言處理模塊。這三個平臺都有提供情感傾向分析模塊,但細粒度只是停留在句子級的層面上。此外,百度AI還提供了評論觀點抽取模塊,但只抽取到適應預訓練過的幾個行業場景的少數一些分類維度。在面向實際的電商運營,大平臺的標準化服務都顯得挖掘深度不足,實用性欠佳。
壹沓科技在實際業務中遇到的對某品牌鞋的評價,“顯得腳大,但是舒服”,在該評價實例中,針對鞋子的外觀這個評價對象該買家給出了差評,而針對鞋的舒適度這個評價對象則給出了好評。而騰訊云和百度AI平臺都將整條評論語句情感傾向性歸為好評類。在用戶表達的多評價對象情感有矛盾的案例中,原有情感分析技術往往不能獲得準確的結果。
壹沓AI細粒度情感分析框架
對評論文本進行數據清洗,提取主題詞和情感詞。首先,用戶的在線評論文本通常包含與情感分析無關的噪聲數據,因此,可以使用正則表達式去除表情、占位符等特殊符號,再借用停用詞詞表去除停用詞。其次,由于句子的表示方式靈活且復用率低,因此現有的自然語言處理任務通常需要對句子進行分詞,將詞視為最小的可以獨立運用的單元。最后,要將文本轉化為便于存儲和處理的結構化格式。這一目標主要采用向量空間模型來構建文本向量。
對用戶評論的中的主題詞和情感詞提取之后,還需要抽取出主題詞和情感詞之間的評價配對關系。利用前面模塊處理好的數據集訓練模型、并用模型來對文本進行情感分類。最后將各個時刻的前向隱藏狀態與其對應時刻的反向隱藏狀態相結合,得到該時刻的最終輸出。下圖為細粒度情感分析流程框圖。
(細粒度情感分析流程框圖)
細粒度情感分析及意見挖掘的相關技術
壹沓科技AI部門在細粒度情感分析及意見挖掘方面也取得了部分進展,下面介紹幾個對于該項任務中幾個比較關鍵的技術方法,希望通過本文能夠給喜歡和熱愛NLP的伙伴們帶來一些收獲。
? 主題詞和情感詞之間的評價配對關系
在自然語言處理任務中可以將主題詞和情感詞之間的評價配對關系當成關系分類任務來解決。可以將任務簡化為對抽取的主題詞和情感詞進行逐對判斷其是否為配對關系即可。例如“這款手機的外型很好看,但是電池真的是不耐用”一句中,(外型,好看)與(電池,不耐用)是正確的配對,但(外型,不耐用)不是正確的配對關系。如下圖所示。
目前,基于傳統的機器學習的語言模型已經能有效地處理這類任務,但往往對語法不規范的電商評論準確性下降不少。通過深度學習的方法在海量語料中進行訓練,利用改進的LSTM神經網絡—AF-LSTM對比可以取得不錯的效果。
該模型的優點在于讓注意力層專注于學習上下文詞的相對重要性,不用學習aspect和單詞之間的關系。降低了計算復雜性和存在過擬合風險。如下圖所示。在輸入經過 embedding 層和 LSTM 層之后進入到 Word-Aspect Fusion Attention Layer,這也是該模型的重點。如圖所示:
(AF-LSTM模型整體框架)
「Normalization Layer(optional):」 在隱狀態矩陣和 aspect vector 進行交互之前可以選擇性地對其進行正規化操作,可以選用 Batch Normalization;
「Associative Memory Operators:」 用于計算 context word 和 aspect word 之間的關系。有兩種:circular correlation 和 circular convolution;
「Learning Attentive Representations:」 將 aspect 和 context 進行 fusion 之后得到的向量表示進行 attention 操作。
? 文本情感級性判斷
對評論進行完主題詞和情感詞的配對提取之后,需要對本句評論的情感極性做出判斷,方便用戶和商家更好的了解顧客對商品的情感傾向。通過大量觀察實驗中的評論數據,發現有很多用戶評論中所表達的包含若干個主題,用戶對于不同的主題所表達的情感極性也是不一樣。下表列舉了用戶評論中所表達的包含若干個主題的評論。
(用戶評論多主題詞情感極性標注樣例)
對于表用戶的評論“手機的外殼看起來很舒服,觸屏鍵特別敏感,就是待機時間不長。”這條評論中,一共存在的主題詞和情感詞對有(外殼,舒服)、(觸屏鍵,敏感)、(耗電,快)。該評論中對于不同的主題詞有著不同的情感極性。如果整體對該評論打上情感極性標簽,是無法分到積極、消極和中性的類別中,但是分別對于每個主題詞,可以很準確地判斷其對應的情感極性。因此,如果能對每個含有主題詞的短句進行情感極性判斷的效果是比直接對整句評論進行情感極性判斷的更要準確。下面給大家介紹一種融合詞性注意力機制的細粒度情感極性分析模型BiLSTM-Attention+POS+Multi-Dic。
(融合詞性注意力機制的細粒度情感極性分析模型)
首先將評論語句中的各單詞及對應的詞性和多領域詞典特征進行向量化編碼,分別轉換成固定長度的低維稠密向量表示。然后對單詞向量及對應的多領域詞典向量進行拼接輸入到下一層中進行特征學習。特征學習主要利用 Bi-LSTM 網絡模型的優勢提取文本的高維抽象特征,然后結合注意力機制將待抽取實體的語句中各單詞及其多領域詞典特征的高維抽象特征取出,與各詞單元對應的詞性特征向量進行注意力關注計算,從而得到詞性特征對預測目標的貢獻矩陣。把注意力層的輸出特征進行拼接,即得到最終得到的文本特征表示 Ls。
如上圖所示, 在BiLSTM 的基礎上提出 BiLSTM-Attention+POS+Multi-Dic 分類模型,模型構建多領域詞典特征,融合 Attention 機制,適當分配詞性的注意力對文本情感極性分類的權重貢獻度,對文本情感極性分類的有著很大的提高。
展望未來
壹沓科技AI團隊在面向電商商品評論的細粒度情感分析問題上取得了一些階段性成果,但是,為了能夠更好地完成通用的分析引擎,還有很多內容值得進一步深入研究與改進優化。下一步的工作將會圍繞著以下幾個方面展開:
基于大規模的預訓練網絡進行完全端對端成對抽取評論中的主題詞和情感詞在某些數據集上有很好的測評效果,后續的工作可以嘗試使用聯合解碼的方式,同時識別句子中的主題詞和對應的情感詞。
雖然我們的方法已經考慮到了隱含實體,基本解決了評價中沒有顯式評價對象的問題,但是很多用戶的評價往往還缺乏連續的顯式評價詞(通過短語整體體現情感傾向),如何高效地識別這些隱式情感并準確分類也有待下一步解決。
面向實際商用和客戶觀感,如何有效評價結果中的對象詞和情感詞的抽取置信度往往會決定最終上線產品的客戶滿意度,這方面的工作也待后續開展。
關于壹沓科技
壹沓科技成立于2016年11月,聚焦于前沿技術在企業數字化中的應用,公司核心業務包括壹沓數字機器人產品-Cube Robot和壹沓品牌方程服務-Formula DBM,已經為多個行業數百家企業及政府提供服務。
我們在自然語言處理-NLP、圖像文字識別-OCR、知識圖譜-KG、大數據挖掘-Data Mining、機器人流程自動化-RPA和業務流程重構及管理-BPR&BPM等領域具備完整的自主研發能力,已獲得軟件知識產權數十個。
總部位于上海 ,在北京、深圳設有分公司,已獲得高新技術企業、雙軟及專精特新企業等專業認證 。核心團隊來自于多家知名上市公司,在企業服務及互聯網從業超過10年,擁有大數據、云服務及人工智能領域的豐富經驗。
轉載請在文章開頭和結尾顯眼處標注:作者、出處和鏈接。不按規范轉載侵權必究。
未經授權嚴禁轉載,授權事宜請聯系作者本人,侵權必究。
本文禁止轉載,侵權必究。
授權事宜請至數英微信公眾號(ID: digitaling) 后臺授權,侵權必究。
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)