近日,由度小滿博士后科研工作站朱文靜、李祥兩位博士后共同撰寫的GLAM論文:Speech Emotion Recognition with Global-Aware Fusion on Multi-scale Feature Representation(“基于多尺度特征表示的全局感知融合語音情感識別”)入選了國際音頻頂級會議ICASSP。
ICASSP是全球最大、最全面的信號處理及應用方面的頂級會議,已經擁有幾十年的歷史。作為IEEE(電子技術與信息科學工程師協會) 的一個重要會議,其論文還經常被三大檢索工具檢索。該會議對于信號處理方面的學術人士有著重要意義。它涵蓋了音頻和聲學信號處理,圖像、視頻和多維信號處理,物聯網的信號處理等至少十六個方向。
在本論文中,朱文靜提出了全新的神經網絡GLobal-Aware Multi-scale(GLAM),GLAM網絡是根據語音獨有的特征形式設計出的模型,在IEMOCAP基準數據集上,超越了當前最新技術。通過全局感知的融合模塊來學習多尺度特征表征,并將此加入到情感信息中,這就解決了以往卷積神經網絡(CNN)方法在SER上的局限性,即不同尺度的豐富情感特征和重要的全局信息無法被很好地捕捉。該模型有望應用到客服場景中,降低人工客服的溝通成本的同時,提升用戶體驗。
據悉,朱文靜、李祥兩位博士后在進站后的研究均聚焦在情感計算,探索其在用戶情緒感知、情緒原因溯源和情緒合理應對這三個方面的研究價值。
目前,情感計算在金融領域的應用,已經起到了保駕護航、提高效率的作用。例如在動態對話過程中,觀察出用戶關鍵標簽信息:所處領域、職業,以及借款用途等,在這樣一張用戶畫像之下,預測出客戶的還款、續保意愿或者對商品購買意向等。也可以通過對用戶表情、語音、語速、行文、文本等信息,綜合判斷出貸款的客戶是否存在欺詐行為,對減少壞賬提供了不少便利。
【免責聲明】本文僅代表第三方觀點,不代表和訊網立場。投資者據此操作,風險請自擔。
最新評論