Soul自研端到端語音通話大模型，提升AI情感陪伴體驗

2025-02-13 15:56:56 商務信息

Soul作為新型社交平臺，自上線以來一直致力于以創新的技術方案和產品設計，實現社交體驗的拓展。在AI技術快速發展的背景下，Soul率先探索AI與社交的融合，系統推進其在智能對話、語音技術、虛擬人等AIGC關鍵技術能力研發工作，并推動AI能力在社交場景的深度落地。近日，Soul App語音大模型再次升級，上線自研端到端全雙工語音通話大模型，能夠實現更接近生活日常的交互對話和“類真人”的情感陪伴體驗。

Soul自成立以來一直秉承著“讓天下沒有孤獨的人”的愿景，致力于給用戶帶來更好的情緒反饋和陪伴感。因此在AI應用方面，情緒理解、延遲問題一直是Soul技術團隊關注的焦點。

此前，Soul團隊推出了自研的語音生成大模型、語音識別大模型、語音對話大模型、音樂生成大模型等語音大模型能力，支持真實音色生成、語音DIY、多語言切換、多情感擬真人實時對話等，目前已應用于Soul “AI茍蛋”、站內狼人游戲“狼人魅影”AI語音實時互動、獨立新產品“異世界回響”等場景。

如今，Soul上線自研端到端全雙工語音通話大模型，實現了語音交互體系的顛覆式升級，即不再需要從“語音識別、自然語言理解、語音生成”等多個環節流轉，直接語音輸入—語音輸出的端到端模型能夠最大程度實現信息無損傳遞，降低響應延遲時間。

Soul自研的端到端語音通話大模型便具備超低交互延遲、快速自動打斷、超真實聲音表達和豐富情緒感知理解能力的特點，支持更自然的人機交互體驗。

在延遲方面，于實際應用過程中，用戶體驗與“異世界回響”中虛擬人實時語音通話效果時，延遲時間少于行業平均水平，真正實現即時的AI交流和陪伴。

值得一提的是，端到端的語音語義理解和響應以及更自然的語音指令控制，讓Soul語音通話大模型不僅能夠給予情感關懷、理解人聲情緒情感并給出有溫度的回應，還能夠理解物理世界的聲音場景，模擬物理世界動物聲音、理解多人聊天內容，實現多風格語言切換、文藝內容創作和即興演唱，接近現實交流互動場景需要。

目前，Soul自研的端到端語音通話大模型能力已上線旗下“異世界回響”實時通話場景（內測中），接下來，Soul將持續推進多模態端到端大模型能力建設和應用落地，致力于拓展至更多場景，讓用戶可以與AI進行更加有溫度、沉浸、趣味的互動交流，提升社交體驗。

【免責聲明】此文內容為本網站轉載其它媒體或轉載企業宣傳資訊，僅代表作者個人觀點，與本網無關。僅供讀者參考，并請自行核實相關內容。

（責任編輯：劉暢）

【免責聲明】【廣告】本文僅代表作者本人觀點，與和訊網無關。和訊網站對文中陳述、觀點判斷保持中立，不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考，并請自行承擔全部責任。郵箱：news_center@staff.hexun.com

看全文

寫評論已有條評論跟帖用戶自律公約

提交還可輸入500字

Soul自研端到端語音通話大模型，提升AI情感陪伴體驗

最新評論

相關推薦

熱門閱讀

和訊特稿

Soul自研端到端語音通話大模型，提升AI情感陪伴體驗

最新評論

相關推薦

熱門閱讀

和訊特稿

推薦閱讀