如今的 AI 看起來已經無所不能,不僅能夠勝任感知、學習、推理、決策等不同層面的任務,甚至可以打造虛擬數字分析,為人類帶來多模態AI交互體驗。近日, 新型社交平臺Soul App 在GITEX GLOBAL海灣信息技術博覽會上展出了其最新自研的多模態大模型,該模型具備多模態理解、真實擬人、文字對話、語音通話、多語種等特性,實現打破次元壁的互動,讓現場的觀眾們驚艷不已。
3D數字孿生,虛擬與現實的創新交互
Soul作為國內較早將AI引入社交關系的互聯網平臺代表之一,此次攜最新自研的多模態大模型參展GITEX GLOBAL 2024,向世界展現了中國企業在社交領域的最新應用實踐和數字娛樂的創新方案。此次是Soul首次亮相國際大型展會,其自研的多模態大模型集合文字、語音、動作交互等多模態方向,實現更接近人類模式的互動體驗和更高效、自然、豐富維度的信息傳遞。
大會上,現場觀眾可以實現高相似度的3D虛擬人的AI建模,通過包含人臉的90余個形狀參數和6個屬性參數,于幾秒鐘內,快速在3D世界精細化還原真實人臉的特征 ,打造專屬的虛擬化身。同時,基于實時的人體動作識別、數字還原以及多模態對話交互能力,實現3D虛擬人與真人的沉浸式互動。
多模態端到端大模型,超擬人的情感體驗
事實上,自成立以來Soul便一直聚焦于多模態大模型方向持續深耕。
在推出智能推薦引擎“靈犀”、以AI算法助力社交關系的發現沉淀環節后,2020年,Soul正式啟動對AIGC的技術研發工作,系統推進在智能對話、語音技術、3D虛擬人等AIGC關鍵技術能力研發工作,并推動AI能力在社交場景的快速落地。
目前,Soul已先后上線了自研語言大模型Soul X,以及語音生成大模型、語音識別大模型、語音對話大模型、音樂生成大模型等語音大模型能力。今年6月,Soul還在社交行業中較早推出了自研端到端全雙工語音通話大模型,具備超低交互延遲、快速自動打斷、超真實聲音表達和情緒感知理解能力等特點,能夠直接理解豐富的聲音世界,支持超擬人化的多風格語言,實現更接近生活日常的交互對話和“類真人”的情感陪伴體驗。
多模態端到端大模型的推出標志著Soul對人機交互體驗的創新突破,同時,從文字、語音到視覺的模態升級,也意味著交互方式的顛覆式改變。在未來,Soul將持續加大對AI技術的投入,致力于通過AI技術更好地幫助用戶進行社交破冰,助力人設搭建和認知決策,提升社交溝通效率。
【免責聲明】【廣告】本文僅代表作者本人觀點,與和訊網無關。和訊網站對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。郵箱:news_center@staff.hexun.com
最新評論