【獵云網(微信:ilieyun)北京】2月11日報道
記者獲悉,支付寶集五福增設的打年獸環節,吸引了超過1億用戶參與。這一可用聲音喊關鍵詞、搶額外紅包的創意游戲,成為今年集五福活動的一大亮點。看似簡單的游戲背后,暗藏業界最前沿的語音黑科技,可支持上億用戶同時聲控玩游戲,且語音識別反應速度達到傳統語音技術的20倍。
聲控打年獸游戲被不少人評價腦洞大開又魔性解壓。眾多網友在解鎖紅包的同時,通過對著手機高喊“牛牛!薄靶腋安康”等祝福詞收獲了意想不到的歡樂,話題“打年獸聲控局”在微博上獲2.1億關注。不過,由于需承載億級用戶,保證不同機型配置、不同網絡條件的用戶都擁有絲般順滑的體驗,這一國民游戲對語音識別技術提出了極高要求。
傳統語音識別系統往往部署在云端,對移動端網絡狀況要求很高,難以低延時支持所有用戶。為保障穩定的用戶體驗,聲控打年獸游戲采用了達摩院語音實驗室最前沿的離線關鍵詞識別技術,語音識別系統從云端搬至移動端,同時被剪裁至不到5M的極致大小,可在離線部署的情況下允許上億用戶同時低延時暢玩游戲。即便在低配手機上,這一黑科技也能在50毫秒內完成語音識別過程,速度達到傳統語音技術的20倍。
近幾年來,阿里語音在前沿技術及應用領域接連取得突破。2019年,阿里語音AI憑借逼近真人表現力的交互能力,入選《麻省理工評論》“全球十大突破性技術”;2020年,阿里語音AI首次讓端上語音識別和語音合成能力達到了媲美云端的水平;2020年底,IDC最新報告顯示,阿里語音在以32%的市場份額,在云上語音AI市場中連續位居第一。
最新評論