近日,《麻省理工科技評論》中國發布了《2021人工智能創新研究院(AI Labs)報告》,多元且客觀地描摹 AI 技術創新和未來技術趨勢的年度圖景,從而預見改變中國,甚至改變世界的技術力量。同時,報告遴選出10 家具有技術創新力和引領力的企業 AI 研究院,小米AI實驗室成功入選。這是對小米技術實力的認可。
小米 AI 實驗室以“AI 滲透C端生活場景,延續完善 AIoT 戰略布局”上榜。
《麻省理工科技評論》中國公布了小米AI實驗室的上榜理由:“小米圍繞"手機×AIoT"戰略與核心業務需求,為用戶提供豐富的智能生活體驗。其自研技術廣泛應用于智能手機、音箱等智能硬件產品以及電商等互聯網服務業務中,并打造了業內領先的智能生活助理小愛同學,將 AI 技術全面融入 C 端用戶細分生活場景。”
小米于2014年成立小米AI研究院的前身小米探索實驗室,2016年初正式成立小米AI實驗室,研究方向包括計算機視覺、聲學、語音、NLP、知識圖譜、機器學習等多個領域。
報告指出,小米作為一家以智能手機、智能硬件和IoT平臺為核心的消費電子及智能制造公司,關注基于硬件的AI技術支撐,將語音交互作為基礎能力進行構建,優勢體現在應用場景多樣化、數據豐富度高。個性化、精細化、多模態和安全隱私性作為小米技術發展方向,AI技術將更多地融入C端用戶細分生活場景,通過軟硬件技術結合的方式,在保證用戶隱私安全的情況下,提供精細化服務,更加理解生活、貼近生活。
作為小米AI技術的"試驗田"和"彈藥庫",小米AI實驗室旨在研發業內一流的AI技術,為公司的關鍵業務交付關鍵AI能力。與此同時,結合公司重大戰略需求,開展探索性預研工作,為公司未來儲備核心AI技術,提升公司技術品牌影響力。
小米AI自主研發技術,目前已經在計算機視覺、聲學、語音、NLP、知識圖譜、機器學習等研究方向取得一系列成果。
計算機視覺領域
小米AI實驗室在手機相機和AIoT設備上已經落地了40多項視覺核心算法,為用戶打造極致的拍照體驗。其中,2021年有20多項算法落地10款以上機型,另20多項預研算法正在進行中,也將逐漸落地到旗艦手機上。在全球最權威的第三方評測機構DXO Mark榜單上,AI實驗室的HDR、人像超清、邊緣畫質提升技術助力小米手機3次登頂。魔法系列如魔法換天、魔法分身等分割效果好,速度快,體驗新奇有趣。此外,由AI實驗室和相機部聯合打造的小米12計算攝影技術“萬物追焦”,拍照快、追焦穩,廣獲用戶好評。
聲學領域
小米AI實驗室致力于人工智能聲學技術的研究及工程落地,為小米手機及IoT全生態硬件產品打造業界領先的音頻體驗。目前AI通話降噪、協同喚醒、協同放音、空間音頻等技術已在手機、電視、小愛、耳機等60余款產品中落地。2018年小米建成國內首家全自動遠場聲學實驗室并成為中國人工智能產業聯盟首批聯合實驗室,小米遠場聲學測試規范確立為聯盟測試標準。近年來團隊牽頭發起國際標準1項、國家標準2項、行業標準2項、團體標準4項及企業標準2項,為小米在遠場聲學領域奠定了行業領先優勢。
語音領域
小米AI實驗室在語音識別、語音喚醒、聲紋識別、口語評測、語音合成、歌唱合成、AI作曲與編曲等方面均取得了重大的突破。目前,小愛同學每日承接1.9億次語音請求。小米AI實驗室已經將AI語音技術落地到小米手機、平板、手表、手環、耳機、電視、音箱、手表、四足機器狗等產品上。與此同時,團隊連續在Interspeech和ICASSP等國際語音頂級會議上發表了10多篇學術論文,并為公司奪得5項語音識別、語音喚醒和聲紋識別技術的國際比賽冠軍。
新一代KaIdi
新一代語音團隊由集團首席語音科學家Daniel Povey博士領銜,在維護現有Kaldi項目的同時,致力于開發新一代Kaldi項目。Kaldi作為過去10來年業界最引人注目的開源語音項目,在科研界和產業界都取得了巨大成功。新一代Kaldi是小米純自主研發的全新的面向未來的開源語音識別框架,該項目在推動語音識別技術發展的同時,也將提高小米語音識別技術的國際競爭力和影響力。經過一年多緊鑼密鼓的開發,目前新一代Kaldi的三個子項目——K2、Lhotse和Icefall,基本開發完成,并且已經在2021年8月的InterSpeech會議上正式對外發布,這意味著新一代Kaldi項目已經布局完成。相信隨著新一代Kaldi的發布和廣泛使用,將會徹底改變人們實現語音識別的方式。
小米集團首席語音科學家Daniel Povey
NLP領域
研發自然語言處理核心技術,打造領先的技術平臺和創新產品。團隊重點打造了搜索、推薦、廣告、多模態、機器翻譯、人機對話和文本創作等方向。
搜索、推薦、廣告支持了小米商城、有品、新零售、廣告推薦等業務。利用多模態技術自動生成廣告創意,成功支持廣告投放。機器翻譯廣泛應用到小愛同學、手機、MIUI傳送門與網頁翻譯、小愛老師、小愛鼠標等設備。設備端翻譯體驗業界領先,同聲傳譯已上線到小愛面對面同傳、會議同傳、AI字幕、通話翻譯等場景,成為小米高端機型產品宣傳頁功能。人機對話方面重點研發了閑聊對話功能,是小愛同學在手機、音響等重要設備中用戶最喜歡使用的功能之一。機器寫作基于最新的預訓練生成技術在對聯、詩歌生成領域達到接近人類水平的效果,應用到小愛同學節日運營傳播;語言風格轉換技術成功支持了小愛同學多款自定義音色的語言風格定制。
知識圖譜領域
此外,小米AI實驗室在圖譜構建和圖譜應用領域均取得了重大突破。在圖譜構建方面,小米AI實驗室聯合OpenKG進行了知識圖譜的開源工作。另外在實體鏈接技術方面,2次獲得了中文短文本實體鏈接比賽的第一名。在圖譜應用方面,知識圖譜廣泛應用于小愛,每日承接數億次query請求,并在2021年CCKS的知識問答比賽中攬得第一名。智能客服業務依托知識圖譜平臺,打造了在線客服機器人、智能外呼、智能IVR等產品,為公司每年節省上千名客服人力。
在報告的洞察部分,《麻省理工科技評論》中國指出,企業的 AI 研究院是打造業務新增長曲線的主要陣地,其無形當中醞釀著新的破局點和增長點。在相機方向,小米AI實驗室通過應用計算機視覺相關算法技術,提升拍照清晰度、對焦精確度、操作趣味性。在語音交互方向,小愛同學從語音助手逐步升級為智能生活助手。而NLP和知識圖譜則在互聯網內容領域應用廣泛。總體來說,圍繞小米"手機xAIoT"的核心戰略,小米人工智能已經在關鍵的AI產品和技術方面做好了完整布局。
技術創新只有與社會、行業、市場緊密結合,才能最大限度推動商業成果落地,從而真正做到改變人們的生產生活。未來,小米AI實驗室將不斷探索科技新高度,用人工智能的技術和產品,讓更多人享受科技帶來的美好生活。
【免責聲明】本文僅代表合作供稿方觀點,不代表和訊網立場。投資者據此操作,風險請自擔。
最新評論