作為曠視消費物聯網業務的重要后方力量,成都研究院的使命可謂“頂天立地”。向下,夯實算法產業發展地基,通過更加智能的手機影像算法助人們在不同環境下拍出更高質感圖像;向上,在 HDR、Denoise、SR、光流等與業務密切相關的細分賽道上展開更加極致的探索,在 CVPR、ICCV 等頂級會議上持續輸出“曠視勢能”。
“科研做上限,產品看下限”,曠視成都研究院負責人劉帥成以此總結科研與商業化二者間的“鴻溝”。但正因如此,成研院為打通“產學研用”融通壁壘提供了肥沃土壤,為激發科技創新氛圍默默蓄力。
從零開始 科研之路要如何蹚?
自2018年成立以來,成研院累計發表 10 多篇論文被CVPR/ICCV/ECCV/AAAI 頂會收錄,這樣的成果足夠令人驚喜。期間付出的心血,實非朝夕之功。2019 年下半年,成研院轉型聚焦于手機影像算法研究領域。回顧那段日子,劉帥成坦言最頭疼的是很多同學之前并不是研究這個領域的,剛開始不知怎樣搞科研,既對手機影像算法缺乏深入了解,也不清楚完成一篇 CVPR 需要經歷什么樣的過程。
而對于劉帥成來說,圖像研究并不陌生,他一直專注于底層視覺和計算攝影學研究,具有多年科研經驗,于是他決意帶大家一點點來。他把“怎么讀 paper、怎么想 idea、想到 idea 后怎么做實驗”等繁雜的任務逐個拆解下去。“剛開始,大家想到的 idea,要么跟別人撞了,要么就根本不可能發表。”
憑借對商業落地實踐的持續觀察,每周兩次雷打不動的“Paper Reading”,以及隊內日漸高漲的“傳幫帶”科研氛圍,團隊的科研能力逐漸提升,最終形成了 2021 年的井噴之勢。
“這其實是互相影響的過程,有些同學感覺自己做了很久的項目,也想嘗試發點論文,或者有些同學看到別人打比賽拿了獎或者是發了頂會,他可能也會想去嘗試一下。”
而在 CVPR NTIRE(New Trends in Image Restorationand Enhancement, 即圖像恢復與增強的新趨勢)2021 挑戰賽上,成研院還包攬了圖像超分辨率、圖像 HDR 兩大賽道的冠軍。
提到團隊首次打比賽的經歷,劉帥成坦言一切都靠摸索。“整個比賽過程中,我們能看到不同賬號在榜單上的排位,有段時間我們團隊始終處在第二或第三的位置,我們就使勁想辦法搭各種模型,A 同學把這幾個結構試了,B 同學把那幾個結構試了。要試哪些結構,大家會先開會討論 To Do List,對每一項任務做到精細的時間管理和計劃制定。”
最終結果多少有些讓人意外。開始排在第二第三名的比賽,成研院最終斬獲了冠軍;而長期排在榜一位置的一項比賽,反而因為大意而被后面的人追了上來,最終拿到亞軍。“今年我們也要吸取這樣的教訓,一次排在第一并不代表最后也排在第一,剛開始排在第二第三名,也不代表最后沒有機會去反超。”
重在實踐 如何叩開商業的門?
將科研成果應用于商業世界,推進產品落地是成研院立足之本。尤其是面對智能手機“影像為王”的加速進化,更需要AI算法配合不同平臺的硬件實力更好發揮效能。
一個好的算法最終能夠實現工程化落地,中間需經歷包括模型優化、加速、質量評估等多環節流程。為此,劉帥成強調,相較于科研對“最好”的追逐,做產品更要關注“下限”,“將算法應用到產品中去,各種情況都要考慮到,對用戶來說,質量和成片率都很重要。”
另一方面,不同于實驗中完全客觀的結果,不同客戶 QA(Quality Assurance,品控)的標準、偏好也將極大地影響算法優化。有的 QA 對圖像“發灰”很敏感,有的 QA 對噪聲很敏感,這就要依據不同重點去發力。劉帥成表示:“手機產品迭代節奏很快,尤其臨近產品發布的時候,我們內部要跟客戶交互著測試,一周可能要發布幾個版本,以進行高速迭代反饋。
2021 年,成研院在開展技術攻關的同時,與內部業務團隊協同的交付流程亦開始邁入正軌,高效交付、批量化交付漸入佳境,包括超畫質、降噪和圖像增強等在內的技術,在諸多智能手機中廣泛應用。
“批量交付是指算法已經成熟,已在某一個機器上實現量產,我們需要把量產的算法推廣到更多機器上做適配,這就叫做批量交付。這是從 1 到 100 的產品化的過程,從 0 到 1 則更像是項目化的過程。”劉帥成解釋道。
持續進化 科研人揭秘成長“寶典”?
正如成研院的存在,為很多不知道“如何進入圈子”的年輕人搭建了一個平臺。“我們其實也帶了很多完全沒有經驗的同學,帶到他們去申請博士,相當于給他們當跳板,我們也希望他們能跳得更高。”
在給予年輕人機遇與關注的同時,一些同學們會遇到的共性問題也日漸突出起來。比如,沒有相關學科背景怎么辦?不知道如何搞科研怎么辦?投論文被拒怎么辦?為此,成研院結合實操經驗,為有志于從事算法工作的伙伴們給到一些小小的建議。
1.相較于學習背景,發自內心地熱愛更重要。是否能做好這件事情,取決于你是否是發自內心地熱愛。當你很愛這件事的時候,你才有強大的自驅力去發掘各方面的資源、去積累相關經驗,否則很可能遇到一個比較困難的問題就退縮了。
2.論文數量不是衡量一切的指標,投論文要擺正心態。相較于論文數量,論文后續影響力如何更為重要,經過一段時間的沉淀,優質論文的引用量是很高的。面對論文被拒的情況,要有一顆平常心,切實分析原因是下一次投稿成功的關鍵。最重要的是,要保證自己不被失敗糾纏,能站起來直面這些挑戰。
3.不打無準備之仗。做畫質方向,頂會里關于low-level的論文,以及國際頂級學術期刊 TPAMI,IJCV等,都值得同學們關注。另外,做底層視覺,傳統算法也很重要,很多深度學習算法借鑒了傳統算法的設計思想,學扎實基本功才是繼續深造的資本。
4.堅守“長期主義”,繼續深耕自身研究領域。成績不是一蹴而就的,得有一定時間的積累,有些同學習慣打一槍換一個地方,缺少堅持,很容易“走得快但走不遠”。結硬寨,打呆仗,長時間專注一件事情,在自身領域里長期堅持聚焦,才能發光發熱。
【免責聲明】本文僅代表合作供稿方觀點,不代表和訊網立場。投資者據此操作,風險請自擔。
最新評論