作為曠視消費物聯(lián)網(wǎng)業(yè)務的重要后方力量,成都研究院的使命可謂“頂天立地”。向下,夯實算法產(chǎn)業(yè)發(fā)展地基,通過更加智能的手機影像算法助人們在不同環(huán)境下拍出更高質(zhì)感圖像;向上,在 HDR、Denoise、SR、光流等與業(yè)務密切相關(guān)的細分賽道上展開更加極致的探索,在 CVPR、ICCV 等頂級會議上持續(xù)輸出“曠視勢能”。
“科研做上限,產(chǎn)品看下限”,曠視成都研究院負責人劉帥成以此總結(jié)科研與商業(yè)化二者間的“鴻溝”。但正因如此,成研院為打通“產(chǎn)學研用”融通壁壘提供了肥沃土壤,為激發(fā)科技創(chuàng)新氛圍默默蓄力。
從零開始 科研之路要如何蹚?
自2018年成立以來,成研院累計發(fā)表 10 多篇論文被CVPR/ICCV/ECCV/AAAI 頂會收錄,這樣的成果足夠令人驚喜。期間付出的心血,實非朝夕之功。2019 年下半年,成研院轉(zhuǎn)型聚焦于手機影像算法研究領(lǐng)域?;仡櫮嵌稳兆樱瑒洺商寡宰铑^疼的是很多同學之前并不是研究這個領(lǐng)域的,剛開始不知怎樣搞科研,既對手機影像算法缺乏深入了解,也不清楚完成一篇 CVPR 需要經(jīng)歷什么樣的過程。
而對于劉帥成來說,圖像研究并不陌生,他一直專注于底層視覺和計算攝影學研究,具有多年科研經(jīng)驗,于是他決意帶大家一點點來。他把“怎么讀 paper、怎么想 idea、想到 idea 后怎么做實驗”等繁雜的任務逐個拆解下去?!皠傞_始,大家想到的 idea,要么跟別人撞了,要么就根本不可能發(fā)表。”
憑借對商業(yè)落地實踐的持續(xù)觀察,每周兩次雷打不動的“Paper Reading”,以及隊內(nèi)日漸高漲的“傳幫帶”科研氛圍,團隊的科研能力逐漸提升,最終形成了 2021 年的井噴之勢。
“這其實是互相影響的過程,有些同學感覺自己做了很久的項目,也想嘗試發(fā)點論文,或者有些同學看到別人打比賽拿了獎或者是發(fā)了頂會,他可能也會想去嘗試一下?!?/P>
而在 CVPR NTIRE(New Trends in Image Restorationand Enhancement, 即圖像恢復與增強的新趨勢)2021 挑戰(zhàn)賽上,成研院還包攬了圖像超分辨率、圖像 HDR 兩大賽道的冠軍。
提到團隊首次打比賽的經(jīng)歷,劉帥成坦言一切都靠摸索?!罢麄€比賽過程中,我們能看到不同賬號在榜單上的排位,有段時間我們團隊始終處在第二或第三的位置,我們就使勁想辦法搭各種模型,A 同學把這幾個結(jié)構(gòu)試了,B 同學把那幾個結(jié)構(gòu)試了。要試哪些結(jié)構(gòu),大家會先開會討論 To Do List,對每一項任務做到精細的時間管理和計劃制定?!?/P>
最終結(jié)果多少有些讓人意外。開始排在第二第三名的比賽,成研院最終斬獲了冠軍;而長期排在榜一位置的一項比賽,反而因為大意而被后面的人追了上來,最終拿到亞軍。“今年我們也要吸取這樣的教訓,一次排在第一并不代表最后也排在第一,剛開始排在第二第三名,也不代表最后沒有機會去反超?!?/P>
重在實踐 如何叩開商業(yè)的門?
將科研成果應用于商業(yè)世界,推進產(chǎn)品落地是成研院立足之本。尤其是面對智能手機“影像為王”的加速進化,更需要AI算法配合不同平臺的硬件實力更好發(fā)揮效能。
一個好的算法最終能夠?qū)崿F(xiàn)工程化落地,中間需經(jīng)歷包括模型優(yōu)化、加速、質(zhì)量評估等多環(huán)節(jié)流程。為此,劉帥成強調(diào),相較于科研對“最好”的追逐,做產(chǎn)品更要關(guān)注“下限”,“將算法應用到產(chǎn)品中去,各種情況都要考慮到,對用戶來說,質(zhì)量和成片率都很重要?!?/P>
另一方面,不同于實驗中完全客觀的結(jié)果,不同客戶 QA(Quality Assurance,品控)的標準、偏好也將極大地影響算法優(yōu)化。有的 QA 對圖像“發(fā)灰”很敏感,有的 QA 對噪聲很敏感,這就要依據(jù)不同重點去發(fā)力。劉帥成表示:“手機產(chǎn)品迭代節(jié)奏很快,尤其臨近產(chǎn)品發(fā)布的時候,我們內(nèi)部要跟客戶交互著測試,一周可能要發(fā)布幾個版本,以進行高速迭代反饋。
2021 年,成研院在開展技術(shù)攻關(guān)的同時,與內(nèi)部業(yè)務團隊協(xié)同的交付流程亦開始邁入正軌,高效交付、批量化交付漸入佳境,包括超畫質(zhì)、降噪和圖像增強等在內(nèi)的技術(shù),在諸多智能手機中廣泛應用。
“批量交付是指算法已經(jīng)成熟,已在某一個機器上實現(xiàn)量產(chǎn),我們需要把量產(chǎn)的算法推廣到更多機器上做適配,這就叫做批量交付。這是從 1 到 100 的產(chǎn)品化的過程,從 0 到 1 則更像是項目化的過程?!眲洺山忉尩馈?/P>
持續(xù)進化 科研人揭秘成長“寶典”?
正如成研院的存在,為很多不知道“如何進入圈子”的年輕人搭建了一個平臺?!拔覀兤鋵嵰矌Я撕芏嗤耆珱]有經(jīng)驗的同學,帶到他們?nèi)ド暾埐┦?,相當于給他們當跳板,我們也希望他們能跳得更高?!?/P>
在給予年輕人機遇與關(guān)注的同時,一些同學們會遇到的共性問題也日漸突出起來。比如,沒有相關(guān)學科背景怎么辦?不知道如何搞科研怎么辦?投論文被拒怎么辦?為此,成研院結(jié)合實操經(jīng)驗,為有志于從事算法工作的伙伴們給到一些小小的建議。
1.相較于學習背景,發(fā)自內(nèi)心地熱愛更重要。是否能做好這件事情,取決于你是否是發(fā)自內(nèi)心地熱愛。當你很愛這件事的時候,你才有強大的自驅(qū)力去發(fā)掘各方面的資源、去積累相關(guān)經(jīng)驗,否則很可能遇到一個比較困難的問題就退縮了。
2.論文數(shù)量不是衡量一切的指標,投論文要擺正心態(tài)。相較于論文數(shù)量,論文后續(xù)影響力如何更為重要,經(jīng)過一段時間的沉淀,優(yōu)質(zhì)論文的引用量是很高的。面對論文被拒的情況,要有一顆平常心,切實分析原因是下一次投稿成功的關(guān)鍵。最重要的是,要保證自己不被失敗糾纏,能站起來直面這些挑戰(zhàn)。
3.不打無準備之仗。做畫質(zhì)方向,頂會里關(guān)于low-level的論文,以及國際頂級學術(shù)期刊 TPAMI,IJCV等,都值得同學們關(guān)注。另外,做底層視覺,傳統(tǒng)算法也很重要,很多深度學習算法借鑒了傳統(tǒng)算法的設計思想,學扎實基本功才是繼續(xù)深造的資本。
4.堅守“長期主義”,繼續(xù)深耕自身研究領(lǐng)域。成績不是一蹴而就的,得有一定時間的積累,有些同學習慣打一槍換一個地方,缺少堅持,很容易“走得快但走不遠”。結(jié)硬寨,打呆仗,長時間專注一件事情,在自身領(lǐng)域里長期堅持聚焦,才能發(fā)光發(fā)熱。
關(guān)鍵詞: