ChatGPT出現(xiàn)之后,網(wǎng)易有道公司內(nèi)部大吵了一架。
(相關(guān)資料圖)
吵架的話題導火索是,有道翻譯這款產(chǎn)品的下一步該如何走。這款產(chǎn)品在2008年上線,是網(wǎng)易自主研發(fā)的,也是國內(nèi)首家統(tǒng)計機器翻譯線上引擎。
經(jīng)過15年的技術(shù)迭代,有道神經(jīng)網(wǎng)絡(luò)翻譯(NMT)在行業(yè)內(nèi)占據(jù)優(yōu)勢地位。第三方平臺的數(shù)據(jù)顯示,到目前為止,有道詞典月活用戶已經(jīng)超過1億,是國內(nèi)詞典翻譯市場的第一名。
通常而言,做翻譯相關(guān)產(chǎn)品,業(yè)內(nèi)的共識追求是,它能不能替代人工翻譯。一定程度上,現(xiàn)有的翻譯產(chǎn)品,已經(jīng)實現(xiàn)了這一目標。
目標實現(xiàn)了,然后呢?這之后,應(yīng)該怎么辦?換句話說,一項技術(shù)一旦超越了傳統(tǒng)能力,甚至超過人類智力表現(xiàn)之后,最大的改變應(yīng)該是什么?
網(wǎng)易有道CEO周楓想明白了,前沿技術(shù)已經(jīng)在更新,翻譯再這樣做下去不行,必須要迭代。他想用大模型的方式,重新思考翻譯這款產(chǎn)品的邏輯。
最大的改變,應(yīng)該是讓翻譯產(chǎn)品的使用量大幅上升,就像福特做出了ModelT這款改寫全球汽車產(chǎn)業(yè)發(fā)展的汽車。ModelT的價格讓普通人都負擔得起,汽車變成所有人都可以用,這個時候,技術(shù)就真的改變世界了。
周楓告訴鈦媒體APP,這些爭吵在注重技術(shù)的網(wǎng)易有道屬于常態(tài),他們內(nèi)部也經(jīng)常做這樣的事情。
他認為,技術(shù)團隊時常需要轉(zhuǎn)換腦筋。于是,他把翻譯團隊這幫老同事再度聚集起來,讓大家學習大語言模型的能力,試圖把翻譯這款產(chǎn)品在新的模型上跑起來。
大約過了四五個月之后,團隊評測后發(fā)現(xiàn),這些工作是有效的,現(xiàn)有模型的性能和最后翻譯的質(zhì)量,已經(jīng)超過之前用的模型了。
但投入“燒錢”的大模型,對于尚處于盈利階段掙扎的網(wǎng)易公司來說,是否劃算?公司研發(fā)和訓練大模型的成本投入,又是否感到吃力?
今年第一季度,網(wǎng)易有道業(yè)績產(chǎn)生波動。財報數(shù)據(jù)顯示,一季度,網(wǎng)易有道凈收入為11.6億元人民幣,同比減少3.1%;凈虧損2.1億元,同比增加101.9%,繼上個季度利潤轉(zhuǎn)正后再次由盈轉(zhuǎn)虧;并且,有道一直引以為傲的硬件業(yè)務(wù)收入也下滑16%。
“做公司永遠是這樣的,好東西都要錢,好的也最貴,這不是新問題,我們一定會管理好?!敝軛鲗︹伱襟wAPP表示。
他稱,現(xiàn)在做大模型效率還比較高,一方面是公司之前有一定的基礎(chǔ),另一方面,有道Transformer的優(yōu)化很強,很早的時候,他們就能把Transformer裝到小設(shè)備里面。
并且,大模型的邊際成本非常低,復制模型不需要太多額外的成本。雖然有道的近百人的AI團隊,人數(shù)也不少,但總體上,不需要增加額外的特別大的投入。
在網(wǎng)易有道首席科學家段亦濤看來,很多技術(shù)和資源都是一脈相承的。他告訴鈦媒體APP,有道做大模型的過程,是在之前團隊框架進行的,并沒有額外的組建團隊來做。
從2016年開始,有道協(xié)同構(gòu)建AI基礎(chǔ)能力,同步組建語言、視覺、聲音等團隊,積累了有道神經(jīng)網(wǎng)絡(luò)翻譯(NMT)、計算機視覺、智能語音AI技術(shù)、高性能計算(HPC)四個底層技術(shù)能力。
2017年,有道就看上了主流技術(shù)Transformer,將AI能力統(tǒng)一在大模型之下,重視在端側(cè)的落地應(yīng)用。2019年,有道詞典筆2代的產(chǎn)品中,首次搭載離線Transformer NMT。2022年,有道詞典筆P5中搭載了自研的離線ASR,已升級為Transformer技術(shù)。
用大模型做翻譯產(chǎn)品,周楓公開表示,在內(nèi)部的測試中,在中英互譯的方向上,已經(jīng)超越ChatGPT的翻譯能力,也超過了谷歌翻譯的水準。
不過,基于大模型的翻譯產(chǎn)品,一個非常現(xiàn)實的問題是,它的成本較之前是有所提升的。周楓對鈦媒體APP透露,內(nèi)部經(jīng)過測算,用大模型做翻譯,因為計算量非常大,查詢一次的成本,要比之前的模型貴近20倍,而有道的翻譯產(chǎn)品,現(xiàn)在每天大約要承接幾億次的查詢量。
雖然讓大模型翻譯大量被使用是周楓的目標,但他也發(fā)現(xiàn),大模型的確是燒錢,尤其是在最開始的時候,會有一些成本上的困難。他們目前需要資金,因為確實現(xiàn)有的東西,不滿足他們對產(chǎn)品的要求。
這樣的投入吃緊的現(xiàn)實,也可能改變翻譯這類產(chǎn)品的商業(yè)模式。不同于以往翻譯產(chǎn)品的流量轉(zhuǎn)化廣告變現(xiàn)的邏輯,周楓告訴鈦媒體APP,對大模型翻譯來說,付費會員制是目前比較合理的方案。
不過,大模型也已經(jīng)引來教育界的“封殺”。美國多所公立學校已經(jīng)禁用了ChatGPT,多家科學期刊也禁止將ChatGPT列為論文“合著者”。
周楓也反對學生在學習的過程中用大模型“抄答案”的行為,在應(yīng)用端體現(xiàn)為“家長管控”功能,可以管控識別答案,給出講解,而不是直接給出最后的答案。
不用去把大模型去神圣化。周楓說,我們應(yīng)當對大模型里面的產(chǎn)品和技術(shù)創(chuàng)新做到具體案例具體分析,不能認為大模型是一切事物的通途,更值得研究的是,在豐富的應(yīng)用場景。應(yīng)用和場景是整個變革的過程中,大家應(yīng)該及早去抓的。因為抓得越早,后邊能抓到的東西越多。
不只是網(wǎng)易有道,教育界也有一些公司對大模型的積極擁抱。今年5月,學而思正在研發(fā)數(shù)學大模型MathGPT的消息引發(fā)行業(yè)熱議。
彼時,學而思方面對鈦媒體APP表示,MathGPT以數(shù)學領(lǐng)域的解題和講題算法為核心,目前已經(jīng)取得階段性成果,并將于年內(nèi)推出基于該自研大模型的產(chǎn)品級應(yīng)用。
今年7月初,學而思一次發(fā)布會上透露可能該月底會有相關(guān)成果的對外展示。不過,截至目前,他們還沒有相關(guān)進展對外披露。
這背后或許是相對于其他領(lǐng)域,數(shù)學大模型難度頗高。
數(shù)學大模型要解決的三個難題在于,第一,題目要解對,現(xiàn)在GPT結(jié)果經(jīng)常出現(xiàn)錯誤;第二,解題步驟要穩(wěn)定、清晰,現(xiàn)在GPT的解題步驟每次都不一樣,而且生成內(nèi)容經(jīng)常很冗余;第三,解題要講得有趣、個性化,現(xiàn)在GPT的解釋過于“學術(shù)”和機械,對孩子的學習體驗很不友好。
周楓則認為,數(shù)學大模型是大家都想投入的方向,但只是給數(shù)學大模型“投喂”再多的內(nèi)容,都不適用于數(shù)學領(lǐng)域,它背后涉及的是一些數(shù)學原理性的問題,現(xiàn)在的大模型還不具備這樣的能力,但這仍是一個值得研究的方向。
鈦媒體APP了解到,新東方、作業(yè)幫等教培巨頭內(nèi)部,也已經(jīng)把目光盯緊大模型,但目前暫未有公開落地的成果。
(本文首發(fā)鈦媒體APP,作者|李程程)
關(guān)鍵詞: