昨日凌晨,OpenAI用一場低調而華麗的“GPT-4”發(fā)布會震撼了世界,低調的是“公關聲量”,華麗的則是技術與應用。在這場發(fā)布會上,人們驚訝的發(fā)現,人工智能不僅能自由的編寫代碼,能承擔文本、音頻、圖像的生成任務,甚至還聽得懂“梗”,擁有人類般的幽默感。
 【資料圖】
【資料圖】
無數人震撼失語,看完這場發(fā)布會,推想科技CEO陳寬稱“人工智能領域的奇點在敲門”,著名經濟學家朱嘉明表示,OpenAI又創(chuàng)造出了一個重大科技事件,AI由此達到了前所未有的“新歷史高度”。
但實際上,OpenAI GPT-4的應用能力比它在發(fā)布會上展現的還要強大。
就在3月14日,GPT-4發(fā)布會前不久,OpenAI低調的更新了官網的“客戶故事”一欄,披露了9個已經用上GPT-4的“大客戶”,詳細的介紹了這些客戶是如何使用GPT-4的,以及GPT-4為他們帶來了什么。
這些客戶橫貫金融、助殘、語言、教育、視頻、咨詢等多個領域,包含摩根士丹利、多鄰國、可汗學院等知名企業(yè)和組織,無一例外,這些客戶均表示,“GPT-4為產業(yè)帶來了革命性的機遇”。
當AI賦能公益
Be My Eyes是一家來自丹麥的科技初創(chuàng)企業(yè),致力于為超過2.5億位盲人或弱視人群創(chuàng)造“視覺”技術。過去,他們試圖用“產品識別技術”、“語音導航技術”來幫助這些視力障礙人士,幫助他們完成數百項日常生活任務,但效果并不理想。
一個案例是網站閱讀,現在,大多數網頁都內嵌了屏幕語音閱讀器,但對盲人來說,通過語音播放技術來瀏覽網頁是痛苦的。比如購物網站,網頁中往往存在著大量無關緊要的廣告,而普通的語音播放技術只能逐字讀取,這會浪費大量的時間。此外,圖片無法被語音讀取,這也是個大問題。
而采用GPT-4則完全不同,Be My Eyes的首席技術官Jesper Hvirring Henriksen表示,GPT-4可以通過無數小時的訓練以及深度學習算法來理解網頁中的“重要”部分——哪一部分應該被閱讀或總結,GPT-4能夠以視力正常的人自然掃描邏輯總結搜索結果,并對那些無關緊要的細節(jié)予以略過。
Henriksen認為,這不僅可以簡化在線閱讀新聞等任務,還可以讓那些需要視覺輔助的人得以訪問網絡上最混亂的頁面,哪怕頁面上充斥著“垃圾彈窗”和廣告。
網絡世界外,GPT-4還能幫助視力障礙人群穿越“物理世界”。比如借助GPT-4的新視覺輸入功能,Be My Eyes開始在Be My Eyes應用程序中開發(fā)“虛擬志愿”,該應用程序可以生成與人類志愿者相同水平的上下文和理解,從而幫助視力障礙人群輕松的識別現實世界中的種種物品。
Be My Eyes的首席執(zhí)行官Michael Buckley表示:“在短時間內,我們就已經看到了GPT-4從視覺識別到語音播報的強大能力”,“這會對全球的視力障礙人群帶來深遠影響,會讓他們在生活中更大程度的獨立。”
摩根士丹利:用AI來管理金融知識
目前,摩根士丹利已經通過GPT-4來組織其龐大的金融知識庫.
摩根士丹利是全球領先的財富管理者、金融操盤手,它擁有一個擁有數十萬頁的知識內容庫,涵蓋投資策略、市場研究以及分析師見解等多個領域。海量的知識信息分布其內部網站上,大部分是PDF格式,搜集并學習這些知識需要耗費大量的時間。
而憑借GPT-4,摩根士丹利管理知識的方法出現質變。
從去年開始,該公司開始探索如何利用GPT的嵌入和檢索功能(最初是GPT-3,現在是GPT-4)來高效的利用其知識庫系統。摩根士丹利分析、數據與創(chuàng)新部門主管Jeff McMillan表示,該模型將為一個面向內部的聊天機器人提供信息閱讀與輸出能力,該機器人可以對知識庫進行全面搜索,并“有效地解鎖摩根士丹利關于財富管理的相關知識”,GPT-4的最終能將所有“庫存知識”轉化為一種“更加可用和可操作的格式”。
McMillan表示,利用好這些知識庫的內容,并將之有組織、有機的進行輸出,“你將擁有金融領域最博學的人的所有知識,而且隨用隨取?!?/p>
他說,“你可以把它想象成讓我們的首席投資策略師、首席全球經濟學家、全球股票策略師和全球其他所有分析師,這些聰明的‘分析師’每天隨時待命,隨時解答你的困惑,這對我們公司來說是一種變革性的能力?!?/strong>
McMillan將這種變革分為三個部分。
第一部分是GPT-4“幾乎瞬間訪問、處理和合成內容的非凡能力”。GPT-4接受了互聯網上大量的文本訓練,并能在單詞、句子、概念和思想之間建立關系。
第二部分是摩根士丹利的“智力資本”。該公司成立于近100年前,每年發(fā)表數千篇論文,豐富的知識儲備為摩根士丹利創(chuàng)建了一個獨特的內部知識存儲庫。通過GPT-4,摩根士丹利可以高效低成本的對知識進行處理和解析。
最后一部分是員工。摩根士丹利龐大的財務顧問團隊以及他們在為客戶服務方面的專業(yè)知識能夠被更好的利用起來,摩根士丹利將由此能服務更多的客戶群體。
McMillan表示,“OpenAI可能是迄今為止將人工咨詢和AI技術結合起來的最好實踐者,這賦予了摩根士丹利強大的力量。我們?yōu)榇烁冻隽司薮蟮呐?,而我們得到的回報與付出成正比?!?/p>
冰島政府:用GPT-4保護冰島語言
冰島是北大西洋中部的一個島國,擁有充滿活力的科技產業(yè)和蓬勃發(fā)展的旅游業(yè)。然而,盡管該國約37萬公民中的大多數人都說英語或其他第二語言,但與美國和歐洲的融合已經使該國的母語,冰島語,處于危險之中。
如今,越來越多的人擔心,在幾代人的時間里,如果冰島語不能在快速的數字化面前保持應用能力,這種語言可能會面臨事實上的滅絕。
冰島語深受冰島人的喜愛,為了保護冰島語,冰島政府設有一個語言計劃部,負責為新思想創(chuàng)造冰島術語,而不是從其他語言中采用所謂的“外來詞”。
在保護冰島語上,冰島政府的最新嘗試是引入GPT-4。通過與OpenAI合作,冰島政府正在讓冰島語煥發(fā)新生。
用GPT幫助冰島語復興并不容易。OpenAI的GPT模型是基于互聯網上的大量文本進行訓練的。因此,大多數模型的訓練集都是英語和其他主要語言,這意味著GPT在較小的語言中沒有相同的能力或理解廣度。
隨著時間的推移,這些模型得到了改進,但它們并不能始終提供清晰正確的冰島語翻譯,所以在過去的GPT3中,人工智能對冰島語的翻譯與寫作常常充滿錯誤。即使是GPT-4,在產生冰島語的過程中也充斥著語法錯誤、“翻譯式語言”和不正確的文化知識。
為了改變這種狀況,參與該計劃的語言技術公司Mieeind ehf的首席執(zhí)行官Vilhjálmur Torsteinsson組織了一個由40名志愿者組成的團隊,專門對GPT-4進行正確的冰島語法和文化知識培訓。
憑借“基于人類反饋的強化學習”技術(RLHF),志愿者對GPT-4進行了訓練,他們給GPT-4一個提示,GPT-4據此生成四種答案。然后測試人員從四個回答中選擇最好的哪一個,并編輯它、完善它,幫助AI進行學習。這一過程所得到的數據將在隨后進一步用于訓練GPT-4。
在RLHF之前,對模型進行微調的過程是勞動和數據密集型的。Torsteinsson的團隊試圖用30萬個冰島語例子對GPT-3模型進行微調,但效率很低。而采用RLHF之后,GPT-4僅用100個例子就能得出結果。
現在,GPT-4已經可以生成一首冰島風格的詩,詩的靈感來源于北歐神話。此外,GPT-4還能根據提問者的語言,給出差異性回答。
當AI被用于教育:可汗學院與多鄰國的實踐可汗學院
可汗學院是一家非盈利機構,其使命是為任何人、任何地方提供免費的世界一流教育。該組織為各個年齡段的學生提供了數千門數學、科學和人文學科的課程。
可汗學院的首席學習官Kristen DiCerbo說:“學生的能力、學習進度各不相同,讓他們不斷進步是一項挑戰(zhàn),這是我們長期以來一直試圖解決的問題?!?/p>
前天,可汗學院宣布將使用GPT-4進行教學,通過將GPT-4嵌入一款名為Khanmigo的人工智能助手中,AI既可以作為學生的虛擬導師,也可以作為教師的課堂助手。
這家非營利組織于2022年開始測試OpenAI語言模型的最新版本,最初僅向有限數量的參與者提供Khanmigo試點項目,不過公眾也可以加入候補名單。
可汗學院首席學習官Kristen DiCerbo表示,“我們認為GPT-4正在開辟教育的新領域。很久以來,很多人都夢想著這種技術。它是革命性的,我們計劃負責任地進行測試,以探索它是否能有效地用于學習和教學。”
GPT-4的主要功能之一是能夠理解自由形式的問題和提示,這為可汗學院提供了向每個學生提出個性化問題的能力,以促進其進行更深層次的學習。
DiCerbo說:“我們和所有教育技術公司都在努力解決的問題之一是,如何讓學生深入思考他們正在學習的內容。所以我們要確保學生不僅僅是理解如何做題,還要真正理解題背后的概念。”
可汗學院的早期測試表明,GPT-4可能很快就能幫助學生找到所學內容的關聯性。
為教師調整GPT-4也是可汗學院的首要任務。這家非營利組織正在測試教師使用GPT-4的方法,比如編寫課堂提示或創(chuàng)建教學材料。
DiCerbo說:“更令人興奮的是,它有可能幫助教師快速、輕松地為每個學生量身定制學習?!?/p>
“我們認為教師可以使用GPT-4來了解他們班上每個學生在任何一天在可汗學院的表現。我們將在不久的將來測試這一功能?!?/p>
多鄰國
每個月有超過5000萬學習者依靠“多鄰國”學習第二語言。通過簡單的用戶界面和有趣但有競爭力的排行榜,多鄰國支持100多種課程中的40種語言。學習者可以通過在手機上輕拍和滑動,從簡單的詞匯練習過渡到復雜的句子結構。
如果一個學習者想要超越基本的熟練程度,了解語法規(guī)則是很有幫助的。但真正精通一門語言需要對話,最好是與以英語為母語的人對話,這不是每個人都能做到的。
“人工智能一直是我們戰(zhàn)略的重要組成部分,”首席產品經理埃德溫·博奇(Edwin Bodge)說?!拔覀円恢痹谟盟M行個性化課程和多鄰國英語測試。但在學習者的學習過程中,我們希望填補一些空白:對話練習,以及對錯誤的上下文反饋。”
Duolingo采用了OpenAI的GPT-4,在名為Duolingo Max的新訂閱層中增加了兩個新功能:角色扮演(AI對話伙伴)和解釋我的答案(當你犯錯誤時打破規(guī)則)。
Bodge說:“我們希望將人工智能功能深度集成到應用程序中,并利用我們的學習者喜歡的Duolingo的游戲化方面。”
多鄰國的工程師曾嘗試使用GPT-3來補充其早期聊天功能中的一些人力功能。首席工程師比爾·彼得森(Bill Peterson)說:“它已經接近準備就緒,但我們覺得還沒有到可以自信地將其集成到處理聊天復雜的自動化方面的地步。”
此前,“多鄰國”嘗試通過腳本對話與學習者“聊天”,這些對話包含了一些經典場景,比如點餐、第一次見某人或買機票。但Bodge說,“多鄰國”需要的是能夠在特定環(huán)境中與學習者進行“浸入式”對話的能力——就籃球或到達山頂的喜悅進行自由流暢的對話。GPT-4從足夠的公共數據中學習,為學習者創(chuàng)建了靈活的來回。
多鄰國的許多學習者都想學習明確的規(guī)則,該公司試圖用預先寫好的語法提示和人工智能來教他們。即使使用GPT-3,實現也很困難。教語法需要對錯誤有明確的理解,以及學習者犯錯誤的原因。解釋中的一個不正確的術語可能會錯誤地教授概念,或者讓用戶感到困惑和不滿。
此外,該團隊看到了GPT-4提供比以往任何時候都更有效和更吸引人的學習體驗的潛力,這應該會提高學習效果。此外,Peterson說GPT-4實驗的便利性簡化了整個工程過程。
“一天之內,我們就做出了一個原型,這讓我們確信這是我們想要進一步探索的東西。它能讓我們很快地從0到95%。然后我們可以手動工作,手動調整數據,以獲得最后的5%。”
AI用于咨詢公司:Yabble的實踐
Yabble為用戶提供重要的客戶洞察,為他們的業(yè)務戰(zhàn)略提供信息。使用OpenAI的GPT-3,他們可以更快地提供更豐富的結果。
任何明智的商業(yè)決策都是基于可操作的洞察力——無論是幫助確定要推出的新產品、升級現有服務,還是了解客戶喜歡(或不喜歡)某個產品的哪些方面。然而,商業(yè)領袖們都非常熟悉,為了獲得為商業(yè)戰(zhàn)略提供信息所需的見解,篩選和分析大量客戶反饋是多么困難。
從2017年開始,Yabble創(chuàng)建了一個平臺,組織可以輕松分析通過調查或客戶反饋表共享的數千個客戶數據點,并收集清晰的、有數據支持的見解。
2021年,他們增加了Yabble Query工具,允許用戶向Yabble詢問無數問題,以更好地理解自己的數據,并使用人工智能驅動的算法為用戶最重要的問題提供相關見解,這樣他們就可以花更少的時間分析數據,花更多的時間推動業(yè)務。
今年,他們推出了Yabble Count,這是一種人工智能工具,可以分析數千條評論和其他非結構化數據集,根據情緒對其進行分類,并將數據組織成主題和子主題,以了解與客戶產生共鳴的關鍵主題和反饋。
此外,雖然Yabble在幫助一些大品牌更好地了解他們的客戶方面取得了成功,但他們卻陷入了從客戶數據中開發(fā)可操作見解所需的體力勞動中。他們會花幾天甚至幾周的時間翻譯數據集,直到他們與OpenAI合作。
Yabble產品主管Ben Roe表示:“用戶喜歡最終理解大量數據和反饋表單,并以易于理解的方式呈現這些信息的輕松方式,但在某些情況下,為一些客戶分析數據集需要數周的時間。”“我們知道,如果我們想擴大現有的服務,我們需要人工智能來做很多繁重的工作,這樣我們就可以把時間和創(chuàng)造力花在其他地方——OpenAI完全符合要求。”
Waymark
Waymark正在完善他們易于使用的視頻創(chuàng)作平臺。GPT-3幫助他們不斷地制作更強大、更相關的腳本。
Waymark的創(chuàng)始人Nathan Labenz一直不滿足于基于規(guī)則的腳本編寫功能的局限性,多年來他一直在尋找更好的解決方案。“我們的高級用戶花了太多時間編輯腳本,而其他用戶會完全放棄。我致力于把劇本寫好,但這是一個巨大的挑戰(zhàn),”拉本茨說。
“在過去的五年里,我嘗試了所有可用的人工智能產品,但在GPT-3之前,我沒有發(fā)現任何一種產品可以有效地總結企業(yè)的在線足跡,更不用說寫出有效的營銷文案了?!?/p>
Waymark創(chuàng)始人Nathan Laben表示,“在過去的五年里,我嘗試了所有可用的人工智能產品,但在GPT-3之前,我沒有發(fā)現任何一種產品可以有效地總結企業(yè)的在線足跡,更不用說寫出有效的營銷文案了。”
Waymark使用經過微調的GPT-3模型來創(chuàng)建質量上不同的腳本編寫體驗。在集成GPT-3之后,用戶現在可以在幾秒鐘內收到他們業(yè)務的原始定制腳本。對于Waymark來說,從自己動手到為你做的模式的演變提升了他們的使命,讓視頻創(chuàng)作變得更容易。他們現在將自己描述為“世界上第一個自然語言視頻創(chuàng)作平臺”。
Waymark首席執(zhí)行官亞歷克斯?帕斯基-斯特恩表示:“至少可以說,我對他們印象深刻。“我們發(fā)現客戶在編輯他們的腳本上花費的時間要少得多,因為Waymark從一開始就生成了更相關、更準確、更引人注目的副本。特別是對于那些與大量本地企業(yè)合作的公司來說,這將大大節(jié)省時間和成本,使他們能夠宣傳、銷售和支持更多的本地廣告商?!?/p>
關鍵詞: