 (資料圖)
(資料圖)
去年7月,人工智能又一次進入社會大眾的視野:
Midjourney發(fā)布后,普通用戶能通過自己的提示生成非常有創(chuàng)意、高質量的圖片,持續(xù)迭代修改后,最終生成復合甚至超出用戶預期的圖片;
StabilityAI開源了Stable Diffusion模型, 隨即迅速傳播,讓開發(fā)者生態(tài)能定制開發(fā)和訓練滿足特定需求、場景、迭代速度的提示生成圖片產(chǎn)品。
隨后的11月,人工智能知名企業(yè)Open AI發(fā)布ChatGPT,ChatGPT第一次以類人類的語言模式,具備了和人對話、問答、語言理解、翻譯等語言處理能力,這又一次超出了普通用戶對認知智能能力的預期。這標志著人類在通向通用人工智能的路上又邁進了一大步。
Midjourney和ChatGPT的爆發(fā)背后孕育著什么更大的趨勢。對于信息革命、人類數(shù)字文明,是否存在比移動互聯(lián)網(wǎng)、云計算更大的海嘯級別(tsunami)變革和價值創(chuàng)造的機會?可能是會什么呢?
認知智能是AI發(fā)展的下一個前沿何為認知智能
認知人工智能(Cognitive AI),是一種旨在模擬人類認知智能的人工智能,人類的認知智能包括學習、理解、分析、問答、交流、記憶、生成、推理等能力。認知人工智能使用先進的模型、算法和機器學習技術,分析、推理、理解和學習大量數(shù)據(jù),包括結構化和非結構化數(shù)據(jù)。這些系統(tǒng)可以學習、識別、生成、或做出預測并生成類似于人類推理的見解。
人工智能下一個前沿
人工智能已經(jīng)存在了幾十年了,中國開始探索人工智能并在各種場景落地也經(jīng)歷了至少十余年;主流的人工智能還是在結構化數(shù)據(jù)的基礎上,通過傳統(tǒng)機器學習算法做分析和預測、基于特征工程做分析和推薦、或基于深度神經(jīng)網(wǎng)絡對圖像分類識別。
但由于最近大語言預訓練模型和生成模型的進展,數(shù)字世界中人工智能對于人類語言文本的理解、對話、生成,第一次達到了類人類的水平,人工智能的發(fā)展進入了認知智能的時代。
認知智能的時代已經(jīng)開啟????
底層架構、算法、模型的創(chuàng)新和快速發(fā)展,從量變到質變推動著認知智能時代開啟。推動認知智能起飛的核心因素包括AI OS、大語言模型(large language foundation model)、檢索模型(retrieval model)和預訓練、微調、Prompt 工程及各種反饋的強化學習技術。
AI OS
操作系統(tǒng)(OS)具有如下特征:(1)強抽象能力;(2)行業(yè)de facto標準;(3)基于OS建立行業(yè)基礎設施和應用生態(tài)。OS是行業(yè)生態(tài)和應用發(fā)展的最基礎的底座,PC的發(fā)展得益于windows OS,互聯(lián)網(wǎng)的發(fā)展得益于Linux,云的發(fā)展由于虛擬化OS和K8S。AI的高速發(fā)展也需要有類似特征的OS底座。
AI在大語言模型(Large language model,LLM)上是基于transformer&attention的架構,這個架構對于人類的知識及其多種表現(xiàn)形式有極強的抽象和表達能力,人類第一次在數(shù)字世界用同一個架構來表達人類各種模態(tài)的知識。
由于其強大的抽象和表達能力,這一架構已經(jīng)開始成為行業(yè)最主流的AI模型架構,除了LLM被廣泛使用外,圖片和其他模態(tài)的場景也在發(fā)展或探索中,成為基礎模型的de facto標準勢頭出眾。
這個de facto標準開始推動了基于transformer的LLM的基礎設施和行業(yè)生態(tài)的發(fā)展,而且越來越多人意識到,transformer架構與大語言模型的結合,使得基于語言的認知智能的迭代迅猛。
Large Language&retrieval models
什么是foundation model(基礎模型)?任何一個在廣泛數(shù)據(jù)上進行訓練(通常使用規(guī)模化的自監(jiān)督)的模型,都可以被調整(如微調)以適用于各種下游任務。
Large Language Model(LLM)可以理解為一個數(shù)據(jù)庫,人類第一次把歷史上所有知識,最大規(guī)模地通過高效壓縮的方式保存到這個“數(shù)據(jù)庫”里?;贚LM衍生的ChatGPT模型用人類最熟悉的自然語言對話方式,來理解用戶的意圖,用遞進式的、極其高效、開放模式去獲取知識。生成式的大模型還能通過理解人類的意圖遞進式地去生成優(yōu)質的內容。
預訓練、微調、Prompt 工程及“X”反饋的強化學習技術
認知智能基礎模型不僅是通用、開放式的智能,而且通過微調和提示工程等各種技術,讓通用認知智能模型有能力更好服務到各行各業(yè)——如金融、醫(yī)療、教育、信息科技、媒體等;各種場景——如研發(fā)、銷售、客服等。
通過各種Live使用反饋機制加上強化學習能力,知識數(shù)據(jù)庫在擴展的同時,模型和使用者(無論是人類、系統(tǒng)、還是機器)的意圖更好地對齊,在被使用過程中,模型也持續(xù)在升華。
認知智能的類人類語言處理能力、de facto技術架構、開放和通用的場景、快速的迭代進化,且能服務到專業(yè)、特定場景,這些都標志著認知智能開始進入了人工智能的主流賽道。
智能計算和AI-First SaaS將引領計算世界下一波浪潮???????信息計算時代
人類數(shù)字文明的發(fā)展依賴于計算范式的創(chuàng)新和發(fā)展。從50年的mainframe、80年代的PC、2000年的互聯(lián)網(wǎng)、2010年的移動互聯(lián)網(wǎng),到還在持續(xù)發(fā)展的云計算,這些計算范式的演進推動個人和企業(yè)的數(shù)字文明發(fā)展,而且每次變革都會帶動全球經(jīng)濟效率和規(guī)模的提升。
從mainframe到云計算是信息計算時代,把信息在數(shù)字世界中進行結構化,在數(shù)據(jù)世界中進行計算、模擬、甚至預測。信息計算的特征除了數(shù)字化、結構化外,還有確定性(deterministic)的特征,也就是同樣的數(shù)據(jù)輸入情況下,輸出的結果總是一致的,在一個已知的環(huán)境下相當確定性符合人類的預期。
何為智能計算?
智能計算是一種基于自然語言能力,以具有學習、理解、分析、問答、交流、記憶、生成、推理等類人類認知智能能力的認知模型為核心的計算范式,智能計算有如下特征:(1)具有探索性 (2)非確定性(non-deterministic,or probabilistic) (3)更高效理解人類意圖(4)認知能力至少超出人類的平均水平。智能計算時代的到來是自然語言處理技術的創(chuàng)新、發(fā)展、沉淀從量變到質變的結果。最近5年出現(xiàn)的大語言預訓練模型、對話模型、生成模型等自然語言的處理技術的創(chuàng)新,觸發(fā)了智能計算時代的到來。智能計算的核心是認知智能的能力。
何為AI-First 應用
以認知智能為核心能力開發(fā)的應用為AI-First應用,AI-First應用使得應用本身有類人類認知智能的能力,能通過智能助手應用,增強普通人的認知智能能力到更高的水平,讓機器、系統(tǒng)、人之間的交互從信息智能提升到認知智能的更高維度。人類數(shù)字文明第一次進入到認知智能,發(fā)展進入一個嶄新的階段。
AI-First 應用的出色樣板:New Bing&Edge Browser
微軟發(fā)布的New Bing和Edge Browser為未來AI-First應用展示了非常好的樣板。
AI-powered copilot -- Edge Browser’s chat&answer
在Edge Browser,AI-powered copilot能與用戶持續(xù)聊天、咨詢、問答、翻譯、改寫、生成、簡單推理;而且copilot在持續(xù)關注用戶使用網(wǎng)站的交互、返回內容和歷史,根據(jù)這個上下文自動和用戶做智能交互,給用戶嶄新的體驗。
New AI-Native search -- New Bing Search
New Bing的搜索基于下一代LLM、為搜索定制、比ChatGPT更強大,這個模型叫做Prometheus模型。這是一個由下一代AI大模型驅動的 AI-native搜索平臺,它提升搜索的相關性、能對答案做注解、提供最新的搜索結果、并提升安全性。
智能計算時代的應用
幾乎所有的應用都應該增加copilot或in-place的智能助手,通過人和智能助手的交互,在軟件中更高效、更高質量完成目標任務。
應用開發(fā)者可以更向前邁一大步,用大模型作為應用的底座,使其成為AI-native的應用,其核心能力提升至認知智能的程度。
認知智能在重新定義軟件構建的方式
人類數(shù)字文明構建的核心工具是軟件開發(fā)工具,核心承載平臺是軟件。軟件工業(yè)也需要應對變化做變革和升級。每次計算平臺發(fā)生重大變革和發(fā)展,其依賴的軟件開發(fā)模式、框架、工具鏈、計算平臺的基礎設施都會被重構。我們相信,為了更好適應智能計算時代,軟件開發(fā)的范式也會被重構,可能這次重構的幅度比預期的更大。具體會是什么形態(tài)能沉淀下來,還需要讓子彈再飛一下。
人工智能下一個前沿
RPA(robotics process automation)、低代碼工具、PaaS平臺的出現(xiàn),讓軟件開發(fā)變得更為定制化、普惠化。由于AI 生成模型的發(fā)展,像copilot之類的人工智能代碼開發(fā)輔助工具,今后能夠為軟件開發(fā)工程師提供注釋、代碼補全生成、語法建議和錯誤修復等功能,使得開發(fā)者能夠更加高效地編寫代碼。
AI-First 應用開發(fā)
在開發(fā)下一代AI-First應用的過程中所涉及的——在邏輯和交互的開發(fā)框架、工具、自動化、數(shù)據(jù)和認知模型,以及更優(yōu)化的面向AI-first的runtime,以及關聯(lián)的基礎設施,都有機會被升級和變革。
AI-First cognitive AI架構
即便人類對大腦的認知也是非常原始,不少行業(yè)從業(yè)者從理論、和工程視角探索下一代的Cognitive AI的架構,更好的支持AI-First應用。
AI-First應用的核心支柱是“認知智能模型”
AI-First應用最核心變化是什么呢?我認為其核心支柱是“認知智能模型”。
脆弱、固化的軟件
軟件是人類數(shù)字文明的平臺。但軟件是非常脆弱的,軟件的業(yè)務邏輯和數(shù)據(jù)模型根據(jù)當時的業(yè)務需求開發(fā)的,隨著每次業(yè)務需求的變化,軟件還需要修改、甚至重構;軟件同時又是非常固化的,比如在用戶交互層幾乎是固化的,不管你是第一次使用、初級用戶還是資深用戶,都只有一種交互界面,用戶有口皆碑優(yōu)秀體驗的軟件很少,在2B場景可能更稀缺。
認知智能模型是軟件的核心支柱
我認為“認知智能”模型是AI-First應用的back-bone(核心支柱),應用會從數(shù)據(jù)驅動(Data-Driven)向模型驅動(AI Model-Driven)發(fā)展。先假設軟件還是3層架構(可能這個也會發(fā)生變化):數(shù)據(jù)層、業(yè)務邏輯層、和交互層。
(1)Knowledge Layer
在數(shù)字世界中,企業(yè)業(yè)務的核心資產(chǎn)是數(shù)據(jù)和知識,這些企業(yè)獨特的知識和全方位收集的數(shù)據(jù)都會被聚合并被認知模型捕捉,這個模型是驅動企業(yè)業(yè)務場景和各種交互場景的核心模型。
(2)Business Layer
未來企業(yè)的業(yè)務層也會被認知模型所驅動,實現(xiàn)業(yè)務邏輯由認知智能驅動,企業(yè)邏輯才能更動態(tài)自適應、更好適應多變業(yè)務需求和多樣的用戶(包括員工、生態(tài)伙伴、最終用戶或客戶)需求,而不是目前現(xiàn)在的hard-coded、規(guī)則定義、甚至只依賴結構化數(shù)據(jù)的機器學習能力來實現(xiàn)業(yè)務邏輯。
(3)Interaction Layer
ChatGPT給我們展示了一個類人類智能的交互界面,智能能力非常驚艷。但交互能力還是非?;A,下一代智能交互會有很多新的想象空間。在認知智能模型驅動下,交互界面、內容、結構更是會從用戶意圖理解的基礎上,動態(tài)地、個性化地、智能地去生成和互動。
如果大家認同這個趨勢,AI-First應用的軟件架構和軟件開發(fā)的模式和stack發(fā)生變革是必然。
認知智能模型也是業(yè)務全環(huán)節(jié)視角的核心支柱
從業(yè)務視角,認知智能模型也能賦能甚至作為核心支柱驅動業(yè)務全環(huán)節(jié),從產(chǎn)品定義設計、生產(chǎn)、營銷、服務等全環(huán)節(jié)用認知智能去提升效率、提升體驗、甚至創(chuàng)造新價值。
智能計算時代企業(yè)核心競爭是企業(yè)獨特的認知智能模型
在大數(shù)據(jù)時代,行業(yè)對企業(yè)核心競爭力的共識是數(shù)據(jù)。在智能計算時代,企業(yè)的核心差異化競爭力將會是基于企業(yè)內部數(shù)據(jù)的認知智能模型。
AI-First企業(yè)應用的核心支柱是認知智能模型,未來企業(yè)應用如電商、CRM、EPR、service、HCM等,幾乎所有場景都有機會被認知智能模型賦能驅動、甚至重構。
從產(chǎn)品開發(fā)、生產(chǎn)、市場、銷售、內部管理、產(chǎn)品交付到售后服務、上游供應鏈,來自于企業(yè)經(jīng)營全環(huán)節(jié)的信息時代沉淀的所有結構化和非結構化數(shù)據(jù),以及從認知智能時代開始積累的企業(yè)獨特的知識都將成為企業(yè)特有的認知智能模型的訓練數(shù)據(jù)。而且企業(yè)數(shù)字系統(tǒng)、公司內部、與用戶和合作伙伴互動過程中產(chǎn)生的反饋數(shù)據(jù),也能通過強化學習讓企業(yè)自有的認知智能模型持續(xù)的迭代、升級,模型和使用者或系統(tǒng)的意圖更好的對齊。
企業(yè)獨特的認知智能模型將會是企業(yè)品牌、定位、文化、知識、核心能力的完整數(shù)字化表達和保存。這可能是一個系列模型,代表了企業(yè)各個部門、角色、崗位的認知能力,去賦能甚至代替企業(yè)內部各個角色之間的交流、企業(yè)和客戶、企業(yè)和生態(tài)合作伙伴的交流和服務;也許是一系列信息系統(tǒng)核心支柱模型,能更好地服務信息系統(tǒng)的認知智能維度的決策能力;也許是個企業(yè)培訓的虛擬培訓師,能持續(xù)地in-context、在工作場景中持續(xù)培訓、指導、能力增強企業(yè)員工的模型。
Salesforce最近發(fā)布了Salesforce EinsteinGPT,EinsteinGPT是第一個生成AI的CRM模型,AI生成的內容會超級高效地覆蓋銷售、市場、服務、電商、IT等企業(yè)環(huán)節(jié)。相信任何有競爭力的企業(yè)都必須有自己企業(yè)獨特的認知智能模型,驅動企業(yè)方方面面的環(huán)節(jié),為員工、客戶、合作伙伴提供無以倫比的體驗、效率和價值創(chuàng)造。
智能世界和信息世界的融合
從50年代人類發(fā)明了第一臺電腦起,信息科技的創(chuàng)新并賦能著各行各業(yè),不僅為企業(yè)降本增效,而且為企業(yè)開拓了新的revenue stream和商業(yè)模式,在此發(fā)展過程中,信息數(shù)字世界創(chuàng)造和沉淀了大量的信息科技基礎設施、開發(fā)工具、行業(yè)應用、數(shù)字能力等, 如云計算的各種彈性計算的能力編排能力;企業(yè)管理軟件如CRM、ERP、Service Cloud;各種企業(yè)內部和個人的效率、協(xié)同辦公軟件;基于大數(shù)據(jù)的各種BI、報表、洞察分析軟件,企業(yè)內部集成和工作流引擎和可視化的編排能力。為了企業(yè)內部系統(tǒng)之間、以及和外部生態(tài)更高效、更實時的協(xié)同,甚至構建了企業(yè)數(shù)字生態(tài)以更好服務其客戶,企業(yè)內部能力以各種API形式開放給第三方。 企業(yè)為此投了大量的人力和財力構建這些非常寶貴、極具價值的企業(yè)核心競爭力。
隨著以認知智能為更高維度的智能計算時代到來,智能世界和信息世界會各取所長并相互融合:
(1)基于認知智能提供了下一代更自然、更智能、更平民化的人-系統(tǒng)智能交互界面
以LLM為基礎的對話模型,對語言的理解和生成能力已經(jīng)具備類人類智能的水平,使得人機進行類似人類自然語言水準和質量的對話變成了可能,這個對話不僅能滿足人類更高效挖掘新知識的需求,還可能通過下一代的對話智能模型,以人類最自然的語言交互模式,使得人類和信息世界的各種數(shù)字系統(tǒng)和應用自由交流和交互。
(2)更靈活、更開放、更動態(tài)、更個性化地去實現(xiàn)企業(yè)內部流程和工作方式的重構
數(shù)字世界的信息系統(tǒng)接口和界面相對是固化的,但是企業(yè)內部流程和工作方式會隨著業(yè)務、效率的需求在持續(xù)變化,企業(yè)員工在合適的權限下通過自然語言互動的方式,未來將能夠根據(jù)業(yè)務和個性的需求對企業(yè)內部系統(tǒng)、工作流程、數(shù)據(jù)流進行更靈活、更動態(tài)的重構。是未來企業(yè)integration、RPA在AI-first理念下的變革。
智能世界類似人的大腦,信息世界類似的人的肢體去和物理世界感知、執(zhí)行和反饋,智能世界和信息世界是相互想成,才構成一個完整的人類數(shù)字文明世界。這兩個世界的融合不僅能為企業(yè)員工開拓新的體驗和價值。這個融合也會發(fā)生在個人日常生活、溝通、社交等開放社會的生活場景中,人類的日常生活由此也有嶄新的體驗和新高度的生命幸福感。
誰會是智能計算時代的英雄豪杰??
PC計算時代造就了微軟,互聯(lián)網(wǎng)計算時代時代造就了谷歌、淘寶,移動互聯(lián)網(wǎng)時代造就了tiktok/抖音、美團、Uber,云計算時代造就了AWS、salesforce;智能計算時代未來,誰會成為引領這個時代新的英雄豪杰?我們都非常期待。雖然我們現(xiàn)在沒法預判是誰,但是我們相信所有的2C和2B的場景在智能計算時代都值得重新被思考、探索、加強甚至重新被打造。
關鍵詞: