(資料圖片僅供參考)
新浪科技訊 10月27日上午消息,美團(tuán)LongCat團(tuán)隊(duì)發(fā)布并開(kāi)源LongCat-Video視頻生成模型,以統(tǒng)一模型在文生、圖生視頻基礎(chǔ)任務(wù)上達(dá)到開(kāi)源SOTA(最先進(jìn)水平),并依托原生視頻續(xù)寫任務(wù)預(yù)訓(xùn)練,實(shí)現(xiàn)分鐘級(jí)長(zhǎng)視頻連貫生成,保障跨幀時(shí)序一致性與物理運(yùn)動(dòng)合理性,在長(zhǎng)視頻生成領(lǐng)域具備顯著優(yōu)勢(shì)。
近年來(lái),“世界模型”(World Model)因讓人工智能真正理解、預(yù)測(cè)甚至重構(gòu)真實(shí)世界,被業(yè)界視作通往下一代智能的核心引擎。作為能夠建模物理規(guī)律、時(shí)空演化與場(chǎng)景邏輯的智能系統(tǒng),“世界模型”賦予人工智能“看見(jiàn)”世界運(yùn)行本質(zhì)的能力。而視頻生成模型有望成為構(gòu)建世界模型的關(guān)鍵路徑——通過(guò)視頻生成任務(wù)壓縮幾何、語(yǔ)義、物理等多種形式的知識(shí),人工智能得以在數(shù)字空間中模擬、推演乃至預(yù)演真實(shí)世界的運(yùn)行。
正因如此,美團(tuán)LongCat團(tuán)隊(duì)認(rèn)為,此次發(fā)布的視頻生成模型,是為探索“世界模型”邁出的第一步。未來(lái),憑借精準(zhǔn)重構(gòu)真實(shí)世界運(yùn)行狀態(tài)的能力,LongCat模型也會(huì)融入公司近年來(lái)持續(xù)投入的自動(dòng)駕駛、具身智能等深度交互業(yè)務(wù)場(chǎng)景中,成為公司更好連接“比特世界”和“原子世界”的技術(shù)基礎(chǔ)。(羅寧)
關(guān)鍵詞:
營(yíng)業(yè)執(zhí)照公示信息 聯(lián)系我們:55 16 53 8 @qq.com 關(guān)于我們 財(cái)金網(wǎng) 版權(quán)所有 cfenews.com