當(dāng)前位置：金融 >

視頻推理速度提升至10.1倍！美團(tuán) LongCat-Video正式發(fā)布并開(kāi)源

文章來(lái)源：新浪科技　發(fā)布時(shí)間： 2025-10-27 11:33:38　責(zé)任編輯：cfenews.com

+|-

(資料圖片僅供參考)

新浪科技訊 10月27日上午消息，美團(tuán)LongCat團(tuán)隊(duì)發(fā)布并開(kāi)源LongCat-Video視頻生成模型，以統(tǒng)一模型在文生、圖生視頻基礎(chǔ)任務(wù)上達(dá)到開(kāi)源SOTA（最先進(jìn)水平），并依托原生視頻續(xù)寫任務(wù)預(yù)訓(xùn)練，實(shí)現(xiàn)分鐘級(jí)長(zhǎng)視頻連貫生成，保障跨幀時(shí)序一致性與物理運(yùn)動(dòng)合理性，在長(zhǎng)視頻生成領(lǐng)域具備顯著優(yōu)勢(shì)。

近年來(lái)，“世界模型”（World Model）因讓人工智能真正理解、預(yù)測(cè)甚至重構(gòu)真實(shí)世界，被業(yè)界視作通往下一代智能的核心引擎。作為能夠建模物理規(guī)律、時(shí)空演化與場(chǎng)景邏輯的智能系統(tǒng)，“世界模型”賦予人工智能“看見(jiàn)”世界運(yùn)行本質(zhì)的能力。而視頻生成模型有望成為構(gòu)建世界模型的關(guān)鍵路徑——通過(guò)視頻生成任務(wù)壓縮幾何、語(yǔ)義、物理等多種形式的知識(shí)，人工智能得以在數(shù)字空間中模擬、推演乃至預(yù)演真實(shí)世界的運(yùn)行。

正因如此，美團(tuán)LongCat團(tuán)隊(duì)認(rèn)為，此次發(fā)布的視頻生成模型，是為探索“世界模型”邁出的第一步。未來(lái)，憑借精準(zhǔn)重構(gòu)真實(shí)世界運(yùn)行狀態(tài)的能力，LongCat模型也會(huì)融入公司近年來(lái)持續(xù)投入的自動(dòng)駕駛、具身智能等深度交互業(yè)務(wù)場(chǎng)景中，成為公司更好連接“比特世界”和“原子世界”的技術(shù)基礎(chǔ)。（羅寧）

關(guān)鍵詞：

更多資訊>>