本報(bào)訊 (記者賈麗)近日,由海淀區(qū)人民政府與北京國(guó)有資本運(yùn)營(yíng)管理有限公司聯(lián)合主辦的2026中關(guān)村論壇年會(huì)“人工智能主題日”特色主題論壇“AI未來(lái)論壇:躍遷·投資·共生”在中關(guān)村國(guó)際創(chuàng)新中心成功舉辦。論壇匯聚全球頂級(jí)投資人、產(chǎn)業(yè)領(lǐng)袖與前沿創(chuàng)新者,圍繞人工智能從技術(shù)突破邁向產(chǎn)業(yè)價(jià)值的關(guān)鍵路徑展開(kāi)深入探討。
在“前沿Tech Show”環(huán)節(jié),北京生數(shù)科技有限公司(以下簡(jiǎn)稱(chēng)“生數(shù)科技”)創(chuàng)始人、清華大學(xué)人工智能研究院副院長(zhǎng)朱軍教授發(fā)表題為《通用世界模型:連接數(shù)字世界與物理世界的橋梁》的主題演講,系統(tǒng)闡述了生數(shù)科技在通用世界模型方向的戰(zhàn)略布局與技術(shù)路徑。
通用世界模型戰(zhàn)略布局越發(fā)清晰
在長(zhǎng)期的視頻大模型的技術(shù)積累上,生數(shù)科技逐步構(gòu)建起一條清晰的通用世界模型的戰(zhàn)略布局:以基座世界模型為核心底層,向上延展出貫通數(shù)字空間與物理空間的雙軌體系,形成面向通用智能的核心基礎(chǔ)架構(gòu)。
在底層能力上,該基座世界模型基于全球首創(chuàng)的U-ViT架構(gòu),積累視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等多模態(tài)信息,構(gòu)建對(duì)世界的統(tǒng)一認(rèn)知與建模能力,為上層應(yīng)用提供統(tǒng)一的智能底座。
在數(shù)字空間,生數(shù)科技基于世界生成模型(WGM)打造視頻大模型產(chǎn)品Vidu。Vidu生成模型聚焦單時(shí)點(diǎn)模擬世界,賦能AI在數(shù)字世界的生產(chǎn)力。流式生成模型,聚焦多時(shí)點(diǎn)模擬世界,實(shí)現(xiàn)實(shí)時(shí)陪伴和交互。Vidu顯著提升了數(shù)字內(nèi)容的生產(chǎn)效率,最終實(shí)現(xiàn)數(shù)字世界的AGI。
在物理空間,生數(shù)科技基于世界行動(dòng)模型(WAM)構(gòu)建統(tǒng)一世界模型產(chǎn)品Motus。Motus作為真實(shí)世界具身智能的“大腦”,致力于解決傳統(tǒng)具身智能鏈路割裂、數(shù)據(jù)稀缺、泛化能力弱等核心痛點(diǎn),可實(shí)現(xiàn)真實(shí)世界下的零樣本泛化與跨本體適配,推動(dòng)機(jī)器人從“模塊化執(zhí)行”向“統(tǒng)一智能體”躍遷,最終實(shí)現(xiàn)物理世界的AGI。
由此,生數(shù)科技構(gòu)建起貫通理解世界、生成世界與行動(dòng)于世界的完整技術(shù)閉環(huán),使通用世界模型真正成為連接數(shù)字世界與物理世界的橋梁。
通用世界模型正成為通向AGI的重要方向
而當(dāng)前的AI系統(tǒng),雖然在單點(diǎn)能力上取得了突破,但整體上仍然是“割裂”的。有的擅長(zhǎng)生成,有的擅長(zhǎng)理解,有的用于執(zhí)行,但很少有系統(tǒng)能夠統(tǒng)一完成這三件事。如果機(jī)器要真正具備智能,就必須具備類(lèi)似人類(lèi)的世界模型能力。
在此基礎(chǔ)上,朱軍指出,通用世界模型正在成為通向AGI的重要方向。
長(zhǎng)期以來(lái),具身智能面臨“數(shù)據(jù)墻”:真實(shí)世界的軌跡數(shù)據(jù)成本高、規(guī)模小,難以支撐模型泛化。對(duì)此,朱軍提出一個(gè)關(guān)鍵判斷:視頻,是當(dāng)前最接近真實(shí)世界的數(shù)據(jù)形態(tài)。
基于這一判斷,生數(shù)科技構(gòu)建了以視頻為核心的數(shù)據(jù)體系——從海量互聯(lián)網(wǎng)視頻,到第一視角操作視頻,再到機(jī)器人數(shù)據(jù),形成一個(gè)可擴(kuò)展的數(shù)據(jù)金字塔。在這一體系下,即使缺乏大量標(biāo)注數(shù)據(jù),模型依然能夠?qū)W習(xí)到有效的行動(dòng)能力。
業(yè)內(nèi)人士認(rèn)為,在數(shù)據(jù)利用與規(guī)模擴(kuò)展方面,Motus展現(xiàn)出顯著優(yōu)勢(shì)。在數(shù)據(jù)規(guī)模擴(kuò)展實(shí)驗(yàn)中,相較國(guó)際領(lǐng)先的VLA模型Pi0.5,Motus能夠從更廣泛的異構(gòu)數(shù)據(jù)中學(xué)習(xí),并有效融合預(yù)訓(xùn)練基座模型中的多模態(tài)先驗(yàn)?zāi)芰?。在長(zhǎng)程、多步驟的復(fù)雜真機(jī)任務(wù)中,Motus進(jìn)一步呈現(xiàn)出接近人類(lèi)水平的決策邏輯與執(zhí)行穩(wěn)定性。
面向未來(lái),生數(shù)科技將繼續(xù)堅(jiān)持以原創(chuàng)技術(shù)為底座,圍繞通用世界模型持續(xù)推進(jìn)底層架構(gòu)、數(shù)據(jù)體系與應(yīng)用場(chǎng)景的協(xié)同突破。
從視頻模型到世界模型,從數(shù)字空間到物理空間,生數(shù)科技正在探索一條更完整的通用智能路徑。隨著相關(guān)技術(shù)持續(xù)演進(jìn),通用世界模型也將加快走向真實(shí)產(chǎn)業(yè)場(chǎng)景,釋放更大的技術(shù)價(jià)值與應(yīng)用潛力。
(編輯 張偉)
從大模型到智能體:中國(guó)AI是否進(jìn)入執(zhí)行時(shí)代?2026-04-01 09:53
成都讀寫(xiě)發(fā)布三大核心大模型升級(jí)成果 助力AI辦公產(chǎn)業(yè)高質(zhì)量發(fā)展2026-03-27 11:02
新一輪以舊換新落地 激發(fā)消費(fèi)新動(dòng)能
首先,一些地方在出臺(tái)與消費(fèi)品以舊換新相關(guān)的……[詳情]
版權(quán)所有《證券日?qǐng)?bào)》社有限責(zé)任公司
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營(yíng)許可證 京B2-20250455
京公網(wǎng)安備 11010602201377號(hào)京ICP備19002521號(hào)
證券日?qǐng)?bào)網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請(qǐng)仔細(xì)閱讀法律申明,風(fēng)險(xiǎn)自負(fù)。
證券日?qǐng)?bào)社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注