6月6日,2025北京智源大會(huì)在京啟幕。伴隨著多項(xiàng)全球前沿的人工智能成果發(fā)布,包括圖靈獎(jiǎng)獲得者、明星AI企業(yè)創(chuàng)始人在內(nèi)的數(shù)百位全球青年科學(xué)家、人工智能頂尖學(xué)者和產(chǎn)業(yè)專(zhuān)家齊聚北京,在這場(chǎng)科技盛會(huì)中共同繪制人工智能產(chǎn)業(yè)未來(lái)“導(dǎo)航圖”。
AI“破壁”加速進(jìn)入物理世界
當(dāng)一個(gè)咖啡杯放在桌子的邊緣,人和AI會(huì)各自作何反應(yīng)?不少AI大模型看到的可能是“白色的咖啡杯在桌上,上面有一些文字”。而更具時(shí)空預(yù)測(cè)能力的人類(lèi)則會(huì)基于現(xiàn)實(shí)信息進(jìn)行預(yù)判——“咖啡杯在桌子的邊緣,很危險(xiǎn)”,并知道需要從外向內(nèi)的方向拿取杯子來(lái)避免它掉落。
“人工智能正在加速?gòu)臄?shù)字世界走向物理世界,這是對(duì)大模型技術(shù)發(fā)展趨勢(shì)的判斷,也是‘悟界’系列大模型推出的底層原因�!敝窃囱芯吭涸洪L(zhǎng)王仲遠(yuǎn)說(shuō),AI從數(shù)字世界跨向物理世界時(shí)必須突破兩者之間的隔閡,其中最重要的隔閡和邊界就是對(duì)空間和時(shí)間的感知。而此次智源發(fā)布的原生多模態(tài)世界模型Emu3,就具備這種在物理世界中理解和推理的能力。
據(jù)悉,目前全球眾多人工智能機(jī)構(gòu)都在積極探索原生多模態(tài)技術(shù)。什么叫“原生”?人類(lèi)與現(xiàn)實(shí)世界的互動(dòng),通常需要涉及語(yǔ)言、視覺(jué)和音頻等被業(yè)界稱(chēng)為“多模態(tài)”的信息。王仲遠(yuǎn)告訴記者,過(guò)去的多模態(tài)大模型往往是先學(xué)習(xí)“語(yǔ)言”再訓(xùn)練其處理圖像、聲音等其他模態(tài)信息的能力,而在接觸其他模態(tài)信息的過(guò)程中,原本已達(dá)到“博士”水平的模型能力可能會(huì)降至“大學(xué)”甚至“高中”水平。
相比之下,“原生”多模態(tài)模型則是在模型訓(xùn)練初始階段,就將文字、圖像、聲音,乃至腦信號(hào)等各種模態(tài)數(shù)據(jù)都納入其中進(jìn)行訓(xùn)練,能讓模型像人一樣更“融會(huì)貫通”地理解世界。
除了原生多模態(tài)世界模型Emu3,此次智源研究院發(fā)布的“悟界”系列大模型成果,還包括腦科學(xué)多模態(tài)通用基礎(chǔ)模型見(jiàn)微Brainμ、跨本體具身大小腦協(xié)作框架RoboOS 2.0與具身大腦RoboBrain 2.0以及全原子微觀(guān)生命模型OpenComplex2。
從微觀(guān)生命體到具身智能體,“悟界”系列大模型試圖揭示生命機(jī)理本質(zhì)規(guī)律,構(gòu)建人工智能與物理世界交互基座。王仲遠(yuǎn)透露,以Brainμ為例,在與腦機(jī)接口企業(yè)強(qiáng)腦科技的合作中,Brainμ實(shí)現(xiàn)了首次在便攜式消費(fèi)級(jí)腦電系統(tǒng)上重建感覺(jué)信號(hào),智源正與北京生命科學(xué)研究所、清華大學(xué)、北京大學(xué)、復(fù)旦大學(xué)等機(jī)構(gòu)合作,探索Brainμ在科學(xué)、工業(yè)等領(lǐng)域的應(yīng)用。
北京AI核心企業(yè)數(shù)超2400家
除了大模型“大腦”,作為連接人工智能與現(xiàn)實(shí)世界的重要載體,具身智能機(jī)器人也成為AI行業(yè)的關(guān)注熱點(diǎn)。
時(shí)而單腿側(cè)踢、時(shí)而雙臂交替出拳,宇樹(shù)G1機(jī)器人在舞臺(tái)上表演起敏捷帥氣的格斗“組合拳”;“我中午又熱又餓,給我搞點(diǎn)吃的”,聽(tīng)到顧客的指令后,銀河通用的具身大模型機(jī)器人Galbot在琳瑯滿(mǎn)目的零食貨架前為顧客推薦了酸奶和果凍,并有條不紊地拿取送到人手中;曾在全球首個(gè)人形機(jī)器人半程馬拉松中奪得冠軍的天工2.0也不閑著,在現(xiàn)場(chǎng)為大家準(zhǔn)備起了茶點(diǎn)……在2025北京智源大會(huì)的舞臺(tái)上,近兩年科技圈的“頂流”人形機(jī)器人組團(tuán)上臺(tái)亮絕活,贏得滿(mǎn)堂觀(guān)眾喝彩。
這些明星機(jī)器人,有不少都是來(lái)自北京的企業(yè)或機(jī)構(gòu)。以Galbot為例,它的同伴目前已經(jīng)在北京的7處無(wú)人藥店上崗。銀河通用創(chuàng)始人兼CTO王鶴透露,今年將在北京、上海、深圳開(kāi)100家這樣的無(wú)人藥店�!跋嘈乓院笤诔欣锾幚碛唵�、在車(chē)廠(chǎng)里配料,人形機(jī)器人都能當(dāng)家做主�!蓖斛Q說(shuō)。
“在人工智能領(lǐng)域,北京始終走在創(chuàng)新的最前沿,努力在人工智能發(fā)展進(jìn)程中尋找新的歷史坐標(biāo)�!笔锌莆�、中關(guān)村管委會(huì)相關(guān)負(fù)責(zé)人介紹,近年來(lái),北京堅(jiān)持主流路線(xiàn)與顛覆性路線(xiàn)并重,持續(xù)支持人工智能技術(shù)創(chuàng)新,并堅(jiān)持大模型垂直開(kāi)發(fā)與推廣并重,積極推動(dòng)人工智能應(yīng)用創(chuàng)新。
記者從會(huì)上獲悉,2024年北京人工智能的核心企業(yè)數(shù)突破2400家,核心產(chǎn)業(yè)規(guī)模近3500億元,均占全國(guó)一半。
尖峰對(duì)話(huà)共議人機(jī)共生
在展示成果的同時(shí),這場(chǎng)國(guó)際性的AI交流盛會(huì)還吸引眾多頂尖學(xué)者、產(chǎn)業(yè)專(zhuān)家圍繞多模態(tài)、深度推理、下一代AI路徑、Agent智能體、具身智能、AI產(chǎn)業(yè)、AI安全等話(huà)題展開(kāi)前瞻對(duì)話(huà)。
圖靈獎(jiǎng)得主約書(shū)亞·本吉奧提醒,當(dāng)前AI在規(guī)劃、推理等領(lǐng)域進(jìn)步飛速,部分前沿模型已顯現(xiàn)自我保護(hù)、欺騙性對(duì)齊、篡改系統(tǒng)等類(lèi)生物主體行為,若形成“智能+自主目標(biāo)+行動(dòng)能力”組合將引發(fā)失控風(fēng)險(xiǎn),甚至可能威脅人類(lèi)生存。
“要在AGI(通用人工智能)可能于5年內(nèi)達(dá)到人類(lèi)水平的緊迫時(shí)間窗口內(nèi),通過(guò)技術(shù)創(chuàng)新與全球協(xié)作筑牢安全防線(xiàn)�!北炯獖W呼吁,應(yīng)推動(dòng)全球協(xié)同治理,建立國(guó)際監(jiān)管框架與技術(shù)驗(yàn)證機(jī)制,遏制各國(guó)因競(jìng)爭(zhēng)導(dǎo)致的安全標(biāo)準(zhǔn)缺位,避免將AGI設(shè)計(jì)為人類(lèi)競(jìng)爭(zhēng)者。
AI時(shí)代,人類(lèi)如何與AI新伙伴們共生?另一位圖靈獎(jiǎng)得主理查德·薩頓提出,要以去中心化合作替代中心化控制,通過(guò)信任、協(xié)調(diào)和市場(chǎng)機(jī)制引導(dǎo)AI與人類(lèi)共生,避免因恐懼催生的限制措施。他認(rèn)為,這一路徑將實(shí)現(xiàn)AI與人類(lèi)社會(huì)的互利共贏。

關(guān)注精彩內(nèi)容