通用人工智能(AGI)猶如星辰大海,吸引著學(xué)界和業(yè)界同行者不懈探索,并不斷取得新突破。但前進(jìn)的路上仍然充滿未知,如能突破研究機(jī)構(gòu)與學(xué)科的藩籬,讓研究者在開放的科學(xué)社區(qū)中碰撞思想,將有望加速催生顛覆性的科學(xué)突破。
本文系上海人工智能實(shí)驗(yàn)室主任、首席科學(xué)家,清華大學(xué)惠妍講席教授周伯文于2025年6月13日在首屆明珠湖會(huì)議所作的開場(chǎng)報(bào)告。
科學(xué)社區(qū)的力量:創(chuàng)新的搖籃
歡迎各位專家與青年朋友參加明珠湖會(huì)議。
我們今天正式啟動(dòng)了一個(gè)全新的科學(xué)社區(qū)——星河社區(qū)。首先我想分享幾個(gè)故事,跟大家探討一下,為什么需要科學(xué)社區(qū)的力量。
眾所周知,現(xiàn)代科學(xué)起源于英國(guó),英國(guó)現(xiàn)代科學(xué)的一個(gè)典型標(biāo)志是英國(guó)皇家學(xué)會(huì),它成立于1660年,是世界上歷史最悠久、從未中斷的科學(xué)學(xué)會(huì)。但其實(shí)它有著更久遠(yuǎn)的淵源——一群科學(xué)家在1618年發(fā)起了非正式運(yùn)行的“隱形學(xué)院”(Invisible College)——這種緊密的交流塑造了近代科學(xué)精神。例如,英國(guó)皇家學(xué)會(huì)成員中,牛頓奠定了經(jīng)典力學(xué)基礎(chǔ),霍金則在黑洞理論和宇宙學(xué)中揭示了時(shí)空的奧秘。
科學(xué)研究離不開思想碰撞。另一方面,現(xiàn)在追求創(chuàng)新鏈和產(chǎn)業(yè)鏈的融合,在產(chǎn)業(yè)鏈,也一樣需要碰撞和交流。
1765年,工業(yè)革命的發(fā)源地英國(guó)伯明翰誕生了一個(gè)社區(qū)——這也印證了科學(xué)先行、技術(shù)跟隨的理念。這一社區(qū)最早的發(fā)起人有瓦特等在工業(yè)革命史留下名字的人,他們以組織晚餐俱樂部的形式定期聚會(huì)。聚會(huì)時(shí)間往往選擇在滿月之夜,因?yàn)樵跊]有路燈的情況下,月光可以幫他們照亮回家的路——這個(gè)團(tuán)體因而取名為“月光社”(Lunar Society)。“月光”社孕育了許多著名人物,如“熱力學(xué)之父”開爾文勛爵;也催生了許多突破性的發(fā)明發(fā)現(xiàn),如博爾頓與瓦特公司(Boulton & Watt)對(duì)蒸汽機(jī)的改造推動(dòng)了第一次工業(yè)革命。
時(shí)鐘撥轉(zhuǎn)到20世紀(jì),在計(jì)算機(jī)領(lǐng)域,美國(guó)高級(jí)研究計(jì)劃局(Advanced Research Project Agency)在1960年代資助了眾多美國(guó)計(jì)算機(jī)科學(xué)領(lǐng)域的研究。其中一項(xiàng)劃時(shí)代的工作是阿帕網(wǎng)(ARPANET)——全球互聯(lián)網(wǎng)的鼻祖。
阿帕網(wǎng)還帶來了一個(gè)“副產(chǎn)品”。
最初的“阿帕網(wǎng)”,由西海岸的4個(gè)節(jié)點(diǎn)構(gòu)成,包括加州大學(xué)洛杉磯分校(UCLA)、斯坦福研究院(SRI)、加州大學(xué)圣巴巴拉分校(UCSB)和猶他大學(xué)(UTAH)。后來阿帕網(wǎng)陸續(xù)擴(kuò)展到其他大學(xué)。
在計(jì)算機(jī)歷史的重要著作《The Dream Machine》(夢(mèng)想機(jī)器)中,記錄了個(gè)人計(jì)算機(jī)和互聯(lián)網(wǎng)誕生背后關(guān)鍵的一群人,其中的一個(gè)故事是:阿帕網(wǎng)各個(gè)節(jié)點(diǎn)所在的高校,每年會(huì)派出各自實(shí)驗(yàn)室最優(yōu)秀的青年聚在一起,既參加封閉研討,也并肩滑雪、交流談心——就好像今天的明珠湖會(huì)議一樣。這群人自稱為“阿帕社區(qū)”(ARPA Community),從美國(guó)西海岸到東海岸,橫跨美國(guó)大陸的這批青年學(xué)者在此過程中建立起了緊密的友誼和共同的目標(biāo)。
這個(gè)社區(qū)最了不起的成果之一,就是成就了一批優(yōu)秀的成員。盡管隨著時(shí)間的流逝,阿帕網(wǎng)逐漸淡出了歷史舞臺(tái),但“阿帕社區(qū)”的成員繼續(xù)協(xié)作。其中有的人從學(xué)術(shù)界進(jìn)入到產(chǎn)業(yè)界,參與創(chuàng)造出了個(gè)人計(jì)算機(jī)、GUI、面向?qū)ο缶幊?、激光打印機(jī)、點(diǎn)對(duì)點(diǎn)網(wǎng)絡(luò)、PostScript界面等劃時(shí)代的成果。這個(gè)社區(qū)有7位成員先后獲得了圖靈獎(jiǎng)。
對(duì)發(fā)現(xiàn)問題的投入,與解決問題同樣重要
基于上述出發(fā)點(diǎn),我認(rèn)為我們首先要做的是提出問題、發(fā)現(xiàn)問題。
在科學(xué)研究領(lǐng)域,對(duì)發(fā)現(xiàn)問題的投入與解決問題同樣重要——這一點(diǎn)在科學(xué)界早有共識(shí),但沒有得到足夠重視。
“阿帕社區(qū)”成員之一,艾倫·凱(Alan Kay,面向?qū)ο缶幊膛cGUI先驅(qū),2003圖靈獎(jiǎng)獲得者)曾說:相比解決問題的過程,對(duì)發(fā)現(xiàn)問題的過程進(jìn)行資助往往更重要,但這一過程往被忽視。“辛烷值”提出者、雷達(dá)系統(tǒng)設(shè)計(jì)者之一亨利·蒂澤德(Henry Tizard)認(rèn)為,“科學(xué)的秘密在于提出正確的問題,而對(duì)問題的選擇是否得當(dāng)是科學(xué)天才的重要標(biāo)志。”
另一個(gè)例子是計(jì)算機(jī)科學(xué)、數(shù)學(xué)家理查德·漢明(Richard Hamming)。由于他喜歡追著別人問“你們領(lǐng)域最關(guān)鍵的問題是什么”,因而在社交場(chǎng)合一度不太受歡迎。他這么問一方面是為了用“那你們?yōu)槭裁床谎芯窟@些問題呢?”來調(diào)侃對(duì)方,另一方面則是因?yàn)檫@個(gè)問題確實(shí)能有效引導(dǎo)人們聚焦于真正重要的問題。這兩個(gè)問題被稱為“漢明問題”(Hamming Questions)。
歷史證明,能回答這兩個(gè)問題的人都在各自領(lǐng)域大有成就,而那些不能回答的人則默默無(wú)聞。所以說,這就是提出好問題的力量。
今天,我們召開明珠湖會(huì)議,正是基于對(duì)社區(qū)力量、提出問題的重視。希望通過這個(gè)平臺(tái),聚集志同道合挑戰(zhàn)科學(xué)邊界的研究者,讓大家充分思考、討論,甚至激辯,從而發(fā)現(xiàn)問題,提出問題,并嘗試找到答案。
在會(huì)議的組織上,我們也嘗試了一系列創(chuàng)新。首先,通過引導(dǎo)報(bào)告提出問題;其次,通過“結(jié)對(duì)報(bào)告”(Pair Talk,讓觀點(diǎn)不同的人做同一個(gè)報(bào)告)凝練問題;最后,在平行論壇環(huán)節(jié)深化問題。明珠湖會(huì)議的目標(biāo)聚焦于提出問題,讓參與者拋開資金和資源限制,思考自己真正愿意研究的問題。
與其他學(xué)術(shù)會(huì)議不同的是,我們希望明珠湖會(huì)議能做到以終為始、戰(zhàn)略引領(lǐng)。因此,我們討論的問題都有明確的時(shí)間邊界,聚焦18-36個(gè)月的技術(shù)窗口期——通過這種設(shè)定,讓大家專注于真正重要的問題。
在問題導(dǎo)向的過程中,我們希望參與者專注于“干什么”,而無(wú)需受到學(xué)歷、資歷和組織架構(gòu)等因素的限制。
我們還希望結(jié)合國(guó)家在人工智能創(chuàng)新領(lǐng)域的支持,幫助大家快速落地研究成果。明珠湖會(huì)議的預(yù)期產(chǎn)出是具有顛覆性的關(guān)鍵問題清單,并初步形成敏捷部署提案。在成果落地方面,我們有豐富的載體,如上海人工智能實(shí)驗(yàn)室的開放課題、“AI4S攀登者行動(dòng)計(jì)劃”等項(xiàng)目,以及上海市和國(guó)家相關(guān)重大研究項(xiàng)目等,可以從不同的層次、資金規(guī)模和邊界條件出發(fā),為提出的問題找到適配的規(guī)劃路徑。最終沉淀下來的關(guān)鍵問題還將面向社區(qū)開放,邀請(qǐng)更多有能力的同行者進(jìn)行“答題”。
AI前沿十問:未來關(guān)鍵技術(shù)節(jié)點(diǎn)
本次會(huì)議的主題是“人工智能的多維突破與協(xié)同創(chuàng)新”,關(guān)于人工智能未來3-5年發(fā)展趨勢(shì),我嘗試總結(jié)為“三化”。
第一個(gè)是智能技術(shù)體系化。人工智能是一個(gè)非常典型的先發(fā)展應(yīng)用,后補(bǔ)充理論的一個(gè)學(xué)科,發(fā)展到現(xiàn)在這個(gè)階段,需要更體系化地去追究智能的本質(zhì),更好地去完善這個(gè)體系。
第二個(gè)是智能形態(tài)多元化。習(xí)近平總書記多次強(qiáng)調(diào)要“加強(qiáng)人工智能和產(chǎn)業(yè)發(fā)展融合”“突出應(yīng)用導(dǎo)向”“加速各領(lǐng)域科技創(chuàng)新突破”。
所以人工智能一定要產(chǎn)生不同的形態(tài),和實(shí)體經(jīng)濟(jì)、社會(huì)發(fā)展、人民生活緊密結(jié)合,隨著人工智能技術(shù)的迭代,它一定會(huì)出現(xiàn)智能形態(tài)多元化。形態(tài)多元化的核心原因,一個(gè)是場(chǎng)景豐富度的要求,另一個(gè)是因?yàn)榧夹g(shù)不完備,人工智能未來四五年中還會(huì)處于一個(gè)技術(shù)待完備的過程,這時(shí)候就需要妥協(xié),在應(yīng)用中考慮新的形態(tài)。所以這里就帶來一個(gè)新問題,要思考人工智能產(chǎn)業(yè)的形態(tài)呈現(xiàn)出來的是過程還是終局,是手段還是目的?在這一點(diǎn)上,我們要充分聽取來自學(xué)術(shù)界、產(chǎn)業(yè)界和投資界的聲音。
第三個(gè)是智能能力高階化。行業(yè)往前發(fā)展的核心動(dòng)力是智能能力必須不斷進(jìn)行高階化演進(jìn)。今天的人工智能已經(jīng)讓大家驚嘆,但我相信這僅僅是開始。高階化離不開技術(shù)體系化,離不開要素的突破,離不開對(duì)形態(tài)的理解。否則,基于中階過程去探討人工智能的高階化,就有可能走上錯(cuò)誤的道路。
以上是我針對(duì)“人工智能未來發(fā)展趨勢(shì)”的框架性思考,而針對(duì)人工智能未來關(guān)鍵技術(shù)節(jié)點(diǎn)的判斷,我總結(jié)提出了十個(gè)問題,這些問題至今還沒有確定的答案。今天借此機(jī)會(huì)與大家分享,希望可以和大家一起探討。
1、總體智能 vs 單位智能:如何平衡智能發(fā)展的質(zhì)量與效率?
我們從去年開始思考:當(dāng)前評(píng)估模型時(shí),往往關(guān)注總體智能——參數(shù)規(guī)模、訓(xùn)練數(shù)據(jù)量和排行榜排名。而忽略了另外一個(gè)也很重要的指標(biāo)——單位智能(IQ per token)。這一指標(biāo)涵蓋數(shù)據(jù)成本、計(jì)算成本和存儲(chǔ)成本,類似于經(jīng)濟(jì)學(xué)中的人均GDP概念。
在模型評(píng)估中,若能實(shí)現(xiàn)單位智能最大化,那么總體智能將會(huì)顯著提升。DeepSeek模型的工程創(chuàng)新使模型更為簡(jiǎn)潔,這種簡(jiǎn)潔本身就是智能的高級(jí)表現(xiàn)。2025年1月,上海人工智能實(shí)驗(yàn)室正式提出數(shù)據(jù)思維密度(IQPT,Intelligence Quality per Token),定義為模型平均性能與訓(xùn)練數(shù)據(jù)量的比值,可以衡量大模型訓(xùn)練數(shù)據(jù)的“投入產(chǎn)出比”。今年3月,OpenAI研究負(fù)責(zé)人諾姆·布朗(Noam Brown)也分享了單位成本智能的相關(guān)觀點(diǎn)。
2、Deep RL規(guī)?;l(fā)展的資源悖論:如何平衡“數(shù)據(jù)合成”和“算法訓(xùn)練”兩大任務(wù)的算力分配?
深度強(qiáng)化學(xué)習(xí)(Deep RL)不僅是學(xué)習(xí)手段,同時(shí)也是一條能夠產(chǎn)出高價(jià)值數(shù)據(jù)的高效路徑。在運(yùn)行過程中,它一方面會(huì)消耗一定的算力資源,另一方面卻能生成具備高精度、高密度特性的復(fù)雜推理數(shù)據(jù)。值得關(guān)注的是,這些合成數(shù)據(jù)可以反哺預(yù)訓(xùn)練環(huán)節(jié),從而顯著提升模型性能。
因此,在理想狀態(tài)下,我們可以追求效率飛輪:通過Deep RL消耗的算力與其產(chǎn)生的高質(zhì)量數(shù)據(jù)所節(jié)省的訓(xùn)練成本達(dá)成平衡。當(dāng)這個(gè)臨界點(diǎn)到來,AI或?qū)⒛芤詷O低成本自我提升,實(shí)現(xiàn)“自己訓(xùn)練自己”。
3、軟硬協(xié)同創(chuàng)新:軟件向硬件適配,還是硬件向軟件兼容?
軟硬協(xié)同的路徑國(guó)內(nèi)外存在差異,國(guó)際廠商如英偉達(dá)選擇 “軟件兼容硬件”,通過深耕CUDA生態(tài),使其軟件能夠高度適配自家硬件;而國(guó)內(nèi)目前更多是“硬件兼容軟件”,例如芯片廠商調(diào)整算子以適配軟件需求。
然而,硬件研發(fā)的周期通常要比軟件長(zhǎng)得多,這就導(dǎo)致“硬件兼容軟件”這條路徑在邏輯上遭遇了挑戰(zhàn)。學(xué)術(shù)界應(yīng)探索更高效的軟硬協(xié)同創(chuàng)新路徑,既要實(shí)現(xiàn)軟硬件在性能上的優(yōu)化,也要緊密貼合產(chǎn)業(yè)實(shí)際需求,為產(chǎn)業(yè)發(fā)展提供更有力的支持,促進(jìn)整個(gè)產(chǎn)業(yè)鏈的良性循環(huán)與升級(jí)。
4、算力受限的影響:針對(duì)應(yīng)用、迭代和顛覆性的技術(shù),算力應(yīng)如何配置?
從算力運(yùn)用的維度來看,可將其劃分為三類:
一是應(yīng)用算力(For Application),聚焦于已明確的場(chǎng)景應(yīng)用,通過加大算力投入,全力推動(dòng)科研成果實(shí)現(xiàn)產(chǎn)業(yè)落地,將理論轉(zhuǎn)化為實(shí)際生產(chǎn)力,促進(jìn)產(chǎn)業(yè)的發(fā)展與升級(jí)。
二是迭代算力(For Incremental),此類算力助力研究工作持續(xù)推進(jìn)與模型迭代優(yōu)化,例如依據(jù) Scaling Law 投入算力開展模型訓(xùn)練等相關(guān)工作。
三是創(chuàng)新算力(For Disruptive),其核心作用在于對(duì)非主流想法進(jìn)行驗(yàn)證,積極探索更多尚未被充分發(fā)掘的新技術(shù),拓展多樣化的新解決方案。
當(dāng)前,應(yīng)用算力和迭代算力相對(duì)充足,而創(chuàng)新算力嚴(yán)重不足,這對(duì)于顛覆性想法的產(chǎn)生與發(fā)展形成了潛在挑戰(zhàn)。要想避免研究走向同質(zhì)化困境,實(shí)現(xiàn)創(chuàng)新算力供給至關(guān)重要。這種供給應(yīng)當(dāng)鼓勵(lì)差異化思考,并為非主流技術(shù)路線提供支持。
5、Agent與基礎(chǔ)模型的關(guān)系:Agent是目的還是過程?如何構(gòu)建真正自主進(jìn)化的智能體?
早在2023年,我們便提出下一代大模型操作系統(tǒng)應(yīng)該是融合語(yǔ)言能力的工具平臺(tái),其實(shí)與現(xiàn)在的Agent不謀而合。Agent和基座模型是什么樣的關(guān)系?Agent是目的還是手段?這值得我們思考。
從Agent發(fā)展情況看,它是依賴于基礎(chǔ)模型的,同時(shí)還需要通過與環(huán)境和用戶的互動(dòng)不斷學(xué)習(xí)和自我改進(jìn)。當(dāng)前大多數(shù)自我改進(jìn)系統(tǒng)都陷入了“僵化學(xué)習(xí)”的困境 。DeepMind科學(xué)家喬納森·里奇恩斯(Jonathan Richens)今年6月發(fā)布論文,表明實(shí)現(xiàn)具有通用智能的智能體(AGI),必然學(xué)習(xí)到了環(huán)境的預(yù)測(cè)模型(世界模型)。無(wú)論是在動(dòng)態(tài)環(huán)境中,還是在任務(wù)復(fù)雜度日益上升的背景下,世界模型都是不可或缺的基礎(chǔ)。
人類智能的一個(gè)核心特征便是其永無(wú)止境的學(xué)習(xí)能力——不斷吸收新知識(shí)、適應(yīng)環(huán)境變化,并對(duì)過往經(jīng)驗(yàn)進(jìn)行深刻的總結(jié)、遷移與升華。智能體系統(tǒng)是否也有可能具備類似的、真正意義上的持續(xù)學(xué)習(xí)能力,甚至在此基礎(chǔ)上實(shí)現(xiàn)某種形式的“自主進(jìn)化”?
6、具身智能:超級(jí)大腦與本體的關(guān)系? 如何突破“莫拉維克悖論”?實(shí)現(xiàn)類人的具身進(jìn)化和環(huán)境自適應(yīng)?
在具身智能的研究范疇里,如何精準(zhǔn)定義 “大腦” 與 “本體” 之間的關(guān)系,已成為核心且亟待攻克的關(guān)鍵問題。人類作為“智能體”,在本體能力維度,諸如力量、速度等方面,人類相較于眾多動(dòng)物存在明顯劣勢(shì)。然而,人類卻憑借獨(dú)特的工具創(chuàng)造能力、環(huán)境交互與學(xué)習(xí)的能力,成功突破了自身生理局限,達(dá)成諸多超越想象的成就。
因此,未來的具身智能研究應(yīng)當(dāng)深入探究大腦與本體間的最優(yōu)關(guān)系,并據(jù)此制定資源投入的最佳策略。既避免“超級(jí)大腦-弱本體”的陷阱,也避免“高級(jí)本體-簡(jiǎn)單決策”的陷阱。從而推動(dòng)具身智能技術(shù)取得實(shí)質(zhì)性、突破性進(jìn)展。
7、安全可信 vs 智能:如何從Make AI Safe 到 Make Safe AI?
人工智能正以前所未有的速度發(fā)展,當(dāng)前面臨的核心挑戰(zhàn)是:如何從被動(dòng)的“彌補(bǔ)AI安全漏洞”(Make AI Safe)轉(zhuǎn)向主動(dòng)的“構(gòu)建本質(zhì)安全的AI”(Make Safe AI)?
2024年,我們提出“人工智能45°平衡律”:安全不應(yīng)是AI系統(tǒng)的后期附加功能,而必須作為核心設(shè)計(jì)原則貫穿始終。2025年,約書亞·本吉奧(Yoshua Bengio)倡導(dǎo)的“設(shè)計(jì)即安全”(Safety by Design)也反映出這一點(diǎn)。
近期,形式化AI取得較多進(jìn)展,華裔數(shù)學(xué)家陶哲軒的“Lean+AI=數(shù)學(xué)證明智能化”概念,以及創(chuàng)業(yè)公司Ndea的程序合成(program synthesis)技術(shù),都體現(xiàn)了通過數(shù)學(xué)嚴(yán)謹(jǐn)性確保系統(tǒng)行為可驗(yàn)證。形式化AI有巨大潛力,但同時(shí)也存在一定的問題:會(huì)否由于限制太強(qiáng),使系統(tǒng)靈活度下降,從而出現(xiàn)為了完成任務(wù)而“繞過安全檢查”,最終導(dǎo)致病變?自動(dòng)形式化、形式化驗(yàn)證是確保AI 100% 安全的路徑嗎?還有哪些可行的技術(shù)方案,比如Causal AI(因果人工智能)、Explainable AI(可解釋人工智能)等?真正的AI安全需要的不是完美的規(guī)范,而是具備自我修正能力的動(dòng)態(tài)安全機(jī)制。
8、高分 vs 高能:從靜態(tài)到動(dòng)態(tài)? 訓(xùn)練、評(píng)測(cè)、解決問題一體化?面向AGI的評(píng)測(cè)應(yīng)如何建設(shè)?
“AI上半場(chǎng)”聚焦于開發(fā)新的訓(xùn)練方法和模型架構(gòu),但模型任務(wù)與真實(shí)世界的“效用”存在脫節(jié),暴露出當(dāng)下評(píng)測(cè)體系“高分低能”的問題。因此“AI下半場(chǎng)”將聚焦于“現(xiàn)實(shí)世界的任務(wù)定義與評(píng)估體系重構(gòu)”。
新評(píng)測(cè)體系要從能力導(dǎo)向(構(gòu)建評(píng)測(cè)問題)到任務(wù)導(dǎo)向 (獨(dú)立/輔助人類解決現(xiàn)實(shí)世界中的高價(jià)值問題)遷移,評(píng)測(cè)和解決問題可能會(huì)變成一體化,即在訓(xùn)練中評(píng)測(cè)、在評(píng)測(cè)中訓(xùn)練,在“干中學(xué)”在“學(xué)中干”。
2025年4月,我們發(fā)布了“測(cè)試時(shí)強(qiáng)化學(xué)習(xí)”(Test-Time Reinforcement Learning, TTRL)框架研究論文,探索在沒有準(zhǔn)確標(biāo)簽的情況下進(jìn)行獎(jiǎng)勵(lì)估計(jì),驅(qū)動(dòng)模型朝著正確的方向?qū)W習(xí)。同期,Google DeepMind 強(qiáng)化學(xué)習(xí)團(tuán)隊(duì)副總裁David Silver與圖靈獎(jiǎng)得主、強(qiáng)化學(xué)習(xí)之父Richard Sutton共同發(fā)表文章《Welcome to the Era of Experience》,與TTRL框架理念相似。
9、下一代AI for Science:如何從“工具的革命”到“革命的工具”?
AI for Science要真正發(fā)揮革命性作用,必須理解科學(xué)研究的本質(zhì):研究者、研究工具、研究對(duì)象三者的交互關(guān)系。目前的AI for Science主要關(guān)注研究工具層面的單點(diǎn)效率提升(“工具的革命”),而我們需要追求的是能夠帶來科學(xué)范式轉(zhuǎn)變的“革命性工具”,并實(shí)現(xiàn)科研各環(huán)節(jié)全鏈條水平提升。下一代For Science的AI,如何從“工具的革命”變成“革命的工具”應(yīng)該是我們這一代人的使命。
如果要成為“革命的工具”,現(xiàn)在的語(yǔ)言模型是否夠用?若沒有多模態(tài)的智能涌現(xiàn),或許很難實(shí)現(xiàn)革命性的AI for Science工具。當(dāng)前的多模態(tài)模型仍然建立在預(yù)測(cè)下一個(gè)token的基礎(chǔ)上,缺乏對(duì)圖表、分子模型、公式和實(shí)驗(yàn)觀察的深度理解能力。打造能夠推動(dòng)科學(xué)突破的AI系統(tǒng),需要在多模態(tài)統(tǒng)一表征方面取得突破。
10、顛覆性架構(gòu)是什么?針對(duì)Transformer的不足,什么架構(gòu)能夠帶來根本性創(chuàng)新?
Transformer架構(gòu)自2017年問世以來,引領(lǐng)了AI領(lǐng)域的一場(chǎng)革命。從GPT系列到Claude,從DALL-E到Gemini,幾乎所有令人印象深刻的大型語(yǔ)言模型和多模態(tài)模型都建立在這一架構(gòu)之上。然而,隨著我們對(duì)AI能力的期望不斷提高,Transformer的一些內(nèi)在局限性逐漸顯現(xiàn),包括計(jì)算效率不高、上下文理解有限、推理能力存在瓶頸、難以模擬動(dòng)態(tài)系統(tǒng)等。正如愛因斯坦所言:“我們不能用制造問題時(shí)的思維方式來解決問題”。突破這些局限,可能需要全新的架構(gòu)思路。展望未來,除了Transformer自身架構(gòu)的持續(xù)迭代,未來多元架構(gòu)如何共存、互補(bǔ)和協(xié)作?針對(duì)決策智能、世界智能、生物智能等領(lǐng)域需要探索可能引領(lǐng)下一代的AI架構(gòu)。
如何實(shí)現(xiàn)戰(zhàn)略科學(xué)家“群體涌現(xiàn)”
上面討論了科學(xué)社區(qū)及提出好問題的重要性,如果我們把目光投向更聚焦的人群——戰(zhàn)略科學(xué)家,就會(huì)發(fā)現(xiàn),在許多關(guān)鍵的歷史時(shí)期,都出現(xiàn)了戰(zhàn)略科學(xué)家“群體涌現(xiàn)”的效應(yīng)。
例如,1920年代,世界上涌現(xiàn)出了一批史稱匈牙利“黃金一代”的戰(zhàn)略科學(xué)家,包括計(jì)算機(jī)之父馮·諾依曼、氫彈之父愛德華·特勒,以及錢學(xué)森的導(dǎo)師——超音速飛行之父馮·卡門等。1970至80年代PC革命,美國(guó)涌現(xiàn)出比爾·蓋茨、喬布斯等,他們均出生于1955年。如今人工智能領(lǐng)域也出現(xiàn)了頂尖科技人才集聚效應(yīng),OpenAI發(fā)布世界首個(gè)深度思考與推理大模型o1,其核心技術(shù)的七位負(fù)責(zé)人中,五位來自波蘭。
但是,戰(zhàn)略科學(xué)家人選難以在早期預(yù)判。二戰(zhàn)后,美國(guó)基礎(chǔ)研究奠基人范內(nèi)瓦·布什(Vannevar Bush)曾在給美國(guó)總統(tǒng)杜魯門的信中寫道:“戰(zhàn)略科學(xué)家的形成是一個(gè)長(zhǎng)期且復(fù)雜的過程,涉及個(gè)人智力、意愿、身體健康、精力、目標(biāo)導(dǎo)向等多個(gè)方面”。
歷史證明,戰(zhàn)略科學(xué)家往往在承擔(dān)重大任務(wù)時(shí),在有研判、有管理、有組織能力的群體中產(chǎn)生。承擔(dān)重大科研攻關(guān)項(xiàng)目是成為戰(zhàn)略科學(xué)家不可或缺的條件。以我國(guó)的“兩彈一星”工程為例,大量科學(xué)家通過參與這一國(guó)家重大科技工程,不僅發(fā)揮出其卓越的科研能力,也展現(xiàn)了非凡的戰(zhàn)略眼光和領(lǐng)導(dǎo)力。
我們一直把科學(xué)社區(qū)問題驅(qū)動(dòng)作為培養(yǎng)戰(zhàn)略科學(xué)家的輸入點(diǎn),并為戰(zhàn)略科學(xué)家成長(zhǎng)創(chuàng)造條件。當(dāng)前通用人工智能處于爆發(fā)前夜,存在非常難得的窗口期,亟待通過重大組織模式創(chuàng)新,發(fā)現(xiàn)、選拔,并培育出一批戰(zhàn)略科學(xué)家。
實(shí)驗(yàn)室廣泛鏈接國(guó)內(nèi)外優(yōu)秀科研團(tuán)隊(duì)和人才,并探索通過構(gòu)建科學(xué)社區(qū),形成戰(zhàn)略科技人才蓄水池,以問題為驅(qū)動(dòng),形成“高強(qiáng)度要素投入+高集中任務(wù)攻關(guān)+高密度人才歷練場(chǎng)”三位一體的培育模式,讓真正有潛力的青年科學(xué)家在潛心研究的過程中,持續(xù)提升前瞻性判斷、跨學(xué)科理解能力、組織領(lǐng)導(dǎo)等核心能力,最終成長(zhǎng)為戰(zhàn)略科學(xué)家。
(來源:上海人工智能實(shí)驗(yàn)室)