一、世界人工智能發(fā)展歷程和方向——大勢所趨
人工智能(Artificial Intelligence,簡稱AI)是指在機器上實現(xiàn)相當乃至超越人類的感知、認知、行動等智能。按照智能能力的不同,人工智能通??煞譃橥ㄓ萌斯ぶ悄芎蛯S萌斯ぶ悄埽虮环Q為強人工智能和弱人工智能。目前對通用人工智能有兩種理解:一種是通用性的人工智能(GeneralArtificial Intelligence,簡稱GAI)是媒體和社會公眾的一般理解,指的是能夠處理很多任務的智能 ; 另一種則是人工智能專業(yè)領域的準確名稱,即人工通用智能(Artificial General Intelligence,簡稱 AGI),是指在人工智能所有方面都達到人類水平,能夠自適應地應對外界環(huán)境挑戰(zhàn),完成人類能完成的所有任務的人工智能。
長期以來,人工智能系統(tǒng)都是為了實現(xiàn)特定或?qū)S媚繕巳蝿盏闹悄埽瑢儆谌跞斯ぶ悄芑驅(qū)S萌斯ぶ悄芊懂牎?018年以來,大規(guī)模預訓練模型(簡稱大模型)通過在海量無標注數(shù)據(jù)上依托強大算力資源訓練能適應一系列下游任務,實現(xiàn)了通用性的人工智能(GAI),拉開了通用人工智能的序幕,但當前仍沒有達到真正的人工通用智能(AGI)。
(一)人工智能發(fā)展歷程
人工智能的概念最早于1956年在美國達特茅斯學院召開的夏季研討會上被正式提出??v觀人工智能近七十年的發(fā)展歷程,大體上可分為三個階段。
第一階段以符號主義邏輯推理證明為中心。該階段主要研究在形式化表示方法基礎上,通過邏輯推理或啟發(fā)式程序來模擬人類推理能力,解決代數(shù)應用題求解、幾何定理證明和機器翻譯等問題。第二階段是以人工規(guī)則的專家系統(tǒng)為核心。該階段的研究焦點就是將領域?qū)<业闹R歸納成人工規(guī)則,進而進行輔助決策,專家系統(tǒng)技術在這一時期得到快速發(fā)展。第三階段是以大數(shù)據(jù)驅(qū)動的深度學習為核心。該階段有效整合算法、算力和數(shù)據(jù),推動人工智能的研究重心從如何“制造”智能轉(zhuǎn)移到如何“習得”智能。2006年,加拿大多倫多大學杰弗里·辛頓教授提出“深度學習算法”,為新一輪人工智能的發(fā)展奠定了理論和方法基礎。2012年,杰弗里·辛頓教授與學生提出的深度學習神經(jīng)網(wǎng)絡模型 AlexNet 在ImageNet 圖像識別挑戰(zhàn)賽上以巨大的優(yōu)勢擊敗了其他非神經(jīng)網(wǎng)絡模型,成為深度學習興起的標志。2016—2021年,谷歌開發(fā)的系列圍棋機器人AlphaGo 和 AlphaZero,不僅在比賽中先后戰(zhàn)勝了世界冠軍李世石和柯潔,后來還取得了擂臺賽不敗的戰(zhàn)績。同時,該公司研發(fā)的 AlphaFold2在蛋白質(zhì)結(jié)構預測問題上達到接近人類實驗解析的水平,解決了困擾生物學界50年的“蛋白質(zhì)折疊”難題。近十年來,基于大數(shù)據(jù)的深度學習模型和算法得到大規(guī)模應用,在機器翻譯、智能問答、博弈對抗等領域取得了巨大成功,人工智能進入加速發(fā)展期。
以上三個階段中,前兩個階段的主要思路是設計新的理論和算法,用機器模擬人的智能,盡管在理論方法上取得了進展,但由于目標過高,與應用結(jié)合不夠,使得人工智能發(fā)展幾經(jīng)起伏。第三階段基于大數(shù)據(jù)的深度學習技術已成為當前人工智能的主流發(fā)展路徑,在計算機視覺、自然語言處理、智能語音等技術領域?qū)崿F(xiàn)了規(guī)模應用。其中,計算機視覺是人工智能技術中應用最為廣泛的領域。計算機視覺是指通過計算機對圖像或視頻進行處理,使其能夠自動識別、分析和理解圖像或視頻中的信息。2015年,由微軟亞洲研究院何愷明、孫劍、任少卿、張祥雨提出的深度殘差學習網(wǎng)絡 ResNet 成為計算機視覺領域具有里程碑意義的代表性技術。ResNet 的出現(xiàn),使得超過上百層的更深層網(wǎng)絡可以更有效地進行訓練,推動了深度學習技術不斷探索能力極限。目前,ResNet 已經(jīng)成為計算機視覺任務的首選架構,例如圖像分類、物體檢測和圖像分割等。2023年,基于為人工智能作出的基礎性貢獻,ResNet 的四位作者獲得了未來科學大獎。
(二)當前人工智能發(fā)展新趨勢
2018年以來,大模型首先在自然語言處理領域取得突破,以 ChatGPT為代表的現(xiàn)象級產(chǎn)品拉開了通用人工智能的序幕,引發(fā)了新一輪人工智能發(fā)展浪潮。當前人工智能發(fā)展已由小模型時代邁向大模型時代。
大模型是“大數(shù)據(jù) + 大算力 + 強算法”結(jié)合的產(chǎn)物,至少具有三個特點:一是規(guī)模大,神經(jīng)網(wǎng)絡參數(shù)規(guī)模要達到百億以上;二是涌現(xiàn)性,要產(chǎn)生預料之外的新能力,這是人工智能發(fā)展近70年來,最具里程碑意義的新特性;三是通用性,能夠解決各類問題。
美國 OpenAI 公司的 GPT(生成型預訓練 Transformer 模型)系列大模型是當前國際大模型領域的領先代表。2022年11月,OpenAI 發(fā)布的人工智能對話大模型 ChatGPT 表現(xiàn)出了驚人的智能水平,能夠長時間進行自然流暢的對話,同時還能夠高質(zhì)量撰寫幾乎任何類型的書面材料,可以完成很多需要創(chuàng)造性思考的任務,一經(jīng)發(fā)布就受到全球用戶廣泛關注,成為歷史上增長最快的消費應用,引發(fā)了人工智能的“iPhone 時刻”。
ChatGPT之所以能表現(xiàn)出色,主要歸因于幾個關鍵方面的技術和策略。第一,其采用了大規(guī)模的訓練數(shù)據(jù),特別是互聯(lián)網(wǎng)文本數(shù)據(jù),以捕獲豐富的知識和語言模式。第二,模型基于高效的 Transformer 架構,該架構通過自注意力機制,能夠有效處理輸入序列中各位置信息間關聯(lián)依賴關系,極為適合自然語言處理任務。第三,ChatGPT通過多任務學習,提高了其在多樣化問題上的泛化能力和生成能力。第四,模型還針對特定任務進行了微調(diào),以更好地適應和解決特定領域或場景下的問題。第五,通過利用強化學習等技術進行模型調(diào)優(yōu),ChatGPT 在特定任務上的輸出更加接近人類的習慣,進而表現(xiàn)得以進一步提升。這些技術的融合和應用,使ChatGPT成為了文本問答任務中的佼佼者,激發(fā)了公眾對強人工智能未來發(fā)展的無限遐想。
除語言能力以外,大模型也在迅速擴展視覺、聽覺、具身(有身體的智能,能與環(huán)境進行交互)、行動等其他通用智能能力,在向多模態(tài)方向發(fā)展的同時,也將逐漸進入現(xiàn)實世界,發(fā)展實體智能,引發(fā)下一波人工智能發(fā)展浪潮。
但是,也應看到,大模型等通用人工智能技術在給世界經(jīng)濟社會發(fā)展帶來巨大機遇的同時,也帶來了難以預知的各種風險和復雜挑戰(zhàn)。大模型是高度復雜的人工智能系統(tǒng),特點是難以預測,當前取得的進展基本上是通過經(jīng)驗模式取得,大模型背后的智能發(fā)生和涌現(xiàn)機理尚不清晰,國際社會對如何構建一個安全的人工智能系統(tǒng)仍知之甚少。當前以大模型為代表的通用性的人工智能(GAI)已顯現(xiàn)出倫理道德、數(shù)據(jù)安全等一系列風險,需要加強安全監(jiān)管。未來,面對伴隨著人工通用智能(AGI)的到來可能會引發(fā)的人類生存性風險,更需要嚴加防范。加強通用人工智能治理已成為世界各國面臨的共同問題。
隨著人類探索通用智能發(fā)展路徑的越發(fā)清晰,全球正處于“AGI”(準強人工智能) 的前夜,處在一個不確定性的狀態(tài),未來需要對大模型基礎原理、安全與價值觀對齊、人工通用智能(AGI)風險控制策略等方面開展深入研究,促進人工智能技術造福于人類。
(三)世界大國加快人工智能戰(zhàn)略與政策部署
當前,人工智能已成為國際競爭的新焦點和經(jīng)濟發(fā)展的新引擎,世界主要發(fā)達國家把發(fā)展人工智能視為提升國家競爭力、維護國家安全的重大戰(zhàn)略,紛紛出臺人工智能規(guī)劃和相關政策,力圖在新一輪國際科技競爭中掌握主導權。
各國從國家戰(zhàn)略層面強化人工智能布局。美國圍繞人工智能研發(fā)和國家安全,陸續(xù)出臺《國家人工智能研發(fā)戰(zhàn)略規(guī)劃》等相關戰(zhàn)略和政策,力求鞏固其世界領先優(yōu)勢;法國發(fā)布《國家人工智能戰(zhàn)略》,著力推動健康、交通、環(huán)境、國防安全等領域的智能化;歐盟自2010年以來就把實現(xiàn)智能增長作為其三大增長目標之一。2018年4月發(fā)布了《歐洲人工智能》,系統(tǒng)地提出了歐盟的人工智能發(fā)展戰(zhàn)略規(guī)劃。同月,發(fā)布了《人工智能合作宣言》,標志著歐洲人工智能進入合作發(fā)展的新階段;德國通過《聯(lián)邦政府人工智能戰(zhàn)略要點》,提出成為全球領先的人工智能科研場,實現(xiàn)人工智能德國造;英國發(fā)布《國家人工智能戰(zhàn)略》,從數(shù)據(jù)獲取、人才培養(yǎng)、科技研發(fā)和產(chǎn)業(yè)應用等方面打造人工智能強國;俄羅斯發(fā)布《2030年前人工智能國家發(fā)展戰(zhàn)略》;日本提出建設“超智能社會5.0”,不僅要提升產(chǎn)業(yè)競爭力,還要實現(xiàn)國民生活智能化。
各國競相加大人工智能研發(fā)投入。美國政府2017財年向人工智能非保密項目投入研發(fā)經(jīng)費超過20億美元,在2022年累計投入達249億美元,預計2028年投入將破千億美元;2021財年美國國防預算提案在人工智能研發(fā)領域的投資總額為8.41億美元 , 較2020財年的7.8億美元增長約8%。法國在2022年前在人工智能項目中投資15億歐元。韓國提出要從“IT強國”發(fā)展為“人工智能強國”, 計劃在2030年將韓國在人工智能領域的競爭力提升至世界前列。根據(jù)預算,相關措施若得以實施,到2030年,韓國將在人工智能領域創(chuàng)造455萬億韓元 ( 約合2.7萬億元人民幣 ) 的經(jīng)濟效益。
各國組建新型人工智能研發(fā)機構。美國國家科學基金會協(xié)同聯(lián)邦機構,包括國土安全部、國防部、教育部、農(nóng)業(yè)部等,聯(lián)合成立了25家國家人工智能研究院;歐洲計劃建立一所世界級人工智能研究所,在英國等多個歐洲國家設立科研中心;法國提出新建人工智能中心,并組建人工智能研究網(wǎng)絡 ;英國擴建阿蘭·圖靈研究所,啟動數(shù)據(jù)倫理與創(chuàng)新中心建設,成立新的人工智能技術學院。全球各大人工智能跨國公司和領軍企業(yè)也在加快布局人工智能研發(fā)中心。
各國加緊推動人工智能治理體系建設。聯(lián)合國自2018年起專門成立了人工智能與機器人中心,研究人工智能的管控問題;美國國會建議成立人工智能安全委員會,負責對人工智能、機器學習的發(fā)展和相關技術開展審查;歐盟簽署《人工智能合作宣言》,發(fā)布《歐盟機器人民事法律規(guī)則》,共同應對人工智能在倫理、法律等方面的挑戰(zhàn);2019年起,歐盟持續(xù)加強對人工智能應用和治理的關注,于當年4月出臺了《可信賴的人工智能倫理準則》,為實現(xiàn)可信賴的人工智能設定了一個倫理框架。
目前,全球人工智能發(fā)展正處于由弱人工智能向強人工智能過渡的階段,人工智能已然成為主導國家戰(zhàn)略競爭力的重要支撐和推動科技革命的重要力量。未來,“人工智能+ 高速移動互聯(lián)”將成為人類社會生活的基本場景。著眼更長遠的未來,強人工智能將會帶來顛覆性、全局性影響,誰率先實現(xiàn)突破,誰就會掌握未來發(fā)展的主導權。如果我國在新一輪人工智能發(fā)展中落后,將會在全球競爭中處于不利地位。
二、中國人工智能發(fā)展現(xiàn)狀和前景——大有可為
習近平總書記指出,“把新一代人工智能作為推動科技跨越發(fā)展、產(chǎn)業(yè)優(yōu)化升級、生產(chǎn)力整體躍升的驅(qū)動力量,努力實現(xiàn)高質(zhì)量發(fā)展”。2017年,國務院發(fā)布《新一代人工智能發(fā)展規(guī)劃》,確立了人工智能三步走目標,將人工智能上升為國家戰(zhàn)略。此后,相關部委和各地方政府推動《新一代人工智能發(fā)展規(guī)劃》加快實施,同時,科技界、產(chǎn)業(yè)界、投資界協(xié)同發(fā)力,推動我國人工智能發(fā)展進入跨越趕超的關鍵時期。
(一)我國人工智能基礎理論和部分關鍵技術實現(xiàn)突破,人工智能與經(jīng)濟社會融合不斷深入
經(jīng)過多年的持續(xù)研發(fā)布局,我國人工智能科技創(chuàng)新體系逐漸完善,智能經(jīng)濟和智能社會發(fā)展不斷深入,取得顯著成效。
一是人工智能基礎理論快速積淀。近年來,國內(nèi)學者在問題求解、演化計算、模式識別、專家系統(tǒng)、智能控制等經(jīng)典人工智能領域多有建樹。特別是在新興的深度學習理論和推理算法方面開展了大量研究,例如,北京大學提出深度跨媒體學習方法,顯著提高了跨媒體檢索的準確率;南京大學提出的“深度森林”模型是國際上第一個非神經(jīng)網(wǎng)絡和 BP(反向傳播)算法的深度學習方法。在類腦計算方面加強布局,類腦芯片、類腦計算系統(tǒng)、類腦應用等取得積極進展;中國科學院在腦機接口領域取得突破,研發(fā)了目前運行最快的頭皮腦電(EEG)腦機接口系統(tǒng);華為公司上線了氣象大模型,在一系列氣象學家關心的精度指標和極端天氣預報中都展現(xiàn)出優(yōu)勢,具有強大競爭力和巨大潛力。
二是人工智能部分關鍵技術躋身世界先進水平。本輪人工智能技術爆發(fā)初期,我國在中文信息處理、生物特征識別、機器翻譯、智能處理器、自動駕駛和智能機器人等技術方向上緊跟世界前沿,實現(xiàn)了部分人工智能關鍵技術突破。麻省理工學院第十七任校長拉斐爾·萊夫評價認為,中國在人臉識別和語音識別等人工智能領域居世界領先地位。主要包含了以下階段性成果:中國科學院研發(fā)推出全球首款商用深度學習專用處理器“寒武紀”芯片,在運行主流智能算法時性能功耗效率大幅超越中央處理器(CPU)和圖形處理器(GPU);商湯科技的圖像識別技術、科大訊飛的語音識別與合成技術和語言翻譯技術的產(chǎn)業(yè)化水平目前處于世界前列,受到國際認可。
在計算機視覺方面也取得重大原始創(chuàng)新。北京大學改寫了持續(xù)近兩個世紀的曝光成像原理,發(fā)明了脈沖攝影原理,用比特序列逼近高速光電子流,研制出超高速視覺芯片和相機,實現(xiàn)了超高速、高動態(tài)、無模糊連續(xù)清晰成像。它建立了脈沖視覺算法體系并研制出超高速系統(tǒng),采用常規(guī)光電器件和芯片工藝實現(xiàn)高超聲速過程連續(xù)清晰成像和實時跟蹤識別。其專利獲中美歐日韓授權,有望從源頭重塑計算機視覺技術和產(chǎn)業(yè)體系。
在人工智能基礎軟硬件方面,華為發(fā)布了基于達芬奇架構的昇騰910和昇騰310兩款人工智能芯片,力爭打造以芯片為載體、從底層算法到應用開發(fā)的完整生態(tài),為全球開發(fā)者和企業(yè)提供新的選擇,也為我國企業(yè)提供了安全保障。在此基礎上,鵬城實驗室推出了“鵬城云腦Ⅱ”和正在研制“鵬城云腦” 下一代設施?!谤i城云腦Ⅱ”是基于華為國產(chǎn)人工智能芯片打造的,作為國內(nèi)首個全面自主可控的E級智能算力平臺,具有國際領先的人工智能算力水平,已經(jīng)在多個國際榜單上取得冠軍。該平臺約70%的機時對外開放共享,已支撐近千個國產(chǎn)人工智能模型訓練任務與人工智能算法發(fā)布,成為我國最重要的開放共享、自主可控的人工智能大模型訓練平臺之一。而“鵬城云腦”下一代設施將是一款面向6G超寬帶通信的智能化工具平臺,采用了超大規(guī)模、高性能計算的體系架構,在芯片和系統(tǒng)全鏈條上均按照低功耗來設計,預計在2025年完成?!谤i城云腦”大科學裝置將進一步推動我國人工智能國產(chǎn)自主產(chǎn)業(yè)生態(tài)的發(fā)展,必將成為支撐新一代智能網(wǎng)絡通信創(chuàng)新研究的重大科學基礎設施。
三是人工智能加速與千行百業(yè)融合發(fā)展。智能制造方面,正在大力推進智能制造工廠建設,已實現(xiàn)產(chǎn)品個性化定制;智能醫(yī)療方面,已研發(fā)人工智能醫(yī)學影像產(chǎn)品,可用于篩查早期食管癌,其檢出率高于醫(yī)生借助內(nèi)窺鏡平均檢出率;智慧城市方面,“城市大腦”已應用于杭州城市交通管理,可有效減少區(qū)域通行時間;智能物流方面,人工智能技術被應用于改進物流系統(tǒng),分揀效率超過人工分揀的10倍多;智能交通方面,首都機場采用人工智能技術實現(xiàn)在50秒內(nèi)完成1700架次航班的停機位安排,降低了飛機延誤率,停機位利用率提高10%;智能安防方面,廣州利用人臉識別技術幫助發(fā)現(xiàn)及抓獲犯罪嫌疑人。
四是人工智能發(fā)展的創(chuàng)新生態(tài)初步構建。科技部在自動駕駛、城市大腦、智能醫(yī)療、智能語音、智能視覺等領域已構建起國家級開放創(chuàng)新平臺,助力中小企業(yè)科技創(chuàng)新,推動行業(yè)技術進步和產(chǎn)業(yè)升級。某智能語音平臺開發(fā)者團隊數(shù)量超過80萬家,已形成了覆蓋技術研發(fā)、基礎平臺、物聯(lián)網(wǎng)、智能硬件等完整人工智能產(chǎn)業(yè)鏈;某自動駕駛開放平臺合作伙伴超過120余家,形成了全球規(guī)模最大的自動駕駛生態(tài),覆蓋了包括整車廠、零部件廠商、出行服務商、初創(chuàng)企業(yè)、通信企業(yè)、高校和地方政府等產(chǎn)業(yè)鏈各個環(huán)節(jié)。同時,人工智能領域的眾創(chuàng)空間、孵化器、加速器快速發(fā)展,創(chuàng)業(yè)孵化體系逐步完善。
(二)中美引領大模型發(fā)展,我國語言大模型與美國差距正在逐步縮小,視覺、多模態(tài)、具身等新一代大模型有望實現(xiàn)齊頭并進
目前,國際大模型領域已形成美國引領,中國緊跟的格局。根據(jù)中國科學技術信息研究所2023年5月發(fā)布的《中國人工智能大模型地圖研究報告》,從全球已發(fā)布的大模型分布來看,中國和美國大幅領先,超過全球總數(shù)的80%,中國在大模型數(shù)量方面位居全球第二。
中國大模型研發(fā)呈現(xiàn)蓬勃發(fā)展態(tài)勢。截至2023年5月已發(fā)布79個大模型,大部分為語言大模型。
國際上的基礎大模型主要分為語言、視覺、多模態(tài)等主要類別。其中,在語言大模型方面,OpenAI 的 GPT 系列和谷歌 PaLM 2等已形成領先優(yōu)勢,我國已研發(fā)出智源“悟道·天鷹”、百度“文心”、華為“盤古”、“鵬城·腦?!薄⒗锿x等語言大模型,但與海外頂尖水平仍有一定差距。隨著人工智能模型開源生態(tài)的繁榮,中美大模型的差距將逐步縮小。
在視覺和多模態(tài)大模型方面,我國有望扭轉(zhuǎn)跟隨局面,實現(xiàn)中美齊頭并進。視覺大模型上,智源研究院創(chuàng)新研發(fā)路徑,首創(chuàng)“上下文圖像學習”“以視覺為中心”作為核心建模思想,用圖像理解、解釋、輸出圖像,研發(fā)出視覺通用多任務模型 Painter,對 Painter 模型針對物體分割任務作出優(yōu)化后,研發(fā)出國際首個利用視覺提示完成任意分割任務的通用視覺模型 SegGPT,已成為與 Meta 發(fā)布的基礎圖像分割模型 SAM 齊名的國際視覺大模型關鍵里程碑成果。多模態(tài)大模型上,智源研究院研發(fā)出首個打通多模態(tài)輸入到多模態(tài)輸出的統(tǒng)一多模態(tài)預訓練模型 Emu,超越了此前 DeepMind 的多模態(tài)大模型Flamingo,刷新八項性能指標,并且模型能力覆蓋圖像與文本的生成及視頻理解,能完成任意圖生文和文生圖的多模態(tài)任務。中國科學院自動化所研發(fā)出的三模態(tài)(圖文音)大模型“紫東太初”目前已具有全模態(tài)能力,達到國際先進水平。
(三)我國人工智能整體發(fā)展已進入全球第一梯隊
美國智庫信息技術與創(chuàng)新基金會(ITIF)2019年發(fā)布《誰在人工智能競賽中獲勝:中國、歐盟還是美國?》報告,從人才、研究、企業(yè)發(fā)展、應用、數(shù)據(jù)、硬件六個維度,系統(tǒng)性對比中美歐人工智能技術創(chuàng)新與生態(tài)構建能力。2021年1月,ITIF 發(fā)布該報告的2021年更新版本,指出美國仍然保持著巨大的總體領先優(yōu)勢,但中國得分相比于2019年有明顯增長,總排名反超歐盟上升至第二位,僅次于美國。我國的應用場景豐富,相比國外有一定優(yōu)勢。但是,報告也顯示,中國在人工智能研究、人才、企業(yè)發(fā)展等方面與美國相比差距明顯。
根據(jù)英國媒體機構Tortoise Media發(fā)布的2023年全球人工智能指數(shù)排名,目前人工智能領域綜合情況全球排名前三的國家分別是美國、中國和新加坡。 其中,中國在運營環(huán)境和政府戰(zhàn)略方面領先于美國,在基礎設施、科研、發(fā)展、商業(yè)緊隨其后,但在人才方面與美國差距較大。
另據(jù)中國科學技術信息研究所2023年7月發(fā)布的《2022全球人工智能創(chuàng)新指數(shù)報告》,按照2022年人工智能創(chuàng)新指數(shù)得分排名,將46個參評國家分為四大梯隊,其中,第一梯隊國家得分為50分以上,只有美國和中國進入,中國人工智能創(chuàng)新指數(shù)已連續(xù)三年保持全球第二的水平。
(四)我國人工智能發(fā)展的優(yōu)勢條件
目前,我國在人工智能技術上持續(xù)深耕、快速積累,在政策、數(shù)據(jù)和市場應用上具有一定優(yōu)勢。
一是強有力的戰(zhàn)略引領和政策支持。2017年《新一代人工智能發(fā)展規(guī)劃》發(fā)布后,開啟了我國人工智能發(fā)展的系統(tǒng)部署。《規(guī)劃》發(fā)布后,各部門和地方積極推動落實,國家發(fā)改委、教育部、科技部、工信部等部門相繼出臺多項舉措,北京、上海、天津、重慶、廣東等近20個省市出臺了人工智能規(guī)劃和行動計劃,紛紛加大研發(fā)投入,設立研發(fā)機構,制定人才引進、財稅優(yōu)惠等配套政策,帶動企業(yè)加快智能化步伐,產(chǎn)學研協(xié)同推進人工智能發(fā)展的格局初步形成。
二是海量的數(shù)據(jù)資源提供支撐。我國互聯(lián)網(wǎng)數(shù)據(jù)資源快速增長,截至2022年底 , 網(wǎng)民規(guī)模超10.6億,我國移動電話用戶規(guī)模為16.83億戶,其中5G 移動電話用戶達5.61億戶。網(wǎng)民使用網(wǎng)絡購物的比例超過55%,手機支付用戶規(guī)模達到5.27億人。特定應用領域數(shù)據(jù)規(guī)模龐大,醫(yī)療門診總量每年達到81.8億人次,每年有3億人次做計算機斷層掃描(CT),10億人次做數(shù)字化成像(DR);公共和私人領域裝有1.76億個監(jiān)控攝像頭 ;年度快遞業(yè)務量超過400億件 ;每年國內(nèi)旅游人數(shù)超過50億人次。
三是豐富的應用需求孵化應用場景。我國具有全球規(guī)模最大、較為成熟的互聯(lián)網(wǎng)市場,人工智能在互聯(lián)網(wǎng)領域的應用空間廣闊。我國作為全球制造業(yè)大國,各細分領域都面臨轉(zhuǎn)型升級,對人工智能應用具有巨大需求。我國新型城鎮(zhèn)化加速推進,城鎮(zhèn)規(guī)模不斷擴大,利用人工智能改進城市基礎設施、提升城市治理水平潛力巨大。同時,我國老齡化問題日益突出,居民收入水平不斷提升,消費結(jié)構加快升級,對醫(yī)療、教育、養(yǎng)老等智能化產(chǎn)品和服務需求迫切。
四是具有潛力的青年人才快速成長聚集。我國加大對人工智能人才培育。2018年,國家自然科學基金委新設人工智能一級學科代碼 F06,加大對人工智能基礎研究的支持;國務院學位辦2022年底新設智能科學與技術一級學科,全國各大高校加快布局人工智能學院,擴大本科和研究生培養(yǎng)規(guī)模。我國人工智能學者數(shù)量大幅增加。根據(jù)清華大學AMiner數(shù)據(jù)庫分析,截至2023年6月,全球人工智能學者數(shù)量共計16.4萬人(這里“人工智能學者”指在國際人工智能領域頂級會議或頂級期刊上發(fā)表過至少一篇論文的科研人員),其中,我國人工智能學者約3.6萬人,占比21.9%,與美國人工智能學者數(shù)量(3.7萬人)相當。在學者成果產(chǎn)出方面,2022年,我國人工智能論文總量和高被引論文數(shù)量已居世界第一,并且我國人工智能專利數(shù)量略微領先于美國和日本。
(五)我國人工智能發(fā)展的薄弱環(huán)節(jié)
一是人工智能基礎理論和原創(chuàng)算法差距較大。我國人工智能研究起步晚,原創(chuàng)性貢獻不多。近年來,隨著各國加快人工智能理論創(chuàng)新探索,模型和方法不斷有新的突破,包括深度學習模型、生成對抗網(wǎng)絡等新的重大成果和原創(chuàng)性理論貢獻仍以西方國家為主。大模型構建、訓練、調(diào)優(yōu)對齊、推理部署等多個流程使用的主要算法及核心技術大部分來自美國。雖然我國在人工智能領域內(nèi)高影響力論文數(shù)量增長明顯,頂級論文和重大理論創(chuàng)新還主要源自美國、英國、加拿大等國家。
二是在高端芯片、關鍵部件、高精度傳感器等方面基礎薄弱。在圖形處理器(GPU)、專用集成電路(ASIC)和現(xiàn)場可編程門陣列(FPGA)等人工智能芯片方面,英偉達、英特爾、高通、超威等歐美國家企業(yè)占據(jù)壟斷地位:英偉達在GPU領域占據(jù)了全球近84%的市場份額,賽靈思(Xilinx)和阿爾特拉(Altera)占據(jù)了 FPGA 市場將近61.9%的份額。美國波士頓動力公司的人形機器人產(chǎn)品(Atlas)依靠其在高精度傳感器和運動控制算法上的巨大優(yōu)勢,目前已連續(xù)完成臺階跳躍、后空翻、單腿三級跳等高難度動作,在智能感知和智能行為融合上達到新的高度。
三是尚未形成具有國際影響力的人工智能開源開放平臺。當前,國際巨頭企業(yè)紛紛建立人工智能開放平臺,打通硬件—系統(tǒng)—產(chǎn)業(yè)鏈條,主導建設創(chuàng)新生態(tài)。我國在面向特定應用領域已經(jīng)陸續(xù)建立了國家級人工智能開放平臺,但在機器學習等通用開源算法平臺方面布局不夠,且對產(chǎn)業(yè)鏈的帶動性不足,國際影響力不夠。
四是數(shù)據(jù)量大質(zhì)低,缺乏高質(zhì)量大規(guī)模中文數(shù)據(jù)集。在當前深度學習階段,數(shù)據(jù)對人工智能發(fā)展至關重要,特別是在大模型時代,數(shù)據(jù)對大模型智能水平的影響差不多要超過60%。我國的數(shù)據(jù)資源極其豐富,但是數(shù)據(jù)的量大質(zhì)低,很多不能用于模型訓練。另外,書籍期刊等版權數(shù)據(jù)、互聯(lián)網(wǎng)平臺數(shù)據(jù)等高質(zhì)量數(shù)據(jù)割裂、封閉、不易獲取,導致我國可用于大模型訓練的高質(zhì)量中文數(shù)據(jù)集相對缺乏。目前,我國大模型訓練主要依賴國際開源數(shù)據(jù)集,國際數(shù)據(jù)集中的中文內(nèi)容少且不規(guī)范,Common Crawl 中的中文數(shù)據(jù)不足5%,基于這些數(shù)據(jù)集訓練的大模型自然是“英文思維”。建設高質(zhì)量大規(guī)模中文數(shù)據(jù)集,是我國通用人工智能發(fā)展的基本前提。國內(nèi)已有部分機構開展了相關工作,如智源研究院建設了全球最大的中文數(shù)據(jù)集 WuDaoCorpora,其中文本數(shù)據(jù)集超過了5T,已對外開放低風險數(shù)據(jù)200G,被全球數(shù)百個大模型科研團隊使用。
五是算力資源短缺。大模型的快速發(fā)展和持續(xù)迭代對算力的需求呈爆炸性增長,由于 GPU 等芯片的供給增長緩慢,導致全球范圍內(nèi)的算力短缺問題普遍存在,我國的算力短缺問題尤為突出。目前,我國大模型研發(fā)所需的算力資源主要來源于智算中心、超算中心和云計算中心。其中,智算中心普遍算力規(guī)模不高。目前我國有超過30個城市正在建設或提出建設智算中心,算力規(guī)模目標大部分在1000P 左右。超算中心中國產(chǎn)人工智能芯片數(shù)量較多,但由于很多是早年部署,型號早、性能低,難以用于大模型訓練。云計算中心的商業(yè)任務占用率較高,千億級模型的私有化部署成本接近每年2000萬—3000萬元,成本較高。
六是高水平人才不足。根據(jù)清華大學 AMiner AI 2000 全球最具影響力人工智能學者榜單,在全球人工智能高影響力學者(全球最具影響力人工智能學者入選依據(jù) :近十年間,人工智能的20個子領域里論文被引量分別排名前100的學者上榜,各領域排名前10的學者當選當年最具影響力學者)中,美國人數(shù)最多,近三年均穩(wěn)步在1100人以上,占比約六成;中國位列第二,數(shù)量穩(wěn)步增加,超過了230人,占比一成多,但與美國的差距并沒有縮小,美國是中國的近五倍。
從以上幾點來看,我國發(fā)展人工智能既有很好的基礎和優(yōu)勢,也面臨巨大挑戰(zhàn),需要探索一條適合我國國情的發(fā)展道路。應堅持科技引領、應用驅(qū)動的戰(zhàn)略導向,以促進人工智能與經(jīng)濟社會深度融合為主線,以提升科技創(chuàng)新能力為主攻方向,全面推動人工智能應用。應通過科技引領和應用驅(qū)動的雙向發(fā)力,實現(xiàn)我國人工智能在理論上盡快補上短板,技術上自主可控,產(chǎn)業(yè)上占領制高點,全面增強經(jīng)濟創(chuàng)新力和國際競爭力。
三、全面推進中國人工智能高質(zhì)量發(fā)展——勇毅前行
2023年4月28日召開的中共中央政治局會議指出,要重視通用人工智能發(fā)展,營造創(chuàng)新生態(tài),重視防范風險。我國人工智能發(fā)展要深刻把握國際通用人工智能技術發(fā)展趨勢,開展前瞻性技術研究,著力實現(xiàn)彎道超車。同時,要加強政策、人才、底層基礎軟硬件、開源開放等生態(tài)環(huán)境的打造,營造良好環(huán)境。另外,要加強風險研判,積極推進人工智能治理,推動我國新一代人工智能持續(xù)健康發(fā)展。
(一)持續(xù)完善我國人工智能規(guī)劃和政策體系
面對國際通用人工智能發(fā)展新形勢、新機遇、新問題、新挑戰(zhàn),圍繞《新一代人工智能發(fā)展規(guī)劃》提出的我國到2030年實現(xiàn)人工智能達到世界領先水平的戰(zhàn)略目標,《新一代人工智能發(fā)展規(guī)劃》在新時期實施時應突出新變化,形成新的規(guī)劃任務方向。另外,要針對我國通用人工智能發(fā)展的薄弱環(huán)節(jié)和發(fā)展需求,在技術研究、資源開放、場景建設、人才發(fā)展等方面制定相關支持政策,打造人工智能高質(zhì)量發(fā)展的支撐政策體系。
(二)加強通用人工智能基礎理論研究和關鍵技術研發(fā)
前瞻布局通用人工智能前沿技術研究,開展大模型基礎原理和新架構探索,視覺、視頻、多模態(tài)、具身等下一代大模型研究,利用大模型解決重大科學問題,形成具有國際影響力的通用人工智能原創(chuàng)理論體系。
引領通用人工智能關鍵核心技術創(chuàng)新,重點突破分布式高效深度學習框架、大規(guī)模認知與推理、可控內(nèi)容生成、高效低成本訓練與推理等關鍵算法研發(fā),建立我國通用人工智能技術創(chuàng)新體系。
(三)夯實人工智能基礎軟硬件生態(tài)底層基礎
推動國產(chǎn)人工智能芯片實現(xiàn)突破,面向通用人工智能技術發(fā)展需求,能夠全面支撐大模型訓練、多模態(tài)處理、科學計算等場景算力需求,并探索可重構、存算一體、超規(guī)格高算力智能芯片等新型架構芯片,提供支撐我國人工智能發(fā)展的算力保障。加強自主開源深度學習框架研發(fā)攻關,在大模型分布式訓練和多端多平臺推理部署等方面提升核心能力,研發(fā)模型開發(fā)、訓練、壓縮、推理全流程工具。支持人工智能芯片和深度學習框架開展廣泛適配和融合優(yōu)化,打造人工智能國產(chǎn)基礎軟硬件深度協(xié)同生態(tài)。
(四)加強數(shù)據(jù)、算力等資源的匯聚及共享
建立多層次數(shù)據(jù)開放體系。相關政府部門出臺政策措施,推動出版社、雜志社、圖書館、博物館、檔案館等版權數(shù)據(jù)或公共數(shù)據(jù)機構,以及互聯(lián)網(wǎng)平臺對外有序開放數(shù)據(jù)用于人工智能技術研發(fā),打破數(shù)據(jù)壁壘。建立我國大規(guī)模高質(zhì)量中文數(shù)據(jù)集建設的長效機制,整合匯聚大型互聯(lián)網(wǎng)企業(yè)、大模型研發(fā)企業(yè)、數(shù)據(jù)服務企業(yè)、大型出版社、圖書館、主流媒體、行業(yè)組織等機構,建設大規(guī)模高質(zhì)量的語言、語音、圖像、視頻和多模態(tài)數(shù)據(jù)集,以及醫(yī)療、交通等行業(yè)數(shù)據(jù)集,為我國通用人工智能長期健康發(fā)展提供基礎保障。
夯實算力基礎設施建設。加強智算中心建設,逐步提高算力設施國產(chǎn)化率,為大模型研究提供高性能計算資源和服務。推動中國算力網(wǎng)建設,實現(xiàn)國家級超算中心、智算中心、“東數(shù)西算”數(shù)據(jù)中心的互聯(lián)互通,實現(xiàn)全國大型算力的協(xié)同調(diào)度和高效計算,推動云、網(wǎng)、算等資源融為一體,形成支撐數(shù)字經(jīng)濟發(fā)展的國家級算力基礎設施和統(tǒng)一算力大市場,為人工智能技術創(chuàng)新和產(chǎn)業(yè)智能化轉(zhuǎn)型提供普惠算力。
(五)加強人工智能風險預判和治理體系建設
我國在通用人工智能監(jiān)管上走在國際前列,2023年7月出臺了全球首部生成式人工智能規(guī)范性政策文件《生成式人工智能服務管理暫行辦法》,為其他國家相關政策的制定提供了借鑒。伴隨通用人工智能技術的快速發(fā)展,我國應堅持發(fā)展和安全并重的原則,建立并完善符合我國人工智能發(fā)展需求的治理體系。一是加強對人工通用智能(AGI)發(fā)展安全風險的研判,根據(jù)風險問題適時調(diào)整我國通用人工智能發(fā)展策略。二是建立我國特色的敏捷治理體系。通用人工智能發(fā)展迅速,新應用新模式層出不窮,應建立符合我國經(jīng)濟、社會發(fā)展特色的敏捷治理體系,保持政策靈活性,留足制度發(fā)展空間,以保障技術的長遠健康發(fā)展。三是開展風險防范技術研究,以技術監(jiān)管技術,針對大模型基礎原理、安全與價值觀對齊、人工通用智能(AGI)風險控制策略等方面開展深入研究,促進人工智能技術造福于人類。
推動建立健全的人工智能監(jiān)管方面相關的法律、法規(guī)和標準,是保障人工智能高水平提升、高質(zhì)量發(fā)展的重要一環(huán),應逐步完善人工智能的安全保障和倫理規(guī)范,保障人工智能的安全和可信度。一是制定和完善人工智能相關法律、法規(guī)和標準,涉及人工智能開發(fā)、使用、應用等各個環(huán)節(jié),明確相關責任和法律后果,規(guī)范人工智能的發(fā)展和使用。二是加強人工智能的安全保障,強化人工智能的安全性研究和技術保障,防范人工智能被惡意利用和攻擊,確保人工智能系統(tǒng)的穩(wěn)定運行和數(shù)據(jù)的安全。三是建立人工智能的倫理規(guī)范,明確人工智能的道德責任和社會責任,避免人工智能帶來的負面影響和倫理風險。四是建立健全人工智能的監(jiān)管機制,包括人工智能評估、審查、監(jiān)督、監(jiān)測等各個環(huán)節(jié),加強對人工智能的監(jiān)管和治理,保障人工智能的安全和可信度。五是加強人工智能的公眾參與,包括社會組織、專家學者、公民等各方面的參與,加強社會監(jiān)督和民主監(jiān)督,推動人工智能的良性發(fā)展。
(六)強化人工智能在服務企業(yè)升級中發(fā)揮更大作用
人工智能作為一項滲透性極強的顛覆性技術,對實體經(jīng)濟及社會生活的方方面面都具有極其重要的意義,是建設現(xiàn)代化經(jīng)濟體系、實現(xiàn)高質(zhì)量發(fā)展的重要支撐。企業(yè)作為社會經(jīng)濟活動的基本單位,直面市場、服務市場,是最活躍的創(chuàng)新力量。要實現(xiàn)傳統(tǒng)產(chǎn)業(yè)改造,新興產(chǎn)業(yè)不斷壯大,現(xiàn)代化產(chǎn)業(yè)體系加快形成,就要打好一套“組合拳”。一是龍頭企業(yè)要發(fā)揮引領作用,打造開放、協(xié)同、共享的創(chuàng)新生態(tài)系統(tǒng),特別是構建一個包括從基礎研究到應用推廣的全鏈式人工智能創(chuàng)新生態(tài)系統(tǒng),助推傳統(tǒng)企業(yè)向智能化高端化轉(zhuǎn)型。二是加大對人工智能產(chǎn)業(yè)的支持和投入,通過設立人工智能創(chuàng)新基金、支持人工智能企業(yè)上市等方式,增強該類專精特新“小巨人”利用金融力量為企業(yè)不斷造血。三是搭建人工智能開放創(chuàng)新平臺,通過平臺資源和技術賦能服務企業(yè)、高校和研究院所,加速人工智能技術的研發(fā)和應用,不斷提高技術創(chuàng)新能力。四是積極引導推動數(shù)據(jù)的開放和共享,促進各個領域之間的數(shù)據(jù)融合和互通,形成全社會共建共享的數(shù)據(jù)資源庫,切實推進人工智能與實體經(jīng)濟深度融合。
(七)加強人工智能教育和人才培養(yǎng)
我國的人工智能發(fā)展,關鍵在人。培養(yǎng)具有創(chuàng)新能力和實踐能力的高素質(zhì)人才非常關鍵,可通過設立人工智能專業(yè)、加強人工智能相關領域的教育和培訓、支持高水平人才引進等,逐步構建人工智能人才培養(yǎng)體系和課程體系,提高我國人工智能人才隊伍的整體素質(zhì)。同時,政府還應積極鼓勵企業(yè)和高校合作,加強人工智能人才培養(yǎng)的實踐環(huán)節(jié),推動理論與實踐的深度融合。此外,應量身定制包括稅收優(yōu)惠、研發(fā)經(jīng)費支持、人才獎勵、高層次人才計劃等一系列政策措施,鼓勵創(chuàng)新創(chuàng)業(yè),加強對人工智能領域人才的引進和扶持,上述在內(nèi)的多種手段,可為人工智能人才的培養(yǎng)和發(fā)展提供有力支持。
(八)加強人工智能國際交流與合作
我國人工智能的發(fā)展,應積極參與全球人工智能領域的標準制定和技術交流,加強與國際頂尖人工智能企業(yè)和機構的合作,推動人工智能技術的全球創(chuàng)新和發(fā)展。通過加強國際合作機制建設,建立人工智能領域的跨國合作框架,促進全球人工智能技術的開放和共享。加強人工智能領域的知識產(chǎn)權保護,建立國際人工智能技術標準和知識產(chǎn)權保護機制,促進人工智能技術的國際化應用和交流。積極參與國際人工智能標準制定,推動人工智能標準化國際化進程,提高我國在國際標準制定中的話語權和地位。加強國際人才交流與合作,鼓勵優(yōu)秀人工智能人才到國外交流和學習,引進國際優(yōu)秀人才來我國工作和合作。與國際頂尖人工智能企業(yè)和機構建立戰(zhàn)略合作伙伴關系,共同開展技術研發(fā)、應用推廣、人才培養(yǎng)等領域的合作,加速形成具有國際競爭力的人工智能產(chǎn)業(yè)集群。參與國際人工智能賽事和競賽,提高我國人工智能技術的國際影響力和競爭力。
(作者系中國工程院院士、鵬城實驗室主任)
責任編輯:梁瑞