【環球網科技報道 記者 鄭湘琪】“人工智能在未來的幾年之內會逐漸形成這樣的狀態:人工智能大模型作為基礎的產業生態,用大算力訓練出最高水平的智能,為各種人工智能應用‘賦智’。就像今天的電網給大家提供電力一樣,未來幾年,人工智能將以大模型為基礎向社會提供源源不斷的智力服務。”近日,在“三年而勵·智源三周年特別活動”期間,智源研究院院長黃鐵軍這樣表示。
近期,連創記錄的悟道大模型已經迅速進入產業應用,無論是冬奧手語數字人,還是OPPO小布助手的“生成式回答系統”,都成為人工智能領域的“科研爆款”。而這一系列案例背后,正是基于智源研究院組建的悟道團隊。
研發“悟道”大模型,建立產業生態
隨著超大規模的預訓練模型成為全球人工智能技術研發的熱點,大模型有望引領未來數年之內的技術躍遷,并帶來全新的產業模式。黃鐵軍表示,“人工智能的發展已經從‘大煉模型’逐步邁向了‘煉大模型’的階段,業界通過設計先進的算法整合盡可能多的數據,匯聚大量算力,并集約化地訓練大模型供大量企業使用,已是必然趨勢。”
基于此,2020年10月,智源研究院開始對超大規模預訓練模型“悟道”項目進行路徑探索;今年3月,作為中國首個超大規模預訓練模型,“悟道1.0”發布;6月,智源研究院發布“悟道2.0”。
與“悟道1.0”相比,悟道2.0在模型規模上實現爆發級增長,達到1.75萬億參數,打破了之前由國外預訓練模型創造的1.6萬億參數記錄。此外,悟道2.0還取得了多項世界級的創新突破,在預訓練模型架構、微調算法、高效預訓練框架方面實現了原始理論創新,并在多個國際人工智能基準測試榜單的9項任務上取得領先。
今年9月,“悟道”發布開放平臺和高效推理工具包等,并在OPPO等企業合作中實現規模化應用,初步建立產業生態。目前,悟道大模型已在產業智能應用方面進入全面探索階段。以最近發布的冬奧手語播報數字人系統為例,智源研究院副院長唐杰表示,“手語播報數字人依托‘悟道2.0’為底層核心技術研發,能夠提供全流程智能化的手語生成服務。手語播報數字人將用于北京冬奧會期間賽事新聞的實時手語翻譯播報,方便聽障人士收看賽事報道。”
談及“悟道”下一步的科研與生態建設規劃,唐杰表示,“下個3年,智源研究院將以加強‘悟道’原始創新為核心,聚焦‘提智能’‘降門檻’‘建生態’。”
其中,在“提智能”方面,智源研究院將以原始技術創新為核心提升模型性能,通過模型持續學習、增加記憶機制、突破三元組知識表示方法等進一步提升萬億級規模模型的認知智能能力;在“降門檻”方面,圍繞降成本、提速度和搭平臺,讓大模型用起來;在“建生態”方面,通過建立起悟道基金、悟道競賽和悟道產業聯盟三個方面推進。
優化研究布局,推動成果轉化
據介紹,智源研究院已形成了“自由探索+目標導向”的研究布局。其中,在“自由探索”方面,智源研究院理事長張宏江表示,“我們以‘代表作’和‘小同行評價’遴選人才,支持青年人才‘挑大梁當主角’,希望幫助更多的年輕人送進‘名人堂’,而不只是借‘名人堂’來錦上添花。”
以“智源學者”計劃為例,智源研究院堅持通過優中選優的小同行評議,遴選近100位代表人工智能領域國內頂尖水平的“智源學者”,支持他們進行自由探索。
此外,基于“目標導向”,智源研究院在信息模型、生命模型、智算平臺和應用技術研究方向進行了布局。除了“悟道2.0”,智源研究院的另一個重大任務是生命模型“天演”,其目標是搭建世界運行效率最高、模擬級別最精細的高精度生命模型,為下一代人工智能背后的神經建構和機理研究提供支撐和啟發。
“通過研發超大規模信息智能模型和生命模型,我們可以加速電子信息、生物醫藥等領域的科學研究進程,同時幫助創新企業及個人開發者構建智能化水平更高的場景應用,從而賦能實體經濟智能化升級。”張宏江說。
為推動人工智能研究成果的產業化落地,智源研究院還成立十余個創新中心。智源研究院副院長曹崗表示,“智源創新中心針對科學家或創業團隊的市場化工作,支持人工智能原始創新技術的開發、工程化驗證和成果轉化,通過專職工程技術人員,把原創性技術變成準產品,實現研究、應用的‘雙輪驅動’。”
形成“智源模式”,創造更多科研“代表作”
據黃鐵軍介紹,2018年11月成立之初,智源研究院明確要聚焦原始創新和核心技術。三年來,智源研究院沿著人工智能技術的發展軌跡,將“煉大模型”,打造高精度生命模擬平臺等作為技術路徑,形成了獨特的“智源模式”。
展望未來,黃鐵軍表示,“智源研究院將繼續推進機制創新,一方面,吸引更多學者加入,創造出更多類似‘悟道’大模型的科研‘代表作’;另一方面,打造生態,連接技術與產業,推動人工智能產業發展和深度應用,改變人類社會生活,促進人類、環境和智能的可持續發展。”
黃鐵軍強調,未來3年,智源研究院的中心任務是超大規模智能模型訓練技術、平臺與應用示范。其中,模型包括“信息類的多模態認知模型”和“具身實時感知模型”。針對這兩個模型,智源將開展研究支撐模擬所需的訓練技術、核心技術、軟硬件平臺,以及背后開源開放的算法體系、標準體系、數據集、工程化測試驗證和前沿理論。
關鍵詞: 智源 模型 悟道 人工智能 研究院 手語 訓練 2 0
責任編輯:Rex_07