【環球網科技報道 記者 林迪】眾所周知,數據、算力、算法被視為AI發展的“三架馬車”。然而,這三駕馬車有時也成為了難以跨越的門檻,制約著AI產業的進一步發展乃至產業數字化轉型的進程。
一方面,AI算法對研發能力的要求極高,中小微企業難以與掌握資源的大企業競爭、獲得研發所需的相應人才、能力;另一方面,AI模型的訓練依賴大量數據,而數據同樣往往只掌握在大企業手中;而即便是對于同時掌握了研發能力和數據資源的企業來說,模型復雜程度攀升及數據量急劇增加所帶來的對算力要求的提升,亦進一步推升了算力的成本,這些都使AI技術難以有效應用落地。
為此,特斯聯于近日正式推出首個人工智能開放創新中心(下稱:科創中心),并在德陽AIPARK落地運營。據悉,德陽AI PARK是特斯聯繼重慶AIPARK之后打造的又一座集聚未來城市體驗及城市科技的研發基地,其中,位于園區三層的科創中心則成為了這座新落成的園區的關鍵亮點。
算法+數據+算力
科創中心是特斯聯打造的人工智能計算中心(AICC),同時兼備著算法孵化、科研共享、及人才培養的使命。據特斯聯方面介紹,這是公司以創新研發反哺產業生態,助力產業發展的第一步。
特斯聯相關技術負責人告訴記者,科創中心的設立旨在充分貫通學術生態和產業生態,使學術生態得以基于產業數據研發相應的預訓練模型,并以“成本共擔”的方式,為AI PARK周邊的中小微企業提供AI所需的算力、數據、算法模型等核心要素,讓各體量、具備不同AI基礎的企業均能通過學術機構所研發出的模型,以低代碼、模塊化的生產方式依據自身的需求,實現自有知識產權算法的孵化及既有成熟算法的調用,進而推動更高效的AI產業實踐。
具體來看,作為特斯聯核心AI能力落地的載體,科創中心具備算力、數據、模型三大核心能力的輸出——
在算力方面,特斯聯以科創中心為單位面向中小微企業提供算力,不同的科創中心其規模、設施亦不盡相同。德陽科創中心占地約240平方米,一期規劃算力達全精度31P、雙精度2P、單精度125P、半精度65P。而尤其值得注意的是,未來科創中心的算力并非僅由單個科創中心的算力構成,還將融匯全國各地多個科創中心節點,供給于產業。
在數據層面,以AI PARK智能交互終端采集的本地數據、特斯聯自身近萬項目積累的產業數據、與地方政府大數據局的合作數據,以及科研公開數據為基礎,德陽科創中心目前已接入89TB數據。特斯聯科創中心將算力下沉到數據端組成智算節點,通過聯邦學習體系,使數據對研究機構可用及部分有條件可見??蒲袡C構隨即通過智算節點,基于聯邦學習實現預訓練模型的研究。預訓練模型則可通過評測,上載到TACOS(特斯聯城市級AIoT操作系統)的九章算法賦能平臺,為產業所用,實現產業算法的孵化。
在算法模型方面,基于前述體系,目前特斯聯在計算機視覺、自然語言處理、推薦預測、知識圖譜四個方向共十三個細分項,與學術生態及產業合作伙伴展開深入合作,并建立了龐大的模型庫。通過弱監督及大模型訓練體系,學術機構所研發出的模型可實現在TACOS的掛載,并通過TACOS的AIDevelop Studio向產業提供算法訓練的服務?;谌醣O督體系,中小微企業用戶可以基于無標簽數據進行算法訓練,降低算法對數據的依賴。同時弱監督及大模型訓練體系盡可能地降低了算法研發過程中的人工參與程度,讓算法訓練標準化、流程化。
據特斯聯方面透露,入駐科創中心的企業均可通過TACOS及九章算法賦能平臺直接調用相應的預訓練模型——截至2022年2月底,據TACOS顯示,已有逾800家企業注冊九章算法賦能平臺并入駐特斯聯科創中心,共計調用算法超過120萬次,而科創中心攜手學術生態也已累計生成了數百個預訓練模型。
以沉默數據降低AI研發門檻
特斯聯科創中心上述負責人表示,弱監督大模型訓練體系、聯邦學習安全訓練體系是科創中心最核心的技術亮點?!翱苿撝行闹铝τ谕ㄟ^九章算法賦能平臺向不具備AI能力或弱AI能力的用戶提供AI算法孵化服務能力,因而弱化機器學習對標簽數據的依賴、弱化人工參與算法訓練,就成為了重中之重?!?/p>
據介紹,有別于行業常見的算法研發范式,特斯聯將算力與數據相結合,建立了特斯聯的智算體系,通過科創中心節點將算力下沉與數據綁定,形成算法+數據的分布式計算單元,并通過九章AI算法賦能平臺的AI Research Studio基于聯邦學習安全訓練體系將這一能力提供給科研學術生態。科研學術生態對于這些數據僅有部分有條件可見和使用的權限?;谶@些分布式智算節點,科研學術生態可實現預訓練模型的研究,并將研究的預訓練模型通過評測后上載到九章算法賦能平臺的AI Develop Studio供產業使用。
在特斯聯看來,其打造的核心技術體系最關鍵的能力就在于,使城市中龐大的沉默數據資源,能夠真正有效地為產業所用。而這也是科創中心得以賦能企業AI開發的基礎。
據悉,2021年,特斯聯完成了基于弱監督和大模型核心技術的里程碑級突破,并實現了與學術生態所研究的預訓練模型的一鍵加載。
反哺產業人才缺口
值得一提的是,伴隨德陽科創中心的啟動,特斯聯正式宣布升級其人才戰略,在不斷投入加碼自身研發團隊的基礎之上,還將構建完善的“藍領”AI教培體系,為產業源源不斷輸送AI人才。
據介紹,特斯聯的“藍領”AI教培體系將以科創中心為實踐基地,以TACOS及九章算法賦能平臺為基礎展開。面向廣泛的本地高職專院校,特斯聯將打造系列基于TACOS的AI教培課程、教材、軟硬件實訓及考核方案,為高職專學生提供基礎AI能力支持。以科創中心為橋梁,高職專學生得以針對企業具體的需求進行AI實習實踐,學以致用。同時,特斯聯還將充分拉通產學研各界,以最新研究成果賦能前沿產業AI發展,打造從科研到應用的AI發展閉環。
業內人士分析稱,從研發到應用,再以市場反饋反哺科研創新,這對于AI產業來說是一個螺旋式發展的過程。借由科創中心,特斯聯希望能進一步縮短AI技術從實驗室到市場的路徑,使研發更具場景針對性,也使市場的需求能更快速地為研究機構所了解。
目前,人工智能已從最初的計算、感知階段發展到認知階段,而下一階段的突破離不開更靠近市場的應用實踐。最后,特斯聯方面表示,“希望通過打造集算力、數據、算法模型能力于一體的科創中心,要做的是為各類企業打造流程化、低門檻的AI基礎設施,讓更多玩家參與到AI發展的浪潮之中,讓AI更‘接地氣’?!?/p>
關鍵詞:
責任編輯:Rex_07