圖說:“OpenMEDLab浦醫”基礎模型群將于近期逐步開源,覆蓋10余種醫療數據模態 采訪對象供圖
大模型的快速發展突破了人工智能技術的邊界,也為眾多垂直領域帶來新的發展機遇和挑戰。在醫療領域,越來越多業內人士共同關注同一個課題——如何通過人工智能大模型為醫生和研究人員提供新工具、新方法,以改善疾病診斷、治療和預防。
(資料圖)
6月29日,由上海人工智能實驗室牽頭,并聯合國內外頂級科研機構、高校及醫院共同發布全球首個醫療多模態基礎模型群“OpenMEDLab浦醫”。
“OpenMEDLab浦醫”融合了全球頂尖的AI研發能力、海量醫學數據以及醫學專家知識,首批發布的基礎模型群中,包含基于醫學圖像、醫學文本、生物信息、蛋白質工程等10余種數據模態訓練而成的基礎模型。
近年來,超大參數深度學習基模型在計算機視覺、自然語言處理等領域獲得突破性進展,能夠基于大模型的超強泛化能力應用于許多下游任務的分析。然而醫學數據在數據模態、成像模式、圖像特征等方面種類繁多、差別較大,使得通用大模型難以在醫學圖像分析方面實現令人滿意的性能。在高度關注數據私密性的醫療機構中,落地部署也存在較大困難,當前,針對特定任務進行單獨模型訓練依然是該領域主流的解決方案。然而,醫療下游長尾任務的數據樣本少、標注難度高,這也限制了人工智能在更多醫療場景的應用。
如何將計算機視覺、自然語言處理通用大模型“為我所用”,并發展出更適合醫療場景的基礎模型,上海人工智能實驗室首創了多層級、多場景、高精度、可落地的醫療基礎模型群“OpenMEDLab浦醫”。
據介紹,基于計算機視覺、自然語言處理大模型對醫療圖像和文本通用特征的學習,上海人工智能實驗室首先針對不同醫療數據模態開發了一系列基模型,例如CT、MRI、超聲、內鏡、病理、醫學文本等,以充分學習和利用不同數據模態獨有的特征和模式。基于上述多層級、多場景的基礎模型群,“OpenMEDLab浦醫”可以將先前醫學數據訓練中學習到的特征,高效應用于海量醫療下游問題中,從而實現針對不同任務的小數據、弱標注、高效率的訓練。同時,模型群兼顧性能與落地的平衡,在醫療場景中的部署應用更具便捷性,從而讓基礎模型在更多醫療長尾問題中得以落地應用。
上海人工智能實驗室智慧醫療研究中心主任張少霆表示:“‘OpenMEDLab浦醫’的問世,為人工智能大模型在醫療領域的快速發展、高效落地提供了堅實的基礎,將帶動醫療領域的一系列創新,如模型即服務等模式。”
記者了解到,“OpenMEDLab浦醫”研發團隊已與全國多家頭部三甲醫院及醫藥企業開展合作,全方位賦能醫院診療及藥物研發工作。在上海交通大學醫學院附屬瑞金醫院,“醫學數字人”已應用于全身多部位、多器官、多模態影像的智能輔助診療,覆蓋十余個臨床方向,全方位賦能患者診療愈全流程;在四川大學華西醫院,雙方合作打造基于自動提示詞微調的視覺語言大模型,顯著提高了小樣本下的醫學圖像的檢測性能,為視覺語言大模型在醫療圖像領域提供了應用范式。在生物制藥領域,也與多家知名藥企合作,利用基礎模型賦能蛋白質工程,助力藥品研發。
據透露,“OpenMEDLab浦醫”將于近期逐步開源,覆蓋醫學圖像、醫學文本、生物信息、蛋白質工程等10余種醫療數據模態,促進基于醫療基礎模型的跨領域、跨疾病、跨模態科研突破,推動醫療大模型的產業落地。
新民晚報記者 郜陽
關鍵詞:
責任編輯:Rex_29