大模型資訊:
阿里云開源通義千問多模態大模型Qwen-VL
阿里云今天宣布推出開源大規模視覺語言模型Qwen-VL。Qwen-VL以通義千問70億參數模型Qwen-7B為基座語言模型研發,支持圖文輸入,具備多模態信息理解能力。
(資料圖)
Qwen-VL是支持中英文等多種語言的視覺語言(Vision Language,VL)模型,相較于此前的VL模型,Qwen-VL除了具備基本的圖文識別、描述、問答及對話能力之外,還新增了視覺定位、圖像中文字理解等能力。
在主流的多模態任務評測和多模態聊天能力評測中,Qwen-VL取得了遠超同等規模通用模型的表現。
IBM將參與Hugging 億美元D輪融資
IBM和開源人工智能平臺Hugging Face周四聯合宣布,前者參與了后者的億美元的D輪融資。
這筆額外的資金將進一步加強Hugging Face作為領先的開源和開放科學人工智能平臺的地位。IBM和Hugging Face最近宣布在IBM的生成式人工智能平臺watsonx上展開合作,幫助企業構建、部署和定制跨多個領域的基礎模型。
在watsonx中,人工智能構建者可以利用IBM和Hugging Face社區的模型,這些模型經過預先訓練,可以支持一系列自然語言處理(NLP)任務,包括問題回答、內容生成和摘要、文本分類和提取。
AMD 收購 AI軟件公司 Mipsology,將加強 AMD AI 軟件開發能力
據 AMD 官網顯示,AMD 宣布收購AI軟件公司 Mipsology。
AMD 表示, Mipsology 的軟件團隊將加入 AMD AI Group,幫助進一步加快 AMD 的客戶參與度并擴展 AMD的 AI 軟件開發能力。該團隊將幫助開發AMD完整的人工智能軟件堆棧,擴展AMD的軟件工具、庫和模型的開放生態系統,為在 AMD 硬件上運行的人工智能模型的簡化部署鋪平道路。
Mipsology 成立于 2015 年,總部位于法國帕萊索。該公司主要開發針對 AMD 硬件量身定制的領先 AI 推理、優化解決方案和工具。
微軟 Teams 引入 Typeface AI 工具,加強品牌營銷內容
微軟近日宣布,將為微軟 Teams 加入 AI 工具 Typeface 。
據悉, Typeface 整合了Azure 機器學習、Azure OpenAI 服務和 Typeface 品牌個性化AI 的強大能力,可以用于創建創意簡報、電子郵件營銷活動以及多媒體在線廣告等內容。用戶可以在無須切換應用程序的情況下增強品牌內容。企業可以使用 Affinity AI 模式來訓練 Typeface AI 應用程序,創建自己的專屬內容。
Meta AI 公布開源基礎模型 Code Llama,專攻代碼生成
Meta AI近日發布論文,公布了一款針對代碼生成功能的基礎大語言模型 Code Llama。
據悉,Code Llama基于Llama 2開發,具有開放式模型中領先的性能、填充能力、對大型輸入上下文的支持以及用于編程任務的零指令跟隨能力。它提供包括基礎模型、Python專用版本以及指令跟隨模型等多個模型,每個模型的參數分別為7B、13B和34B。所有模型都是基于16k標記序列進行訓練,并在最多100k標記輸入上顯示出改進。
Code Llama以寬松許可證方式開源,允許研究和商業使用。
奇安信發布Q-GPT安全機器人和大模型衛士
奇安信集團在京發布了Q-GPT(奇安信大模型)安全機器人和大模型衛士。
據介紹,Q-GPT安全機器人是基于奇安信大模型的“虛擬安全專家”,可以全天候工作。大模型衛士集安全風險發現、大模型訪問控制、數據泄露管控、違法違規行為溯源等功能為一體。
會上,京東方集團和吉利集團等客戶現場簽約,成為國內首批Q-GPT安全機器人和安全大模型用戶。
重點論文:
中國科學技術大學聯手新加坡管理大學,推出圖像生成模型CgT-GAN
據 Arxiv 頁面顯示,中國科學技術大學近日聯手新加坡管理大學發布一款圖像生成模型 CgT-Gan。
CgT-GAN通過將圖像納入訓練過程,使模型能夠“看到”真實的視覺模態。具體來說,研究團隊采用對抗訓練來教導CgT-GAN模型模仿外部文本語料庫的短語,同時利用基于CLIP的獎勵機制提供語義指導。
實驗結果顯示,CgT-GAN在所有指標上明顯優于現有的方法。
論文地址:點此前往
關鍵詞:
責任編輯:Rex_26