盤點上半年國內(nèi)大模型混戰(zhàn),最后一天還是杭州收官
火爆的AI大模型戰(zhàn)場上,國外的OpenAI、谷歌、微軟等大廠正打得火熱;國內(nèi)以百度、阿里、華為、騰訊為代表的科技巨頭,科大訊飛、實在智能、商湯科技等AI公司,三大運營商,以及智源研究院、中科院等研究機構(gòu)都紛紛投身AI大模型浪潮。

所謂AI大模型就是人工智能預(yù)訓(xùn)練模型,包含三大要素:大算力、強算法、大數(shù)據(jù)。大模型相當于人工智能的土壤,沒有大模型支持,就不會有AI的成功。一起來看看2023年上半年國內(nèi)大模型有哪些吧!
實在智能:TARS(塔斯)大模型
坐標杭州,2023年上半年大模型的收官之作:實在的國產(chǎn)大模型,TARS(塔斯)歷經(jīng)半年研發(fā),近期正式上線開始內(nèi)測。這是國內(nèi)人工智能企業(yè)、RPA賽道頭部實在智能自研垂直領(lǐng)域的大語言模型,在TARS大模型中疊加了多項自然語言處理前沿技術(shù),基于開源基座模型,在千億級高質(zhì)量Tokens上進行了充分訓(xùn)練,完整復(fù)現(xiàn)了Pretrain、SFT和RLHF三個階段,語言理解能力及指令跟隨能力等在橫向?qū)Ρ葴y試中均取得良好效果。
網(wǎng)易:玉言、子曰大模型
在2023世界人工智能大會上,網(wǎng)易多款A(yù)I大模型落地產(chǎn)品首次亮相,集中展示了在人工智能基礎(chǔ)設(shè)施層、引擎層、平臺層、模型層、應(yīng)用層的領(lǐng)先創(chuàng)新成果。會上,由網(wǎng)易有道自研的首個教育大模型“子曰”最新應(yīng)用成果——虛擬人口語教練首次亮相。
京東:言犀大模型
新一代京東大模型定位于產(chǎn)業(yè)版本的ChatGPT。其中,一個平臺為ChatJD智能人機對話平臺,兩個領(lǐng)域為零售和金融,五個應(yīng)用則包括內(nèi)容生成、人機對話、用戶意圖理解、信息抽取和情感分類。
360:360智腦大模型
6月13日,360集團舉行360智腦大模型應(yīng)用發(fā)布會,認知型通用大模型“360智腦4.0”亮相,360智腦在多模態(tài)等關(guān)鍵能力上完成迭代,將全面接入“360全家桶”,同時360AI數(shù)字人正式發(fā)布。
科大訊飛:星火認知大模型
2023年5月6日訊飛星火認知大模型正式發(fā)布,涵蓋了文本生成、語言理解、知識問答、邏輯推理等七項核心能力,并持續(xù)迭代于6月9日再次升級發(fā)布星火認知大模型V1.5。
商湯:日日新大模型
4月,商湯科技董事長兼首席執(zhí)行官徐立宣布推出“日日新SenseNova”大模型體系。這個體系包含自然語言處理、內(nèi)容生成、自動化數(shù)據(jù)標注、自定義模型訓(xùn)練等多種大模型及能力。
昆侖萬維:天工大模型
4月10日,昆侖萬維宣布聯(lián)合奇點智源共同研發(fā)了號稱“中國第一個真正實現(xiàn)智能涌現(xiàn)”的國產(chǎn)大語言模型——“天工”3.5。
中國科學(xué)院自動化研究所:紫東太初大模型
6月16日,中國科學(xué)院自動化研究所發(fā)布紫東太初2.0。相比1.0版本,在語音、圖像和文本三模態(tài)的基礎(chǔ)上,加入視頻、傳感信號、3D點云等模態(tài)數(shù)據(jù),研究突破了認知增強的多模態(tài)關(guān)聯(lián)等關(guān)鍵技術(shù)。
在這個AI大潮中,產(chǎn)品不斷涌現(xiàn),競爭不斷升級。我們不應(yīng)只看到其矚目的一面,而是要更加關(guān)注技術(shù)的可持續(xù)發(fā)展,解決實際問題。只有這樣,AI才能在未來的道路上走得更遠,為人類社會帶來更大的福祉。