Talk預(yù)告 | 香港中文大學(xué)張懿元:由MetaTransformer探索統(tǒng)一的多模態(tài)學(xué)習(xí)

本期為TechBeat人工智能社區(qū)第524期線上Talk!
北京時間8月23日(周三)20:00,香港中文大學(xué)博士生—張懿元的Talk將準時在TechBeat人工智能社區(qū)開播!
他與大家分享的主題是:?“探索模態(tài)通用感知”,屆時將介紹多模態(tài)學(xué)習(xí)和發(fā)展統(tǒng)一的多模態(tài)學(xué)習(xí)的意義,并且探索統(tǒng)一的多模態(tài)學(xué)習(xí)。
Talk·信息
▼
主題:探索模態(tài)通用感知
嘉賓:香港中文大學(xué)博士生—張懿元
時間:北京時間?8月23日(周三)20:00
地點:TechBeat人工智能社區(qū)
http://www.techbeat.net/
?長按識別二維碼,一鍵預(yù)約TALK!

Talk·介紹
▼
在邁向通用人工智能(AGI)的諸多可能的方向中,發(fā)展多模態(tài)大模型(MLLM)已然成為當(dāng)前炙手可熱的重要路徑。多模態(tài)之間的互補性可以增強人工智能的學(xué)習(xí)能力,比如,CLIP 將圖像與文本進行統(tǒng)一學(xué)習(xí)的方式就取得了巨大的成功。但受限于多種模態(tài)之間巨大的差異性以及現(xiàn)有多模態(tài)模型對配對數(shù)據(jù)的依賴性,實現(xiàn)模態(tài)通用感知存在著艱巨挑戰(zhàn)。為此,香港中文大學(xué)多媒體實驗室(CUHK MMLab)聯(lián)合上海人工智能實驗室的OpenGVLAB研究團隊提出統(tǒng)一多模態(tài)學(xué)習(xí)框架 Meta-Transformer,一個框架理解 12 種模態(tài)信息, 并提供了多模態(tài)無邊界融合的新范式。
Talk大綱
1、多模態(tài)學(xué)習(xí)的意義
2、發(fā)展統(tǒng)一的多模態(tài)學(xué)習(xí)的意義
3、統(tǒng)一的多模態(tài)學(xué)習(xí)的探索
Talk·預(yù)習(xí)資料
▼
Meta-Transformer:1個框架理解12種模態(tài)引發(fā)的質(zhì)變與涌現(xiàn)(已開源)
https://mp.weixin.qq.com/s/ZX_aUMKCfZ2XAaY4J3tCTw
代碼鏈接:
https://github.com/invictus717/MetaTransformer
Talk·提問交流
▼
在Talk界面下的【交流區(qū)】參與互動!留下你的打call??和問題??,和更多小伙伴們共同討論,被講者直接翻牌解答!

你的每一次貢獻,我們都會給予你相應(yīng)的i豆積分,還會有驚喜獎勵哦!
Talk·嘉賓介紹
▼

香港中文大學(xué)信息工程系博士生(MMLab),指導(dǎo)老師為岳翔宇教授。研究方向為多模態(tài)學(xué)習(xí)和大語言模型。
個人主頁:?
https://www.techbeat.net/grzytrkj?id=33768
?長按識別二維碼,一鍵預(yù)約TALK!



關(guān)于TechBeat人工智能社區(qū)
▼
TechBeat (www.techbeat.net) 是一個薈聚全球華人AI精英的成長社區(qū)。 我們希望為AI人才打造更專業(yè)的服務(wù)和體驗,加速并陪伴其學(xué)習(xí)成長。 期待這里可以成為你學(xué)習(xí)AI前沿知識的高地,分享自己最新工作的沃土,在AI進階之路上的升級打怪的根據(jù)地!