散文網(wǎng) » 科技 »學(xué)習(xí) » 行業(yè)報(bào)告 | ChatGPT浪潮之巔，AIGC賦能千行百業(yè)

行業(yè)報(bào)告 | ChatGPT浪潮之巔，AIGC賦能千行百業(yè)

2023-04-20 14:40 作者:BFT白芙堂機(jī)器人 0人讀過(guò) | 我要投稿

文 | BFT機(jī)器人

一、ChatGPT浪潮之巔，AIGC大規(guī)模商業(yè)化時(shí)代來(lái)臨

ChatGPT引爆AIGC奇點(diǎn)，日新月異，百花齊放。

ChatGPT是美國(guó)OpenAI公司于2022年11月30日發(fā)布的基于GPT-3.5大模型的聊天機(jī)器人程序，采用自然語(yǔ)言技術(shù)，能完成撰寫郵件、代碼、翻譯等任務(wù)，開(kāi)啟“AI的iPhone時(shí)刻”。

2023年1月末，ChatGPT的月活用戶突破1億，成為史上增長(zhǎng)最快的消費(fèi)者應(yīng)用；
2月7日，谷歌發(fā)布對(duì)話型AI 系統(tǒng)Bard迎戰(zhàn)ChatGPT；
2月8日，微軟將ChatGPT接入Bing搜索；
3月15日，OpenAI 發(fā)布了GPT-4，支持多模態(tài)輸入；
3月16日，微軟發(fā)布了植入GPT-4技術(shù)的Copilot， AI助力Office軟件生產(chǎn)力大提升。同日，百度發(fā)布了大模型文心一言，并啟動(dòng)內(nèi)測(cè)；
3月20日，阿里達(dá)摩院上線“文本生成視頻大模型”,目前僅支持英文輸入；
3月24日，OpenAI發(fā)布ChatGPT Plugin，支持第三方插件接入，并同時(shí)開(kāi)源知識(shí)庫(kù)檢索插件源代碼，“AI的App Store時(shí)刻”到來(lái)；
3月27日，百度推出“文心千帆” 大模型平臺(tái)，面向客戶提供企業(yè)級(jí)大語(yǔ)言模型服務(wù)；
3月28日，騰訊AI Lab發(fā)布自研3D游戲場(chǎng)景自動(dòng)生成解決方案，使用AIGC技術(shù)。

ChatGPT引爆AIGC（生成式AI）奇點(diǎn)，AIGC技術(shù)賦能千行百業(yè)，涌現(xiàn)了寫作助手、AI繪畫、對(duì)話機(jī)器人、數(shù)字人等爆款級(jí)應(yīng)用，支撐著傳媒、電商、娛樂(lè)、影視等領(lǐng)域的內(nèi)容需求。內(nèi)容生產(chǎn)進(jìn)入AIGC時(shí)代，跨模態(tài)成為增長(zhǎng)點(diǎn)。

AIGC（AI-Generated Content，AI生成內(nèi)容），是指基于Diffusion模型（Diffusion model，擴(kuò)散模型）、GAN模型（Generative Adversarial Nets，生成式對(duì)抗網(wǎng)絡(luò)）等人工智能技術(shù)，通過(guò)已有數(shù)據(jù) 尋找規(guī)律，并通過(guò)適當(dāng)?shù)姆夯芰ι上嚓P(guān)內(nèi)容的技術(shù)，既可以生成常見(jiàn)的圖像、文本、音頻等外顯性內(nèi)容，也可以生成策略、劇情、訓(xùn)練數(shù)據(jù)等內(nèi)在邏輯內(nèi)容。

內(nèi)容生產(chǎn)已經(jīng)從專業(yè)化的PGC到用戶生產(chǎn)的UGC，現(xiàn)在已經(jīng)進(jìn)入AIGC時(shí)代。AIGC不僅意味著AI的角色開(kāi)始從觀察、預(yù)測(cè)拓展為生成、決策，也意味著AIGC作為一種賦能技術(shù)，借助其大模型的跨模態(tài)綜合能力和內(nèi)容生產(chǎn)力，將廣泛服務(wù)于各類終端行業(yè)。

數(shù)據(jù)來(lái)源：百度、廣發(fā)證券發(fā)展研究中心

AIGC尚處于萌芽階段，有望成為未來(lái)關(guān)鍵技術(shù)推動(dòng)力。AIGC從其數(shù)據(jù)中學(xué)習(xí)內(nèi)容或?qū)ο?，并運(yùn)用數(shù)據(jù)生成全新、完全原創(chuàng)的實(shí)際工件，可用于多種活動(dòng)，如創(chuàng)建軟件代碼、促進(jìn)藥物研發(fā)和有針對(duì)性的營(yíng)銷等。

根據(jù)Gartner發(fā)布的《2022年新興技術(shù)成熟度》報(bào)告顯示，生成式AI仍處于技術(shù)萌芽期階段，離技術(shù)成熟還需要花費(fèi)五到十年時(shí)間。在這一階段，生成式AI具有較大的發(fā)展?jié)摿Γ型蔀槲磥?lái)關(guān)鍵技術(shù)推動(dòng)力。Gartner認(rèn)為生成式人工智能為2022年重要戰(zhàn)略趨勢(shì)，是最引人注目和最強(qiáng)大的人工智能技術(shù)之一，到2025年，生成式人工智能將占所有生成數(shù)據(jù)的10%。

技術(shù)場(chǎng)景細(xì)分多樣化，技術(shù)原理突破推動(dòng)規(guī)模化應(yīng)用。AIGC應(yīng)用技術(shù)場(chǎng)景細(xì)分領(lǐng)域眾多，按照模態(tài)區(qū)分，可以分為音頻生成、文本生成、圖像生成、視頻生成及圖像、視頻、文本間的跨模態(tài)生成，多點(diǎn)開(kāi)花。

目前已經(jīng)有較為明確應(yīng)用的有結(jié)構(gòu)化文本寫作、輔助性文本寫作、作曲及編曲、圖像編輯、視頻屬性編輯等，非結(jié)構(gòu)化文本寫作、創(chuàng)意圖像及視頻生成、文本到圖像和視頻的跨模態(tài)生成預(yù)計(jì)會(huì)在未來(lái)1-2年內(nèi)實(shí)現(xiàn)規(guī)?；瘧?yīng)用。

伴隨著有關(guān)底層技術(shù)原理的不斷突破和細(xì)化，AIGC將迎來(lái)快速發(fā)展和廣泛應(yīng)用。使用AIGC不僅可以實(shí)現(xiàn)降本增效，更能激發(fā)創(chuàng)意，提升內(nèi)容多樣性，降低制作成本。

數(shù)據(jù)來(lái)源：量子位智庫(kù)，廣發(fā)證券研究中心

AIGC賦能千行百業(yè)，未來(lái)需求樂(lè)觀可期。AIGC作為一種賦能型技術(shù)，能在很多行業(yè)內(nèi)找到應(yīng)用場(chǎng)景的結(jié)合點(diǎn)。這臺(tái)“21世紀(jì)的珍妮紡紗機(jī)”基于其強(qiáng)大的內(nèi)容生產(chǎn)能力，將重塑幾乎所有行業(yè)，帶領(lǐng)行業(yè)進(jìn)入新時(shí)代。

目前在繪畫、視頻制作、音樂(lè)、寫作、編程等眾多內(nèi)容生產(chǎn)行業(yè)中都有顯著的業(yè)務(wù)需求，在游戲、傳媒、電商、娛樂(lè)、教育、金融、醫(yī)療、藥研、工業(yè)等多個(gè)行業(yè)中都有望塑造更多應(yīng)用場(chǎng)景。

1.AI+繪畫：以O(shè)penAI為代表的企業(yè)可以實(shí)現(xiàn)基于文字描述繪制出精美圖畫，渲染質(zhì) 量和畫質(zhì)細(xì)節(jié)令人贊嘆。AI繪畫為用戶提供高自由度的表達(dá)途徑，彰顯了用戶的個(gè) 性化需求，為其提供更強(qiáng)烈的沉浸感，使得繪畫藝術(shù)更加貼近大眾。

2.AI+視頻制作：目前已經(jīng)可以利用AI將綠幕拍攝的真人動(dòng)作視頻轉(zhuǎn)化為動(dòng)畫風(fēng)格，省去了復(fù)雜的動(dòng)作捕捉和需要手繪調(diào)整的細(xì)節(jié)，極大提高視頻制作效率。未來(lái)，視頻生成還將能夠完成人臉替換、人臉再現(xiàn)（人物表情或面部特征的改變）、人臉合成（構(gòu)建全新人物）甚至全身合成，虛擬環(huán)境合成等功能，值得期待。

3.AI+音樂(lè)：主要有AI作曲和編曲兩個(gè)分支，AI作曲是以語(yǔ)言模型為中介，對(duì)音樂(lè)數(shù)據(jù)進(jìn)行雙向轉(zhuǎn)化，提取節(jié)奏、音高、音長(zhǎng)等信息，得到純音樂(lè)或主旋律；AI編曲是指利用AI生成不同樂(lè)器和弦，完成整體編配。目前已經(jīng)實(shí)現(xiàn)基于開(kāi)頭旋律、音樂(lè)類型，圖片、文字描述、情緒類型等生成樂(lè)曲，提高了音樂(lè)的創(chuàng)作效率，豐富了音樂(lè)類型。

4.AI+寫作：目前，AIGC已經(jīng)能較好應(yīng)對(duì)結(jié)構(gòu)化寫作，如客服類聊天問(wèn)答、體育/金融新聞撰寫，Narrative Science創(chuàng)始人預(yù)測(cè)，2030年時(shí)90%以上的新聞會(huì)由機(jī)器人問(wèn)題。AI代替人進(jìn)行文本寫作可以解放雙手，提高效率和正確性。

5.AI+編程：使用ChatGPT4等工具可以用自然語(yǔ)言生成代碼、解決Bug，為程序員編碼大大降低了門檻，甚至一定程度上，還可以一鍵生成自己想要的代碼與網(wǎng)頁(yè)。

6.AI+游戲：AIGC可以在其中扮演人工智能NPC，可以基于對(duì)話語(yǔ)義進(jìn)行無(wú)限延展，并記住該對(duì)話，從而使被玩家改變的NPC在再次相遇時(shí)維持被改變的特性。長(zhǎng)期來(lái)看，NPC的靈活自主將使其成為重要社交節(jié)點(diǎn)，有效擴(kuò)充元宇宙內(nèi)部架構(gòu)。

二、視覺(jué)：AIGC作為生產(chǎn)力工具賦能元宇宙，推動(dòng)XR設(shè)備發(fā)展

（一）AIGC賦能XR領(lǐng)域，驅(qū)動(dòng)內(nèi)容端加速升級(jí)

VR（Virtual Reality，虛擬現(xiàn)實(shí)）是指利用VR設(shè)備模擬產(chǎn)生一個(gè)三維的虛擬空間，提供視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等感官的模擬，讓使用者如同身臨其境。簡(jiǎn)而言之，就是不依賴于使用者自身所處的環(huán)境，完全“無(wú)中生有”。

AR（Augmented Reality，增強(qiáng)現(xiàn)實(shí)）是VR技術(shù)的延伸，能夠把計(jì)算機(jī)生成的虛擬信息（物體、圖片、視頻、聲音、系統(tǒng) 提示信息等）疊加到使用者所在的真實(shí)場(chǎng)景中，并與人實(shí)現(xiàn)互動(dòng)，但使用者能區(qū)分兩者區(qū)別。

MR（Mixed Reality，混合現(xiàn)實(shí)）是VR向AR技術(shù)過(guò)渡的產(chǎn)物，將虛擬世界和真實(shí)世界合成一個(gè)無(wú)縫銜接的虛實(shí)融合世界，其中的物理實(shí)體和數(shù)字對(duì)象滿足真實(shí)的三維投影關(guān)系。

混合現(xiàn)實(shí)技術(shù)通過(guò)在現(xiàn)實(shí)環(huán)境中引入虛擬場(chǎng)景信息，在現(xiàn)實(shí)世界、虛擬世界和用戶之間搭起一個(gè)交互反饋的信息回路，以增強(qiáng)用戶體驗(yàn)的真實(shí)感，具有真實(shí)性、實(shí)時(shí)互動(dòng)性以及構(gòu)想性等特點(diǎn)。我們認(rèn)為MR為元宇宙技術(shù)升級(jí)必經(jīng)路線，有望成為各科技巨頭積極布局的下一代技術(shù)。

數(shù)據(jù)來(lái)源：賽迪智庫(kù)，CSDN,TrioTree，Youtube

AIGC逐漸實(shí)現(xiàn)元宇宙的可擴(kuò)展性潛力，低成本、高效率地滿足VR/AR用戶海量?jī)?nèi)容需求。以AR/VR作為入口，元宇宙極大擴(kuò)展了人類在虛擬世界的生存空間。但元宇宙中需要大量3D場(chǎng)景構(gòu)建，高保真3D模型單靠人工設(shè)計(jì)開(kāi)發(fā)效率低、成本高。

AIGC有望成為新的元宇宙內(nèi)容生成解決方案，利用AI方式生成3D場(chǎng)景將成為未來(lái)元宇宙滿足海量用戶不同需求的解決之道。具體而言，AIGC技術(shù)通過(guò)提供元宇宙環(huán)境生成的基礎(chǔ)設(shè)施、提供個(gè)性化內(nèi)容體驗(yàn)和交互方式等，更好地滿足用戶需求。

AIGC釋放開(kāi)發(fā)人員生產(chǎn)力，為構(gòu)建沉浸式元宇宙空間環(huán)境提供核心基礎(chǔ)設(shè)施技術(shù)。元宇宙可以應(yīng)用在工作、會(huì)議、游戲以及生活社交等活動(dòng)，因此需要在元宇宙空間中創(chuàng)建豐富的活動(dòng)對(duì)象、建筑和活動(dòng)環(huán)境。

但是在過(guò)去，為了構(gòu)建這些數(shù)字環(huán)境，需要開(kāi)發(fā)團(tuán)隊(duì)半手工地創(chuàng)建每一個(gè)部分，用鼠標(biāo)拖動(dòng)來(lái)放置。而現(xiàn)在AlGC通過(guò)實(shí)現(xiàn)創(chuàng)建逼真的3D虛擬空間環(huán)境、虛擬人物，并且效率和成本可以滿足大規(guī)模的元宇宙空間環(huán)境創(chuàng)建。

例如在游戲場(chǎng)景中，未來(lái)游戲的劇情、角色、頭像、動(dòng)作等數(shù)字原生基本元素都可以用AIGC進(jìn)行生成，游戲世界地圖也能通過(guò)AIGC進(jìn)一步延展，極大程度釋放開(kāi)發(fā)人員生產(chǎn)力，用更少的時(shí)間編寫代碼，提升元宇宙建成速度。

數(shù)據(jù)來(lái)源：維深Wellsenn XR，廣發(fā)證券發(fā)展研究中心

AIGC為元宇宙用戶提供個(gè)性化內(nèi)容體驗(yàn)，吸引更多用戶進(jìn)駐元宇宙。AIGC作為生產(chǎn)力工具，可以滿足和填充內(nèi)容匱乏的虛擬世界，同時(shí)賦予用戶更多的創(chuàng)作自由。例如，AIGC可以幫助用戶將手機(jī)拍攝的一系列照片生成可以使用的3D渲染圖，幫助用戶通過(guò)語(yǔ)音文字輸入來(lái)創(chuàng)建可修改的3D環(huán)境。

采用這種創(chuàng)造內(nèi)容的方式，AIGC技術(shù)極大地提高元宇宙環(huán)境的創(chuàng)作自由，提升個(gè)性化體驗(yàn)，未來(lái)的元宇宙體驗(yàn)將不再完全由開(kāi)發(fā)人員構(gòu)建，而是利用AIGC響應(yīng)用戶的輸入按需生成。

AlGC在元宇宙用戶交互界面發(fā)揮作用。元宇宙中存在很多類似NPC的智能體為用戶提供交互服務(wù)，這些智能體可以由AlGC生成并驅(qū)動(dòng)。當(dāng)用戶借助VR/AR設(shè)備進(jìn)入虛擬空間時(shí)，ChatGPT可以作為語(yǔ)言模型集成到各種智能體中，充當(dāng)元宇宙中的虛擬助手或伙伴，執(zhí)行“智能”動(dòng)作和更為復(fù)雜的任務(wù)。

2022年5月，Meta宣布“CAIRaoke 計(jì)劃”，“CAIRaok計(jì)劃”所開(kāi)發(fā)的模型，將允許用戶隨意地與購(gòu)買的AI會(huì)話助手溝通，用戶可以向助手發(fā)出簡(jiǎn)單的語(yǔ)音指令繼而創(chuàng)建所需的虛擬現(xiàn)實(shí)設(shè)置類型。

XR市場(chǎng)規(guī)模年均復(fù)合增速為32.8%，AIGC應(yīng)用推動(dòng)硬件端出貨量持續(xù)增長(zhǎng)。根據(jù) IDC數(shù)據(jù)，全球VR/AR市場(chǎng)規(guī)模將從2021年43.43億美元增長(zhǎng)至2025年的361.12億美元，CAGR為69.8%。

根據(jù)Omdia數(shù)據(jù)，2023年近眼顯示面板出貨量有望達(dá)到2406萬(wàn)臺(tái)，同比增長(zhǎng)67.3%。隨著索尼PSVR 2、蘋果MR、Meta Quest 3、HTC新產(chǎn)品等主要產(chǎn)品的推出，以及AIGC未來(lái)在內(nèi)容端的持續(xù)賦能，XR產(chǎn)業(yè)有望迎來(lái)新一輪增長(zhǎng)。

（二）Pico 背靠字節(jié)跳動(dòng)，有望持續(xù)獲得 AI 技術(shù)加持

字節(jié)跳動(dòng)持續(xù)布局AI技術(shù)，Pico作為主力終端產(chǎn)品有望充分受益。2021年P(guān)ico被字節(jié)跳動(dòng)收購(gòu)。作為國(guó)內(nèi)頂尖的互聯(lián)網(wǎng)企業(yè)之一，字節(jié)跳動(dòng)2012年發(fā)布今日頭條，以人工智能推薦算法起家，AI底蘊(yùn)深厚。

2016年，字節(jié)跳動(dòng)人工智能實(shí)驗(yàn)室（AI Lab）成立，成立時(shí)聚集馬維英、李航、李磊等AI領(lǐng)域超級(jí)大牛，為平臺(tái)持續(xù)提供AI技術(shù)支持，研究領(lǐng)域涵蓋計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、機(jī)器學(xué)習(xí)、語(yǔ)音音頻處理、數(shù)據(jù)知識(shí)挖掘、計(jì)算機(jī)圖像學(xué)等各個(gè)領(lǐng)域。此后在各個(gè)AI應(yīng)用領(lǐng)域，字節(jié)AI技術(shù)研發(fā)與應(yīng)用持續(xù)深化；
2018年，字節(jié)跳動(dòng)“端上智能計(jì)算機(jī)視覺(jué)算法平臺(tái)”項(xiàng)目獲得CCF科技進(jìn) 步卓越獎(jiǎng)；
2019年，字節(jié)推出頭條搜索使用機(jī)器學(xué)習(xí)根據(jù)用戶行為對(duì)搜索結(jié)果進(jìn)行個(gè)性化設(shè)置、推出剪映利用人工智能賦能視頻剪輯自動(dòng)化視頻編輯任務(wù)、收購(gòu)AI游戲技術(shù)研發(fā)商深極智能，在搜索、視頻、游戲等不同方面深化人工智能算法應(yīng)用；
2020年，字節(jié)推出重磅產(chǎn)品火山引擎，提供多個(gè)領(lǐng)域人工智能開(kāi)發(fā)與運(yùn)維等服務(wù)，并推出切入AI教育硬件領(lǐng)域推出產(chǎn)品大力智能家教燈，通過(guò)AI攝像頭實(shí)現(xiàn)遠(yuǎn)程作業(yè) 輔導(dǎo)；
2021年，字節(jié)推出面向開(kāi)發(fā)人員和企業(yè)的AI工具和服務(wù)BytePlus，并切入AI+ 醫(yī)療領(lǐng)域，旗下醫(yī)療品牌“小荷健康”研發(fā)了一款結(jié)腸鏡AI輔助診斷軟件，并與清華大學(xué)合作首次提出了神經(jīng)網(wǎng)絡(luò)配音器；
2022年聯(lián)合南京大學(xué)、清華大學(xué)人工智能產(chǎn)業(yè)研究院提出AI藥物設(shè)計(jì)方法。在與VR相關(guān)的渲染技術(shù)、動(dòng)作捕捉、圖像內(nèi)容生成等人工智能技術(shù)上，字節(jié)跳動(dòng)具備強(qiáng)大技術(shù)積累，Pico作為字節(jié)跳動(dòng)在VR/AR領(lǐng)域探索的主力產(chǎn)品，有望持續(xù)得到字節(jié)AI技術(shù)加持。

數(shù)據(jù)來(lái)源：字節(jié)跳動(dòng)官網(wǎng)，36Kr，火山引擎官網(wǎng)，澎湃新聞，清華大學(xué)官網(wǎng)，生物世界公眾號(hào)，廣發(fā)證券發(fā)展研究中心

Pico利用AI算法賦能虛擬場(chǎng)景生成，為內(nèi)容提供更強(qiáng)技術(shù)支持。2022年，Pico正式推出了官方MRC（Mixed Reality Capture，混合現(xiàn)實(shí)錄制）。對(duì)比Meta Quest需要個(gè)人電腦以及綠幕背景，Pico利用深度學(xué)習(xí)摳圖模型，將人物從物理環(huán)境中摳出并且疊加到虛擬游戲空間中，配合無(wú)線投屏技術(shù)實(shí)現(xiàn)更低門檻、更高質(zhì)量的MR視頻制作。

此外，在虛擬演出這一場(chǎng)景中，Pico也開(kāi)發(fā)了針對(duì)VR場(chǎng)景的AI燈光變化系統(tǒng)、 AI智能音頻分析系統(tǒng)等，在旗下VR音樂(lè)互動(dòng)產(chǎn)品BIT-CLUB中運(yùn)用，呈現(xiàn)超現(xiàn)實(shí)的VR電音現(xiàn)場(chǎng)，為用戶展現(xiàn)出更為極致的視覺(jué)體驗(yàn)。

Pico 4新品全球發(fā)布，產(chǎn)品配置迭代升級(jí)。2022年9月22日，VR品牌Pico召開(kāi)全球新品發(fā)布會(huì)，進(jìn)軍歐美、日韓、東南亞市場(chǎng)，正式發(fā)布Pico 4系列新品。9月 27日，其于青島召開(kāi)國(guó)內(nèi)新品發(fā)布會(huì)，公布新品國(guó)內(nèi)售價(jià)及開(kāi)售渠道等相關(guān)信息，并且面向國(guó)內(nèi)推出的全新VR生態(tài)內(nèi)容。

Pico 4系列為Pico品牌旗下的全新一代VR一體機(jī)，在佩戴舒適度、視聽(tīng)體驗(yàn)，交互感知能力、內(nèi)容生態(tài)等方面帶來(lái)全面提升，為用戶呈現(xiàn)更為沉浸的VR使用體驗(yàn)。本次共發(fā)布四種新品，其中，Pico 4的8+128GB版售價(jià)2499元、8+256GB版售價(jià)2799元；Pico 4 Pro的8+512G版售價(jià)3799元，2022年12月開(kāi)售；Pico體感追蹤器售價(jià)199元，2022年12月開(kāi)售；Pico 4定制近視鏡片售價(jià)為349元起。

從硬件端來(lái)看，Pancake光學(xué)方案和彩色透視為Pico 4主要亮點(diǎn)，Pico 4 Pro增加智能無(wú)級(jí)瞳距調(diào)節(jié)和面部追蹤功能。全新Pico 4系列加速硬件端的迭代升級(jí)，其中， Pico 4正面采用一體化的曲面鏡設(shè)計(jì)，頭顯最薄處只有35.8毫米，頭顯重量?jī)H為295g。

相比于上一代Pico Neo3，其體積減少43%、重量減少100克，單目2160×2160分辨率屏幕，綜合PPD達(dá)到20.6，相對(duì)于Neo3 PPD 19.6略有提升，F(xiàn)OV 105度，支持電動(dòng)瞳距（IPD）調(diào)節(jié)；Pico 4手柄采用寬頻線性馬達(dá)，提供更細(xì)膩觸感；Pico 4 Pro正面采用淺金色高亮曲面鏡，在Pico 4配置基礎(chǔ)上增加三顆高動(dòng)態(tài)傳感器，支持眼球追蹤、面部追蹤，實(shí)現(xiàn)智能無(wú)級(jí)瞳距調(diào)節(jié)，并且可為Avatar模擬更豐富的面部表情。

Pico 4全系列相較之前產(chǎn)品增加彩色透視功能、IPD電動(dòng)調(diào)節(jié)、手柄支持寬頻線性馬達(dá)、裸手交互等功能。其中，Pancake折疊光路方案替換此前的菲涅爾方案，當(dāng)MTF值設(shè)定為0.6時(shí)，Pico 4的光學(xué)清晰度比Pico Neo3提升接近86%；彩色透視功能基于一顆隱藏在黑色曲面鏡下1600萬(wàn)像素的RGB攝像頭，通過(guò)算法進(jìn)行3D環(huán)境建模，再疊加真實(shí)彩色畫面，實(shí)現(xiàn)虛擬世界與真實(shí)環(huán)境的無(wú)縫融合。

從操作系統(tǒng)來(lái)看，Pico推出全新的Pico OS 5.0操作系統(tǒng)，重新定義所有的視覺(jué)元素和交互體驗(yàn)。UI設(shè)計(jì)方面，風(fēng)格輕松自然，全局導(dǎo)航設(shè)計(jì)使得用戶在任何VR應(yīng)用和場(chǎng)景中都可以輕松呼出個(gè)人中心、應(yīng)用列表、最近使用、設(shè)置界面等菜單，消息通知可全局生效。

創(chuàng)新連接方面，全新的Avatar系統(tǒng)開(kāi)放身材、發(fā)型、服裝等自定義選項(xiàng)，并提供豐富的素材庫(kù)，用戶可以按照自己的喜好定制專屬的虛擬形象。此外，Pico 4 推出MRC混合現(xiàn)實(shí)錄制功能，可以通過(guò)手機(jī)將真人和虛擬的畫面和場(chǎng)景自然融合，創(chuàng)作出MR視頻分享到其他平臺(tái)。

從內(nèi)容端來(lái)看，Pico致力于為用戶打造國(guó)內(nèi)應(yīng)用最豐富、最優(yōu)質(zhì)的VR內(nèi)容平臺(tái)。運(yùn)動(dòng)健身方面，Pico推出集私教課程、節(jié)奏音游、瑜伽等運(yùn)動(dòng)于一身的健身大作《超燃一刻》、全新節(jié)奏音游《閃韻靈境》、VR搏擊應(yīng)用《萊美搏擊》、《多合一夏季運(yùn) 動(dòng)VR》、《實(shí)況釣魚(yú)》等運(yùn)動(dòng)休閑類應(yīng)用，并與超級(jí)猩猩、帕梅拉合作打造專屬私教課程及塑形計(jì)劃。

視頻方面，2022年P(guān)ico上線王晰、鄭鈞、汪峰等VR演唱會(huì)，首次實(shí)現(xiàn)8K、3D、多機(jī)位實(shí)時(shí)直播。影視方面，2022年上線科幻動(dòng)畫大作《靈籠》、人文科教片《古籍尋游記》、自然探險(xiǎn)片《跟著德?tīng)旉J東非》等。娛樂(lè)應(yīng)用方面，《劍與魔法》、《Espire 1》、《Alvo》與Pico 4同步上線，《戈恩》、《城市疊疊樂(lè)》等會(huì)在未來(lái)陸續(xù)上線。創(chuàng)作方面，Pico輕世界使用戶可以輕松創(chuàng)造出屬于自己的3D世界及專屬個(gè)人形象。

（三）Meta 在 AI 領(lǐng)域底蘊(yùn)深厚，產(chǎn)品配置迭代升級(jí)

Meta在AI領(lǐng)域研發(fā)底蘊(yùn)深厚，具有世界級(jí)話語(yǔ)權(quán)。由于社交平臺(tái)在推薦算法、廣告、搜索排名、推薦以及用戶數(shù)據(jù)分析等方面的需要，Meta很早便開(kāi)始布局人工智能技術(shù)。

2013年4月成立人工智能研究機(jī)構(gòu)FAIR，F(xiàn)AIR主要成就包括發(fā)布開(kāi)源機(jī)器學(xué)習(xí) 框架PyTorch、自然語(yǔ)言處理模型PyText等等。同時(shí)，Meta在AI領(lǐng)域通過(guò)收購(gòu)實(shí)現(xiàn)技術(shù)拓展。

2016年Meta收購(gòu)面部表情分析技術(shù)公司FacioMetrics以及聊天機(jī)器人開(kāi)發(fā)工具的公司Tugboat Yards；
2017年收購(gòu)人工智能個(gè)人助理應(yīng)用Ozlo和神經(jīng)網(wǎng)絡(luò)初創(chuàng)公司Deeplearning.ai；
2018年收購(gòu)了開(kāi)發(fā)用于理解和總結(jié)文本的自然語(yǔ)言處理技術(shù)英國(guó)初創(chuàng)公司Bloomsbury AI：
2019年收購(gòu)開(kāi)發(fā)大腦信號(hào)控制計(jì)算機(jī)技術(shù)的CTRL labs、收購(gòu)計(jì)算機(jī)視覺(jué)初創(chuàng)公司Scape Technologies；
2020年收購(gòu)利用人工智能和機(jī)器學(xué)習(xí)幫助企業(yè)管理客戶互動(dòng)的公司Kustomer；
2021年收購(gòu)使用人工智能和機(jī)器學(xué)習(xí)創(chuàng)建交互式游戲體驗(yàn)的公司Unit 2 Games、收購(gòu)AI聲音識(shí)別公司Audio Analytic。Meta在AI領(lǐng)域并購(gòu)數(shù)量較多，持續(xù)在AI技術(shù)領(lǐng)域擴(kuò)張，不斷汲取優(yōu)秀的技術(shù)人才。

數(shù)據(jù)來(lái)源：IT桔子，廣發(fā)證券發(fā)展研究中心

Meta持續(xù)探索AI技術(shù)，布局AI+VR/AR全面覆蓋前沿功能。2021年末Meta將其AI團(tuán)隊(duì)合并入負(fù)責(zé)開(kāi)發(fā)AR/VR產(chǎn)品的Reality Labs部門，其AI研發(fā)團(tuán)隊(duì)更加專注于元宇宙相關(guān)業(yè)務(wù)。

Meta持續(xù)以AI算法賦能VR/AR設(shè)備，技術(shù)涵蓋平臺(tái)、芯片、圖像生成、圖像渲染、眼動(dòng)追蹤、動(dòng)作捕捉、視聽(tīng)覺(jué)結(jié)合、虛擬背景處理、真實(shí)世界數(shù)據(jù)模擬、虛擬圖像生成等方面，全方位助力Meta Quest體驗(yàn)不斷提升。

MCC+MAV3D+ Bulider Bot，Meta加速實(shí)現(xiàn)虛擬現(xiàn)實(shí)“Chatgpt”。Meta的研究團(tuán) 隊(duì)結(jié)合視頻和3D生成模型的優(yōu)點(diǎn)，先后提出2D圖像轉(zhuǎn)換為3D模型的方法MCC與文本到4D（3D+時(shí)間）生成系統(tǒng)MAV3D（Make-A-Video3D）。

MCC為多視圖壓縮編碼技術(shù)，作為基于變壓器的編碼器-解碼器模型，可以從單個(gè)RGB-D圖像重建3D對(duì)象。MAV3D基于AIGC理念，是第一個(gè)基于文本描述產(chǎn)生3D動(dòng)態(tài)場(chǎng)景的方法，可以為電玩游戲、視覺(jué)效果或AR/VR產(chǎn)生動(dòng)畫3D資產(chǎn)。

利用MCC技術(shù)和MAV3D技術(shù)，Meta 有望加速在VR設(shè)備中實(shí)現(xiàn)AIGC，提供個(gè)性化內(nèi)容體驗(yàn)，并在虛擬環(huán)境中提供文本/ 語(yǔ)音信息的交互功能。進(jìn)一步地，Meta正在測(cè)試AI驅(qū)動(dòng)的Builder Bot程序，幫助用戶通過(guò)語(yǔ)音命令，在虛擬環(huán)境中讓AI一步步創(chuàng)建3D景觀，從而個(gè)性化地建造VR世界。

Quest Pro產(chǎn)品性能升級(jí)顯著，較Quest 2性能和價(jià)格均提升。2022年10月12日， Meta在Connect大會(huì)中正式發(fā)布高端設(shè)備系列的第一款產(chǎn)品Quest Pro，并于2022年 10月25日以1499.99美金的價(jià)格發(fā)售，包括Quest Pro頭顯、Touch Pro控制器、觸控筆、部分擋光器和充電座。Quest Pro較Quest 2性能和價(jià)格均提升，定位更高端。采用Pancake光學(xué)模組取代菲涅爾透鏡，輕薄度、清晰度等均較Quest 2有所提升。

Quest Pro的全新光學(xué)堆棧用Pancake光學(xué)模組取代了Quest 2中的菲涅爾透鏡，將產(chǎn)品體積縮小了40%以上，同時(shí)使透鏡中心視圖的全局視覺(jué)清晰度提升了25%、外圍區(qū)域清晰度提升了50%。

搭載兩塊使用Mini LED背光技術(shù)的2.48英寸高端LCD屏幕，單眼顯示分辨率達(dá)1820*1920px，每英寸像素?cái)?shù)比上代產(chǎn)品Quest2提升了37%，每度像素?cái)?shù)多10%，并提供1.3倍更大色域，畫面更為精細(xì)。

Mini LED具有局部調(diào)光能力，使用專門的背光組建和相應(yīng)的軟件算法，獨(dú)立控制多達(dá)500個(gè)單獨(dú)LED區(qū)域，將顯示器對(duì)比度提升75%。視場(chǎng)角從Quest 2的水平96度垂直96度提升至水平106度垂直96度，采用開(kāi)放外圍視圖，令頭顯模式更自然。

采用手動(dòng)線性瞳距調(diào)節(jié)，設(shè)置眼動(dòng)追蹤傳感器。相比于Quest 2采用固定三擋瞳距調(diào)節(jié)（58mm、63mm、68mm），Quest Pro采用線性調(diào)節(jié)機(jī)構(gòu)，通過(guò)滑軌和行星齒輪實(shí)現(xiàn)精確的雙目同步調(diào)節(jié)瞳距，調(diào)節(jié)范圍為55-75mm。同時(shí)配備眼動(dòng)追蹤傳感器，頭顯可以自動(dòng)測(cè)量用戶瞳距，便于用戶正確放置透鏡。

Quest Pro搭載全新第一代高通驍龍XR2+平臺(tái)，帶來(lái)更佳散熱表現(xiàn)和顯著性能保證，實(shí)現(xiàn)50%的續(xù)航提升和30%的散熱性能提升。相比XR2，XR2+提供兩倍的RAM （12GB）和更好的散熱解決方案支持，能夠以更高的速度運(yùn)行而不過(guò)熱。

驍龍XR2 +平臺(tái)還引入了全新圖像處理管線，能夠?qū)崿F(xiàn)低于10毫秒的時(shí)延，可以支持更即時(shí)的VST體驗(yàn)。該平臺(tái)支持并行感知技術(shù)，包括頭部、手勢(shì)和手柄追蹤、3D重建以及低時(shí)延視頻透視，為更逼真的虛擬人物賦予細(xì)致入微的面部表情，為開(kāi)啟卓越的全彩視頻透視MR體驗(yàn)提供支持。

除此之外，硬件端在手柄、承重、續(xù)航、面殼、聲學(xué)系統(tǒng)等方面還有提升。手柄方面，每個(gè)手柄都單獨(dú)內(nèi)置三個(gè)傳感器，采用攝像頭跟蹤，手柄不再受頭顯攝像頭限制，在任何位置都可以實(shí)現(xiàn)全方位360度跟蹤。

承重方面，Quest Pro產(chǎn)品重722克，相比503克的Quest 2有所增加。Quest Pro采用設(shè)計(jì)前端護(hù)額、將電池后置、增加承力拖與后枕等方式，對(duì)產(chǎn)品負(fù)重進(jìn)行了分化，中移重心，進(jìn)一步提高了佩戴舒適性。

續(xù)航方面，Quest Pro的續(xù)航時(shí)間只有1-2小時(shí)，相比續(xù)航時(shí)長(zhǎng)為2-3小時(shí)的Quest 2有所下降。Quest Pro首次使用內(nèi)置充電底座，保證用戶能在非使用時(shí)間保持頭顯充電。

面殼方面，Quest Pro面殼采用PC材料透明注塑工藝，面殼外延四周為格柵式設(shè)計(jì)，使得整個(gè)面殼和中框之間均分布有散熱孔，配合兩個(gè)散熱風(fēng)扇，整體散熱效果較Quest 2有較大提升。

聲學(xué)系統(tǒng)方面，Quest Pro音頻模組采用雙方形腔體喇叭設(shè)計(jì)，與Quest 2相比，可以提供較沉的低音，頭顯噪音比Quest 2減少10dB。

（四）蘋果 MR 頭顯發(fā)布在即，產(chǎn)業(yè)鏈迎來(lái)成長(zhǎng)機(jī)遇

蘋果公司全方位應(yīng)用AI技術(shù)，并購(gòu)增強(qiáng)技術(shù)能力。蘋果公司在手機(jī)、家居、AR等多個(gè)板塊均應(yīng)用人工智能技術(shù)提供智能化用戶體驗(yàn)。包括手機(jī)端上AI語(yǔ)音助手Siri幫助用戶完成語(yǔ)音控制、信息查詢和智能推薦等任務(wù)、智能家居產(chǎn)品HomeKit應(yīng)用了人工智能技術(shù)實(shí)現(xiàn)了家庭設(shè)備的互聯(lián)互通和智能控制、AR方面增強(qiáng)現(xiàn)實(shí)技術(shù)平臺(tái)ARKit，通過(guò)機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺(jué)技術(shù)實(shí)現(xiàn)了高質(zhì)量的增強(qiáng)現(xiàn)實(shí)體驗(yàn)等。

蘋果通過(guò)收購(gòu)初創(chuàng)企業(yè)持續(xù)擴(kuò)張AI技術(shù)能力，特別在面部識(shí)別、表情分析、動(dòng)作捕捉處理、圖像視覺(jué)等涉及AI+MR應(yīng)用領(lǐng)域方面，利用并購(gòu)持續(xù)增強(qiáng)技術(shù)能力。

2010年，蘋果收購(gòu)瑞典面部識(shí)別技術(shù)公司Polar Rose，布局面部識(shí)別相關(guān)技術(shù)。
2013年，蘋果收購(gòu)PrimeSense公司，從布局實(shí)時(shí)3D運(yùn)動(dòng)捕捉相關(guān)技術(shù)。
2015年，蘋果收購(gòu)專門從事面部動(dòng)畫和動(dòng)作捕捉的Faceshift。
2016年，蘋果收購(gòu)研發(fā)面部表情分析工具的Emotient，該公司通過(guò)人工智能及機(jī)器學(xué)習(xí)技術(shù)來(lái)分析人類表情；
2017年，蘋果收購(gòu)從事面部識(shí)別技術(shù)的網(wǎng)絡(luò)安全和機(jī)器學(xué)習(xí)公司RealFace，該技術(shù)有可能用于未來(lái)的增強(qiáng)現(xiàn)實(shí)功能。
2018年，蘋果收購(gòu)瑞士公司Flashwell，從事AI圖像視覺(jué)研發(fā)。蘋果自2015年以來(lái)，已收購(gòu)多家初創(chuàng)企業(yè)，持續(xù)在AI領(lǐng)域擴(kuò)張，不斷汲取優(yōu)秀的技術(shù)人才。AIGC技術(shù)疊加Siri語(yǔ)音助手，有望助力蘋果在頭顯中實(shí)現(xiàn)虛擬世界的ChatGPT。
2022年蘋果首次展示了GAUDI AI用于沉浸式3D場(chǎng)景生成的神經(jīng)網(wǎng)絡(luò)AI系統(tǒng)，可以根據(jù)文本提示創(chuàng)建3D場(chǎng)景，實(shí)現(xiàn)3D場(chǎng)景的AIGC。

GAUDI模型通過(guò)三個(gè)專門的解碼器實(shí)現(xiàn)3D場(chǎng)景的AIGC：相機(jī)姿態(tài)解碼器對(duì)相機(jī)可能位置進(jìn)行預(yù)測(cè)，并確保3D場(chǎng)景輸出的位置有效架構(gòu)的有效位置；場(chǎng)景解碼器負(fù)責(zé)形成3D的畫布來(lái)展示物體；輻射場(chǎng)解碼器負(fù)責(zé)渲染繪制后續(xù)圖像。

憑借GAUDI AI系統(tǒng)，蘋果正在為渲染3D對(duì)象和場(chǎng)景的生成式人工智能系統(tǒng)奠定基礎(chǔ)，這一系統(tǒng)可能應(yīng)用于蘋果的XR頭顯中，實(shí)現(xiàn)3D內(nèi)容生成。進(jìn)一步地，GAUDI模型有望與Siri結(jié)合實(shí)現(xiàn)低門檻的3D場(chǎng)景生成功能。

據(jù)The Information報(bào)道，蘋果MR頭顯對(duì)話式系統(tǒng)與Meta BuilderBot類似，幫助用戶利用Siri語(yǔ)音助手，通過(guò)與Siri語(yǔ)音交互對(duì)虛擬動(dòng)物設(shè)計(jì)、場(chǎng)景移動(dòng)方式等描述以實(shí)現(xiàn)三維場(chǎng)景創(chuàng)建，此外系統(tǒng)還可以計(jì)算出物理空間中的障礙物，并為虛擬動(dòng)物附加自然的物理交互。GAUDI與Siri的結(jié)合，有望幫助蘋果頭顯中實(shí)現(xiàn)虛擬世界的ChatGPT。

數(shù)據(jù)來(lái)源：蘋果Gaudi項(xiàng)目github官網(wǎng)，廣發(fā)證券研究中心

蘋果MR頭顯產(chǎn)品發(fā)布在即，具備四大核心亮點(diǎn)。預(yù)計(jì)蘋果公司首次推出的MR設(shè)備將以專業(yè)人士和開(kāi)發(fā)者為主要用戶，服務(wù)于高端市場(chǎng)。根據(jù)Metaverse元宇宙，蘋果MR頭顯具備四大亮點(diǎn)，包括一鍵切換VR/AR模式，可以使產(chǎn)品更好地與現(xiàn)實(shí)世界直接結(jié)合，為MR內(nèi)容交互提供更多的空間；

眼動(dòng)追蹤及手部追蹤功能，能夠更好地提升用戶體驗(yàn)，突破交互方式；視頻會(huì)議功能，能在虛擬世界中逼真地渲染用戶的面部和全身，增強(qiáng)體驗(yàn)感；外接生產(chǎn)力工具方面，蘋果MR頭顯能夠作為連接Mac的外部顯示器，并且用戶還能在戴上頭顯之后，使用觸控板或者鼠標(biāo)、物理按鍵控制設(shè)備。

根據(jù)蘋果官網(wǎng)，年度全球開(kāi)發(fā)者大會(huì)（WWDC）定檔于北京時(shí)間2023年6月6日至10日，旨在展示iOS、iPadOS、macOS、watchOS和tvOS的前沿創(chuàng)新。

蘋果MR頭顯配置參數(shù)領(lǐng)先，有望成為新一代標(biāo)志性產(chǎn)品。根據(jù)VR陀螺援引硅谷媒體The Information關(guān)于MR產(chǎn)品的報(bào)道：硬件方面，電池外置，通過(guò)磁性電源線與頭顯的頭帶連接，用戶可以自行更換電池以獲得更好的續(xù)航表現(xiàn)；

機(jī)身材質(zhì)為鋁、玻璃和碳纖維，可減小設(shè)備的尺寸和重量，出于審美原因考慮，頭顯的相機(jī)模塊很大程度上都被隱藏了；頭顯右側(cè)設(shè)有小表盤，可通過(guò)表盤實(shí)現(xiàn)虛擬世界和現(xiàn)實(shí)世界的快速切換；擁有面向消費(fèi)者和開(kāi)發(fā)者的不同材質(zhì)頭帶；采用Micro OLED屏幕，單眼分辨率達(dá)4K；每只眼睛都至少被一顆攝像頭追蹤，使Avatar能更好展現(xiàn)用戶真實(shí)表情。

眼動(dòng)追蹤功能還可用于實(shí)現(xiàn)注視點(diǎn)渲染，即僅對(duì)用戶注視區(qū)域進(jìn)行全分辨率圖像渲染以節(jié)省電量；頭顯內(nèi)置10余顆攝像頭和傳感器，用于完成捕捉外部環(huán)境、面部表情、身體動(dòng)作等，同時(shí)完成VST透視，定位等一系列工作；頭顯也將配備LiDAR 掃描儀，用于對(duì)周圍環(huán)境進(jìn)行掃描，描繪三維空間中周圍物體的表面細(xì)節(jié)與距離。

MR頭顯不設(shè)3.5mm耳機(jī)接口，內(nèi)置H2芯片，可與第二代AirPods Pro和未來(lái)的 AirPods耳機(jī)進(jìn)行超低延遲連接；前設(shè)外向屏幕；可定制磁吸式屈光度調(diào)節(jié)鏡片并支持自動(dòng)瞳距調(diào)節(jié)；FOV為120°，超過(guò)Meta Quest Pro的106°；內(nèi)置兩顆芯片，包括一顆主SOC（包括CPU、GPU和內(nèi)存），以及一顆專用的圖像信號(hào)處理器，兩者均采用5nm工藝打造；專用的ISP，將外部攝像頭捕捉到的扭曲圖像轉(zhuǎn)化為穩(wěn)定的視頻圖像，并具有低延遲性。

主攻教育、健康、游戲、視聽(tīng)四大應(yīng)用場(chǎng)景，AppleTV+團(tuán)隊(duì)或成內(nèi)容研發(fā)主力。蘋果圍繞健康、教育、游戲、視聽(tīng)四大場(chǎng)景對(duì)其MR內(nèi)容有所布局，例如開(kāi)發(fā)有助于冥想和鍛煉的AR應(yīng)用程序，讓用戶在看書(shū)的過(guò)程中體驗(yàn)到奇幻的環(huán)境與現(xiàn)實(shí)世界融為一體的感受，讓用戶處于沙漠或者太空?qǐng)鼍爸杏^看視頻，創(chuàng)建底層引擎為MR游戲提供支持。

根據(jù)Metaverse元宇宙，蘋果的內(nèi)容團(tuán)隊(duì)由一個(gè)代號(hào)為Z50的團(tuán)隊(duì)研發(fā)，規(guī)模約為幾十人，該團(tuán)隊(duì)成員多數(shù)都是來(lái)自視頻、游戲等領(lǐng)域，其主要任務(wù)為根據(jù)自身過(guò)去的流媒體服務(wù)Apple TV+中的經(jīng)驗(yàn)，為MR頭顯打造內(nèi)容。彭博社記者 Mark Gurman報(bào)道，蘋果正在將自家常用的FaceTime、筆記等軟件移植到頭顯當(dāng)中，另外它也可以充當(dāng)Mac設(shè)備的“第二屏”。

數(shù)據(jù)來(lái)源：Metaverse元宇宙，廣發(fā)證券發(fā)展研究中心

蘋果MR頭顯為光學(xué)產(chǎn)業(yè)下一代關(guān)鍵成長(zhǎng)驅(qū)動(dòng)，產(chǎn)業(yè)鏈相關(guān)公司有望持續(xù)受益。從蘋果MR頭顯設(shè)備結(jié)構(gòu)來(lái)看，該設(shè)備包含攝像頭模組、鏡頭、檢測(cè)設(shè)備、透鏡模組、 PCB&FPC、視覺(jué)調(diào)焦模組、芯片、揚(yáng)聲器、頭盔結(jié)構(gòu)件等多個(gè)零部件。蘋果MR產(chǎn) 業(yè)鏈廠商將共同助力蘋果MR產(chǎn)品的生產(chǎn)組裝環(huán)節(jié)，蘋果MR頭顯硬件參數(shù)的持續(xù)提升以及應(yīng)用場(chǎng)景的持續(xù)豐富有望帶動(dòng)整個(gè)產(chǎn)業(yè)鏈加速擴(kuò)展。

三、聽(tīng)覺(jué)：AIGC 開(kāi)啟聽(tīng)覺(jué)盛宴，打開(kāi)硬件成長(zhǎng)空間

（一）AIGC 賦能音頻內(nèi)容，從語(yǔ)音生成到 AI 作曲應(yīng)用廣泛

AIGC通過(guò)提取信息生成音頻，TTS領(lǐng)域應(yīng)用較為成熟。TTS即Text-to-speech，主要是基于AI的自然語(yǔ)言處理+語(yǔ)音合成技術(shù)把文字轉(zhuǎn)化為自然語(yǔ)音。TTS應(yīng)用較為成熟，國(guó)內(nèi)外眾多互聯(lián)網(wǎng)巨頭旗下產(chǎn)品均提供智能語(yǔ)音合成服務(wù)，例如Google Text-toSpeech、Amazon Polly、IBM Watson Text-to-Speech、喜馬拉雅、字節(jié)跳動(dòng)剪映等等，廣泛應(yīng)用于客服、有聲讀物制作、語(yǔ)音播報(bào)、視頻配音等領(lǐng)域。

TTS技術(shù)的突破點(diǎn)在于不斷結(jié)合文本信息，通過(guò)語(yǔ)音語(yǔ)調(diào)、語(yǔ)音情感等提升對(duì)文本的表現(xiàn)力，以及提升基于用戶的個(gè)性化能力，AI模型能力不斷提升使得TTS技術(shù)取得長(zhǎng)足進(jìn)步。

此外，語(yǔ)音克隆本質(zhì)上是一種模仿目標(biāo)聲音音色、語(yǔ)調(diào)、語(yǔ)音習(xí)慣的TTS，契合聲音IP 化的潮流，目前也正在配音、虛擬人、地圖導(dǎo)航語(yǔ)音等方面得到廣泛應(yīng)用，例如喜馬拉雅運(yùn)用TTS技術(shù)重現(xiàn)單田芳聲音版《毛氏三兄弟》；標(biāo)貝科技旗下恐龍貝克APP采用AI語(yǔ)音合成技術(shù)，通過(guò)為孩子復(fù)刻父母親聲音；與奧飛娛樂(lè)合作將超級(jí)飛俠樂(lè)迪/ 小愛(ài)的聲音定制成TTS聲音等等，極大程度豐富用戶體驗(yàn)。

AIGC簡(jiǎn)化作曲編曲過(guò)程，主流平臺(tái)應(yīng)用成趨勢(shì)。隨著計(jì)算機(jī)技術(shù)的發(fā)展，在音樂(lè)創(chuàng)作領(lǐng)域，AI的應(yīng)用已經(jīng)逐漸成熟。AI能以語(yǔ)言模型作為中介，將語(yǔ)音描述的特性信息轉(zhuǎn)化為音樂(lè)數(shù)據(jù)；也可以基于主旋律和用戶偏好生成不同類型的和弦以及模擬不同的樂(lè)器聲音，幫助創(chuàng)作者完成編曲。

2017年，Amper Music幫助美國(guó)歌手Taryn Southern完成了歷史上第一部由AI作曲的專輯《I AM AI》，作者將主打單曲《Break Free》的一段旋律放入了AI音樂(lè)合成器Amper Music中，利用程序自動(dòng)添加和弦，生成副歌。

2019Amper Music于年推出首個(gè)人工智能作曲平臺(tái)Amper Score TM，幫助使用者創(chuàng)作定制音樂(lè)，幫助視頻編輯者選擇音樂(lè)和編輯音樂(lè)的時(shí)間。目前，自動(dòng)編曲功能已在國(guó)內(nèi)主流音樂(lè)平臺(tái)上線，QQ音樂(lè)成為Amper music的API合作伙伴，騰訊AI Lab推出AI虛擬偶像“艾靈”，結(jié)合用戶提供的關(guān)鍵詞生成歌詞并演唱；

2022年1月網(wǎng)易推出首個(gè)人工智能音樂(lè)創(chuàng)作平臺(tái)網(wǎng)易天音；華為HMS Core音頻編輯服務(wù)與唱鴨音樂(lè)社區(qū)軟件基于華為獨(dú)創(chuàng)的AI Singer模型，推出“AI創(chuàng)作歌姬”功能，用戶只需輸入歌詞、選擇喜歡的音樂(lè)風(fēng)格，就會(huì)自動(dòng)生成動(dòng)聽(tīng)的歌曲。

數(shù)據(jù)來(lái)源：網(wǎng)易天音官網(wǎng)，廣發(fā)證券發(fā)展研究中心

（二）智能音箱著重交互與智能控制，AI 推動(dòng)各品牌產(chǎn)品創(chuàng)新升級(jí)

智能音箱是家庭場(chǎng)景交互中心與IoT控制中心，智能化需求明確。智能音箱基于自然語(yǔ)言處理以及物聯(lián)網(wǎng)技術(shù)，關(guān)鍵特性包括語(yǔ)音交互、內(nèi)容分享及智能家居控制。智能音箱應(yīng)用場(chǎng)景不斷增加，從最初的語(yǔ)音控制的音樂(lè)播放器，發(fā)展到家庭場(chǎng)景中僅有的人機(jī)交互電器之一，并在人工智能語(yǔ)音控制技術(shù)加持下進(jìn)一步與其他智能家居互聯(lián)，逐步成為智能家居設(shè)備控制中心。

在交互中心層面，目前各品牌智能音箱已經(jīng)滿足基本交互需求，尤其是在講故事、家庭教育、播放音樂(lè)、簡(jiǎn)單問(wèn)答等方面具備較強(qiáng)能力，例如百度旗下的小度智能音箱內(nèi)置較為強(qiáng)大的家教功能，通過(guò)智能問(wèn)答、智能日程設(shè)計(jì)、家教資源內(nèi)容輸出等方式參與家庭教育環(huán)節(jié)。

在控制中心層面，目前主流智能音箱已經(jīng)能透過(guò)物聯(lián)網(wǎng)功能對(duì)家庭電器進(jìn)行控制，例如天貓精靈能夠控制家庭情景中空調(diào)、燈光等各類電器，完成開(kāi)關(guān)、調(diào)檔等功能。

AI技術(shù)持續(xù)加持各品牌智能音箱交互與控制性能，提升用戶體驗(yàn)。小度、天貓精靈、小愛(ài)同學(xué)等國(guó)內(nèi)主流智能音箱廠商持續(xù)在連續(xù)對(duì)話、眼神/童臉/手勢(shì)控制、全雙工免喚醒、DLNA投屏等方面運(yùn)用AI黑科技持續(xù)拓展交互能力。

語(yǔ)音交互上，智能音箱語(yǔ)音云端操作系統(tǒng)已經(jīng)較為成熟，例如科大訊飛旗下iFLYOS平臺(tái)能幫助智能音箱廠商自選喚醒詞、發(fā)音人、系統(tǒng)畫像等進(jìn)行場(chǎng)景定制的語(yǔ)音交互引擎開(kāi)發(fā)，應(yīng)用在中興智能音箱等設(shè)備上；2020年小度智能音箱搭載了百度首款專門針對(duì)遠(yuǎn)場(chǎng)語(yǔ)音交互研發(fā)的鴻鵠芯片，實(shí)現(xiàn)更高水平的語(yǔ)音交互。

控制方式上，以小度智能音箱為例，小度于2018年6月首次發(fā)布連續(xù)對(duì)話技術(shù)，實(shí)現(xiàn)了人與智能音箱連續(xù)對(duì)話，改善人機(jī)交互中無(wú)法多輪對(duì)話、需要多次重復(fù)喚醒問(wèn)題；2019年7月小度首發(fā)全雙工免喚醒能力，同時(shí)實(shí)現(xiàn)“一次喚醒，多輪交互”以及人機(jī)對(duì)話與人人對(duì)話互不干擾。

2019年12月小度提出了兼具全雙工免喚醒、眼神喚醒、手勢(shì)控制在內(nèi)的多模態(tài)交互方式?？傮w上，前沿人工智能技術(shù)的突飛猛進(jìn)，幫助各品牌廠商智能音箱不斷實(shí)現(xiàn)交互與控制能力的提升。

（三）AIGC 應(yīng)用落地在即，打開(kāi)音頻終端設(shè)備未來(lái)市場(chǎng)空間

智能交互與家庭場(chǎng)景深度匹配，AIGC加持下智能音箱有望實(shí)現(xiàn)飛躍。當(dāng)前的智能音箱的交互更類似于簡(jiǎn)單的語(yǔ)音助手以及搜索引擎，能力受限，往往智能對(duì)于特定指令進(jìn)行回應(yīng)。而未來(lái)，在生成式AI模型加持下，智能音箱能夠給出更加豐富、更加準(zhǔn)確的反饋，提升消費(fèi)者的體驗(yàn)。

同時(shí)在控制層面，AIGC能力有望幫助智能音箱更深層次理解人類指令，并進(jìn)一步實(shí)現(xiàn)對(duì)家庭內(nèi)部各類物聯(lián)網(wǎng)設(shè)備的復(fù)雜控制，強(qiáng)化家庭設(shè)備控制中心的地位。根據(jù)IDC數(shù)據(jù)，2022年包括智能音箱在內(nèi)的家庭智能設(shè)備市場(chǎng)規(guī)模為306.3億美元，預(yù)計(jì)到2026年市場(chǎng)規(guī)模將達(dá)到382.9億美元，CAGR為5.7%。

預(yù)計(jì)在AIGC加持下，作為家庭智能設(shè)備交互中心與控制入口的智能音箱有望不斷增強(qiáng)交互與控制能力，在家庭內(nèi)部家庭教育、電器控制、起居輔助等方面進(jìn)一步提升用戶體驗(yàn)，銷量進(jìn)一步提升。

四、安防：AIGC 有望與安防緊密結(jié)合，驅(qū)動(dòng)泛安防產(chǎn)業(yè)智能化升級(jí)

大語(yǔ)言模型朝著多模態(tài)方向發(fā)展，多應(yīng)用場(chǎng)景均開(kāi)始布局。GPT4.0轉(zhuǎn)向多模態(tài)，新增了圖像輸入，能同時(shí)進(jìn)行文本和視覺(jué)處理的多模態(tài)大模型已是技術(shù)變革方向。與此同時(shí)，當(dāng)前海內(nèi)外大廠紛紛在更多文字生成、社交娛樂(lè)、音視頻、辦公等領(lǐng)域布局或引入大語(yǔ)言模型的發(fā)展，并朝著多模態(tài)方向發(fā)展。

數(shù)據(jù)來(lái)源：OpenAI官網(wǎng)，廣發(fā)證券發(fā)展研究中心

AIGC驅(qū)動(dòng)安防智能化升級(jí)，市場(chǎng)潛力逐漸顯現(xiàn)。AIGC作為新型的內(nèi)容生產(chǎn)基礎(chǔ)設(shè)施對(duì)既有的內(nèi)容生成模式可產(chǎn)生革命式影響，一方面其已在辦公、影視、繪畫等內(nèi)容需求豐富的行業(yè)取得顯著發(fā)展，另一方面原本已和AI結(jié)合的安防、制造等行業(yè)也正在AIGC大潮下朝著更加智能化的方向發(fā)展，市場(chǎng)潛力逐漸顯現(xiàn)。

AI已和安防行業(yè)緊密結(jié)合，安防在ChatGPT時(shí)代還有望獲得更快速發(fā)展。近幾年，傳統(tǒng)安防已通過(guò)物聯(lián)網(wǎng)、云計(jì)算、AI等技術(shù)升級(jí)為智慧安防。據(jù)IDC數(shù)據(jù)，視頻監(jiān)控、人臉識(shí)別、智能攝像頭等泛安防是中國(guó)近年來(lái)已部署和計(jì)劃部署的重點(diǎn)AI領(lǐng)域，也是AI最先商業(yè)化的領(lǐng)域之一。隨著AIGC時(shí)代的來(lái)臨，智慧安防可進(jìn)一步升級(jí)。

具體而言，ChatGPT可以通過(guò)分析和處理大量語(yǔ)音、文本和圖像數(shù)據(jù)，幫助識(shí)別并分類人、車輛、動(dòng)物等不同對(duì)象，幫助安全系統(tǒng)快速識(shí)別異常事件，以及實(shí)現(xiàn)更精細(xì)化的數(shù)據(jù)分析和挖掘，進(jìn)一步提升預(yù)測(cè)準(zhǔn)確率等。

同時(shí)，ChatGPT的應(yīng)用還將促進(jìn)安防與其他相關(guān)領(lǐng)域合作，以谷歌和微軟等廠商致力于利用神經(jīng)網(wǎng)絡(luò)進(jìn)行機(jī)器人控制為例，將視覺(jué)數(shù)據(jù)以及大型語(yǔ)言模型結(jié)合起來(lái)，也可推動(dòng)安防機(jī)器人的發(fā)展。ChatGPT和AIGC技術(shù)的應(yīng)用，可以幫助安防產(chǎn)品實(shí)現(xiàn)更高效的數(shù)據(jù)處理和管理，從而大幅提升安防系統(tǒng)的反應(yīng)速度和處理能力，有望實(shí)現(xiàn)一定程度降本增效，大力推動(dòng)智慧安防乃至智能物聯(lián)網(wǎng)行業(yè)發(fā)展。

?？低暫痛笕A股份是智能物聯(lián)龍頭，泛安防產(chǎn)品的AI產(chǎn)業(yè)化進(jìn)展迅速。?？低暯陙?lái)積累在CV、AI等底層技術(shù)進(jìn)行泛安防軟硬件產(chǎn)品布局，并提供AI開(kāi)發(fā)平臺(tái)服務(wù)。截至2021年年底，海康的AI開(kāi)發(fā)平臺(tái)服務(wù)企業(yè)用戶超過(guò)8000家，生成模型5000 個(gè)，積累落地項(xiàng)目4000個(gè)。

此外，繼螢石分拆后，子公司海康機(jī)器人也申報(bào)上市，公司與AI緊密相關(guān)的創(chuàng)新智能物聯(lián)業(yè)務(wù)進(jìn)展迅速。大華股份的AI能力的落地一方面體現(xiàn)在端、邊、云產(chǎn)品的產(chǎn)業(yè)化之中，將AI與公司產(chǎn)品強(qiáng)融合，另一方面體現(xiàn)在將AI 與公司產(chǎn)品強(qiáng)融合通過(guò)ICC和云睿兩大平臺(tái)，融合數(shù)字化生態(tài)，推進(jìn)產(chǎn)業(yè)AI化。

為完成公司AI基礎(chǔ)能力與企業(yè)業(yè)務(wù)的彼此互補(bǔ)，大華也打造了一款低成本、快迭代、低門檻、全協(xié)同的一站式人工智能開(kāi)發(fā)平臺(tái)――DahuaJinn大華巨靈平臺(tái)，實(shí)現(xiàn)組裝式算法開(kāi)發(fā)模式，推動(dòng)感知智能、數(shù)據(jù)智能、業(yè)務(wù)智能閉環(huán)產(chǎn)業(yè)化落地。

2023年3月30日，大華股份宣布向中國(guó)移動(dòng)發(fā)行股票程序落地，非公開(kāi)發(fā)行股票2.93億股，每股發(fā)行價(jià)格為17.40元，實(shí)際募資資金凈額50.89億元，限售期為36個(gè)月。本次定增后，中國(guó)移動(dòng)成為大華第二大股東，占比8.81%，持續(xù)推動(dòng)公司智慧物聯(lián)領(lǐng)域發(fā)展。

數(shù)據(jù)來(lái)源：海康威視AI開(kāi)發(fā)平臺(tái)，廣發(fā)證券發(fā)展研究中心

文章來(lái)源：未來(lái)智庫(kù)；報(bào)告出品方：廣發(fā)證券

更多精彩內(nèi)容請(qǐng)關(guān)注公眾號(hào)：BFT機(jī)器人
版權(quán)歸BFT機(jī)器人所有，如需轉(zhuǎn)載請(qǐng)與我們聯(lián)系。若您對(duì)該文章內(nèi)容有任何疑問(wèn)，請(qǐng)與我們聯(lián)系，將及時(shí)回應(yīng)。

標(biāo)簽：