每日文章學(xué)習(xí)
HMI車載設(shè)計(jì)人機(jī)交互系統(tǒng)課 4月18日打卡@郝小七的HMI設(shè)計(jì)圈?
如何從零設(shè)計(jì)車載語(yǔ)音軟件功能
一、國(guó)內(nèi)車載語(yǔ)音市場(chǎng)的現(xiàn)狀
主流:科大訊飛、Nuance、百度、思必馳、云知聲等等。
其他:騰訊的語(yǔ)音服務(wù)、阿里的語(yǔ)音服務(wù)。
主流服務(wù)項(xiàng)目:
1.語(yǔ)音識(shí)別能力:符合條件的情況下識(shí)別率保持95%以上
2.語(yǔ)音合成能力:各家差別大
3.方言口語(yǔ)理解:高魯棒性是關(guān)鍵(高魯棒性:高魯棒性就是指系統(tǒng)或者網(wǎng)絡(luò)很健壯,很穩(wěn)健。控制系統(tǒng)的魯棒性是指系統(tǒng)在不確定性的擾動(dòng)下,具有保持某種性能不變的能力。)
4.語(yǔ)義識(shí)別:資源服務(wù)整合能力基本相同
5.多輪對(duì)話:特定場(chǎng)景多輪對(duì)話,體驗(yàn)不太好
特點(diǎn):沒有明確商業(yè)化模式,功能趨同,從純粹技術(shù)提供商往整體解決方案商發(fā)展。
車載語(yǔ)音解決方案合作模式
要求不高的車載項(xiàng)目:采用方案商提供的集成化較高的語(yǔ)音SDK進(jìn)行二次開發(fā),或是采用服務(wù)商的APK進(jìn)行簡(jiǎn)單的定制和適配工作。
優(yōu)點(diǎn):節(jié)省大量的開發(fā)成本,保證核心語(yǔ)音服務(wù)模塊的質(zhì)量。
車內(nèi)搭載語(yǔ)音服務(wù)的智能硬件
1. 智能車機(jī):支持語(yǔ)音使用場(chǎng)景,讓語(yǔ)音、系統(tǒng)和車輛三位一體。
2. 智能后視鏡:相對(duì)來(lái)說(shuō)系統(tǒng)稍微輕量化一些,語(yǔ)音功能只會(huì)負(fù)責(zé)一些簡(jiǎn)單的任務(wù)處理;
3. 智能HUD:核心資源聚焦駕駛過程中的車輛、道路、安全等信息的投射,比較注重視覺呈現(xiàn)的質(zhì)量,語(yǔ)音功能作為一個(gè)重要功能輔助操作;
4. 車載音箱伴侶:語(yǔ)音服務(wù)是音箱產(chǎn)品最核心的功能,車載音箱更多的是針對(duì)車內(nèi)空間的場(chǎng)景,主要聚焦在用戶多輪次的交互對(duì)話體驗(yàn)和車生活服務(wù)的豐富度。
二、核心流程拆解
涉及角色:自建TSP平臺(tái)、語(yǔ)音服務(wù)提供商、硬件廠商、互聯(lián)網(wǎng)服務(wù)提供商、三方硬件等。
業(yè)務(wù)架構(gòu):以硬件為載體,服務(wù)平臺(tái)化集成的形式,整體打包后提供給終端車主用戶。
業(yè)務(wù)流程圖:發(fā)出語(yǔ)音操作→錄音上傳數(shù)據(jù)→識(shí)別語(yǔ)音語(yǔ)義→準(zhǔn)備服務(wù)資源執(zhí)→行返回結(jié)果
三、模塊設(shè)計(jì)
01-語(yǔ)音交互
語(yǔ)音啟動(dòng)的方式:界面點(diǎn)擊和語(yǔ)音喚醒
設(shè)計(jì)語(yǔ)音喚醒功能步驟:判斷并記錄語(yǔ)音喚醒方式→提示信息和語(yǔ)音錄取狀態(tài)的反饋→判斷語(yǔ)音錄入是否正?!祷貙?duì)應(yīng)的識(shí)別結(jié)果(中途打斷需要重新開始語(yǔ)音流程)
02-語(yǔ)義的場(chǎng)景化設(shè)計(jì)
語(yǔ)義的豐富度直接關(guān)系到用戶體驗(yàn)度
語(yǔ)義少:不能滿足用戶多場(chǎng)景需求,喪失好感度,放棄語(yǔ)音功能使用
定義用戶滿意度和語(yǔ)義完整度:用戶調(diào)研,經(jīng)驗(yàn)總結(jié)得出真需求。
車載場(chǎng)景的語(yǔ)義細(xì)分后,主要分為以下幾個(gè)場(chǎng)景
● 導(dǎo)航場(chǎng)景
● 音樂/電臺(tái)場(chǎng)景
● 電話場(chǎng)景
● 系統(tǒng)控制類
● 車輛控制類
● 定制化服務(wù)類
03-幫助&設(shè)置
幫助方式:①在語(yǔ)音全局顯示時(shí)給出使用說(shuō)明;②失敗或等待時(shí)給出信息提示
目的:引導(dǎo)用戶正確使用語(yǔ)音功能
設(shè)置:常用的免喚醒開關(guān)、喚醒詞、語(yǔ)音的音源邏輯、語(yǔ)音主題包的變更設(shè)置等。
四、TTS語(yǔ)音播報(bào)
TTS(Text To Speech)語(yǔ)音播報(bào)主要是通過AI技術(shù)把文本信息進(jìn)行智能化合成,轉(zhuǎn)述成語(yǔ)音信息播報(bào)給用戶,從而給用戶一種智能擬人化的交互體驗(yàn)。
現(xiàn)狀:無(wú)法脫離語(yǔ)音素材錄制,對(duì)語(yǔ)音包的種類數(shù)量和質(zhì)量提升要求高,設(shè)計(jì)上受制于服務(wù)商的綜合能力,會(huì)更加聚焦如何更好的提升語(yǔ)音交互對(duì)話的體驗(yàn)。
總結(jié):如何讓語(yǔ)音功能更有效的提升用戶使用體驗(yàn)和滿意度,則需要針對(duì)每個(gè)業(yè)務(wù)的實(shí)際需求和目標(biāo)用戶群體特征去進(jìn)行更深入的差異化研究和設(shè)計(jì)。