在政策與AI技術(shù)的雙重推動(dòng)下,音頻行業(yè)進(jìn)入了蓬勃發(fā)展期。
數(shù)據(jù)顯示,中國(guó)在線音頻市場(chǎng)收入在2016年至2020年保持著69.4%的年復(fù)合增長(zhǎng)率,從16億元增長(zhǎng)至131億元。
易觀千帆數(shù)據(jù)顯示,2021年中國(guó)在線音頻娛樂(lè)市場(chǎng)規(guī)模已達(dá)到220億元,預(yù)計(jì)2025年將達(dá)到1038億元。自2021年3月以來(lái),國(guó)內(nèi)在線音頻市場(chǎng)月活躍人數(shù)穩(wěn)定在3億人次,整體處于穩(wěn)步上漲的趨勢(shì),在整個(gè)“耳朵經(jīng)濟(jì)”市場(chǎng)體量龐大、滲透率高的驅(qū)動(dòng)下有較大增長(zhǎng)空間。
截止2023年7月,全網(wǎng)在線音頻娛樂(lè)用戶規(guī)模達(dá)86225.94萬(wàn),日均活躍人數(shù)為18602.18萬(wàn),全網(wǎng)滲透率達(dá)82.16%,對(duì)比2022年8月,這個(gè)數(shù)字上漲了超3000萬(wàn)人。
此外,從使用時(shí)長(zhǎng)來(lái)看,易觀千帆數(shù)據(jù)顯示,截止2023年7月,音頻娛樂(lè)行業(yè)使用時(shí)長(zhǎng)超過(guò)3小時(shí),月人均啟動(dòng)次數(shù)達(dá)到33次以上,也就是說(shuō),每月有超過(guò)80%的互聯(lián)網(wǎng)用戶平均每天會(huì)至少打開(kāi)一次音頻娛樂(lè)軟件。
由此可以看出,在當(dāng)下的中國(guó)互聯(lián)網(wǎng)用戶群體中,大部分用戶對(duì)音頻這一娛樂(lè)形式已經(jīng)形成一定的消費(fèi)習(xí)慣,音頻正逐步成為用戶在多元時(shí)間和場(chǎng)景下的重要信息和娛樂(lè)選擇
抓住內(nèi)容優(yōu)勢(shì),提升用戶粘性
對(duì)于音頻娛樂(lè)行業(yè)而言,內(nèi)容是吸引用戶和留住用戶的關(guān)鍵要素。
一方面,AI 技術(shù)的進(jìn)步正在加速音頻內(nèi)容的創(chuàng)作效率及內(nèi)容分發(fā)效率,為用戶在不同場(chǎng)景下提供更加多元的內(nèi)容,滿足用戶的不用需求,2023年,ChatGPT技術(shù)橫空出世,有了AIGC技術(shù)的賦能,在線音頻平臺(tái)在內(nèi)容生產(chǎn)、用戶交互、虛擬主播打造等方面也迎來(lái)更廣闊的創(chuàng)新發(fā)展空間;
另一方面,年輕人已經(jīng)成為在線音頻用戶的主力,2022年我國(guó)在線音頻用戶畫(huà)像呈現(xiàn)出明顯的年輕化特點(diǎn),35歲以下用戶占比超過(guò)80%。
易觀千帆數(shù)據(jù)顯示,我國(guó)在線音頻用戶的基本畫(huà)像呈現(xiàn)出年輕、具備高消費(fèi)能力、居住于大城市的男性的特征。具體而言,在性別方面,男性用戶是主力軍,占比達(dá)到63.24%;在年齡層次方面,以90后為主,24-30歲的用戶占比達(dá)到64.99%;在城市級(jí)別方面,超一線和一線城市用戶組成核心部分,比例將近60%;在消費(fèi)能力方面,中高以上消費(fèi)人群是當(dāng)下的主流用戶,占比高達(dá)70%。
整體來(lái)看,在線用戶對(duì)音頻內(nèi)容的使用頻率處于高等水平。超過(guò)八成的用戶有每周聽(tīng)音頻的習(xí)慣,一周聽(tīng)3-6次的用戶是最為龐大的群體,其次是每天都聽(tīng)音頻的用戶,占比達(dá)到20%以上。
大部分在線用戶不局限于使用一款音頻軟件,在不同軟件之間切換是常態(tài)。超過(guò)七成的用戶在電子設(shè)備中下載的音頻軟件數(shù)量在3個(gè)以上,擁有3-5個(gè)軟件的用戶群體占比最高,達(dá)到46%。
在此背景下,在線音頻平臺(tái)紛紛通過(guò)加大對(duì)新技術(shù)的研發(fā)投入,滿足用戶多元化、個(gè)性化的需求,為客戶提供更為優(yōu)質(zhì)的服務(wù),不斷提升用戶體驗(yàn);同時(shí)借助AI技術(shù)聚焦平臺(tái)自身運(yùn)營(yíng)管理效率的提高,助力音頻內(nèi)容生產(chǎn)的提質(zhì)增速,激活體驗(yàn)場(chǎng)景。
2022年,云聽(tīng)獲得總臺(tái)音頻版權(quán),憑借總臺(tái)的優(yōu)勢(shì)資源,同時(shí)加大AI技術(shù)的投入,在主流音頻平臺(tái)中起到引領(lǐng)作用。具體來(lái)看,云聽(tīng)聚合中央廣播電視總臺(tái)精品新聞節(jié)目,通過(guò)“AI主播+AI編輯”賦能,“AIGC”化生產(chǎn)有聲快訊已達(dá)到“日產(chǎn)千條”,為用戶提供“聽(tīng)云聽(tīng),知天下”的全天候信息服務(wù),成為用戶耳邊的資訊頭條;自主研發(fā)了AI智能誦讀評(píng)測(cè)技術(shù),推出“云聽(tīng)朗讀評(píng)測(cè)”系統(tǒng),成為首個(gè)專為3~15歲中國(guó)兒童打造中文在線誦讀評(píng)測(cè)產(chǎn)品的中央主流媒體,以AI技術(shù)實(shí)現(xiàn)高精度診斷、智能化糾錯(cuò)、多模式混合測(cè)評(píng)等智能服務(wù);同時(shí)上線菁彩聲播放器,成為國(guó)內(nèi)首個(gè)覆蓋主流手機(jī)終端操作系統(tǒng)播放國(guó)產(chǎn)三維聲音頻流的移動(dòng)應(yīng)用。通過(guò)總臺(tái)秋晚、春晚、卡塔爾世界杯等多場(chǎng)重大活動(dòng),實(shí)現(xiàn)了云聽(tīng)菁彩聲與公共大屏超高清視頻同步直播
除云聽(tīng)外,其他音頻平臺(tái)也各顯身手。
例如,荔枝在2022年推出自研技術(shù)綜合平臺(tái)“聲音云”,加強(qiáng)對(duì)業(yè)務(wù)的中后臺(tái)支持,包括推出自動(dòng)化測(cè)試平臺(tái)、商業(yè)智能分析平臺(tái)、智能投放平臺(tái)等。
喜馬拉雅平臺(tái)借助AI生產(chǎn)內(nèi)容,基于自研的TTS框架制作了不同的TTS音色,滿足用戶多元化需求
基于AIGC打通全場(chǎng)景生態(tài)
眾所周知,優(yōu)質(zhì)的內(nèi)容需要精細(xì)化運(yùn)營(yíng)來(lái)實(shí)現(xiàn),而對(duì)用戶的精準(zhǔn)需求把握需要建立在場(chǎng)景生態(tài)中,也就是說(shuō),內(nèi)容生態(tài)需要建立在場(chǎng)景生態(tài)之上。因此,對(duì)于音頻平臺(tái)而言,對(duì)于場(chǎng)景生態(tài)的探索則更為迫切。伴隨著AIGC的深化,音頻平臺(tái)也在不斷探索全場(chǎng)景下音頻形式內(nèi)容的整合及創(chuàng)新,進(jìn)一步優(yōu)化用戶的個(gè)性需求,提升用戶粘性及用戶體驗(yàn)。
云聽(tīng)、喜馬拉雅、荔枝等互聯(lián)網(wǎng)音頻平臺(tái)則選擇與頭部企業(yè)合作,實(shí)現(xiàn)品牌聯(lián)動(dòng)。
據(jù)公開(kāi)報(bào)道,喜馬拉雅與阿里、小米、百度、華為、美的等頭部企業(yè)達(dá)成合作,93%以上的智能音箱都接入了喜馬拉雅的內(nèi)容。蜻蜓FM整個(gè)生態(tài)系統(tǒng)頭部合作伙伴已達(dá)500余家,達(dá)成9000多萬(wàn)智能家居、可穿戴設(shè)備和車載智能終端內(nèi)置量,在智能音箱等終端中內(nèi)容調(diào)起率穩(wěn)居高位。
隨著智能網(wǎng)聯(lián)汽車的發(fā)展,“未來(lái)車”是充分智能化生活空間的重要部分,特別是車內(nèi)的智能屏,已經(jīng)成為繼電腦、手機(jī)之后的第三大智能終端。在車載場(chǎng)景方面,實(shí)現(xiàn)手機(jī)與汽車收聽(tīng)場(chǎng)景的無(wú)縫對(duì)接,為車主提供音頻娛樂(lè)新體驗(yàn);在智能多終端場(chǎng)景方面,通過(guò)技術(shù)賦能拓展業(yè)務(wù)邊界,提升用戶全場(chǎng)景使用體驗(yàn)。
例如,云聽(tīng)車機(jī)版承接了移動(dòng)端的眾多功能,采用大數(shù)據(jù)分析和AI內(nèi)容推薦技術(shù),基于駕駛場(chǎng)景和用戶偏好,及時(shí)準(zhǔn)確地為車主推送新聞、天氣、路況、音樂(lè)等適合車載場(chǎng)景的電臺(tái)流內(nèi)容,并且通過(guò)車機(jī)推送準(zhǔn)確及時(shí)的應(yīng)急信息,將車機(jī)融入國(guó)家應(yīng)急廣播體系。
此外,云聽(tīng)實(shí)現(xiàn)中央廣播電視總臺(tái)三維菁彩聲車載端到端創(chuàng)新示范應(yīng)用,通過(guò)參數(shù)測(cè)試和數(shù)據(jù)分析,精準(zhǔn)混音制作適用于車內(nèi)各個(gè)坐席模式的標(biāo)準(zhǔn)化多聲道節(jié)目聲音,并通過(guò)車載端應(yīng)用的多聲道播放控制系統(tǒng),精準(zhǔn)實(shí)現(xiàn)面向車內(nèi)不同坐席位置的三維空間音頻的全新聽(tīng)覺(jué)體驗(yàn),推動(dòng)我國(guó)多聲道音頻技術(shù)在新媒體領(lǐng)域的產(chǎn)業(yè)化發(fā)展。
可以看到,在音頻賽道,AI技術(shù)已廣泛應(yīng)用于各個(gè)場(chǎng)景,平臺(tái)內(nèi)容生產(chǎn)效率和用戶服務(wù)水平都得到了質(zhì)的提高,為在線音頻平臺(tái)商業(yè)化應(yīng)用奠定堅(jiān)實(shí)的基礎(chǔ)。智能手機(jī)、AI音箱、車聯(lián)網(wǎng)全面普及,多個(gè)場(chǎng)景下用戶對(duì)音頻內(nèi)容的需求逐漸增加,也拓寬了在線音頻平臺(tái)商業(yè)化空間。
總之,AI技術(shù)的發(fā)展為在線音頻行業(yè)的發(fā)展提供了良好的機(jī)會(huì),“內(nèi)容生態(tài)+場(chǎng)景生態(tài)”的結(jié)合是用戶需求、市場(chǎng)發(fā)展、流量引導(dǎo)共同驅(qū)動(dòng)的結(jié)果,但AI技術(shù)的發(fā)展也為音頻平臺(tái)的發(fā)展帶來(lái)了諸多挑戰(zhàn)
不久前,易觀在《AIGC產(chǎn)業(yè)研究報(bào)告 2023——音頻生成篇》中提到,隨著人工智能技術(shù)的突破和不斷迭代,音頻平臺(tái)還需要應(yīng)對(duì)來(lái)自數(shù)據(jù)、性能、需求方面的三個(gè)挑戰(zhàn)。
數(shù)據(jù)合規(guī)性方面,相比靜態(tài)的文本或圖像數(shù)據(jù),由于聲音信號(hào)本身具有自由度高、動(dòng)態(tài)化的特點(diǎn),對(duì)長(zhǎng)時(shí)序列進(jìn)行建模和預(yù)測(cè)的難度較高,生成連貫、高質(zhì)量的音頻需要依靠大量的文本-語(yǔ)音、語(yǔ)音-語(yǔ)音數(shù)據(jù)對(duì)進(jìn)行訓(xùn)練,而目前語(yǔ)音訓(xùn)練數(shù)據(jù)主要來(lái)自開(kāi)源數(shù)據(jù)集、企業(yè)自有數(shù)據(jù)等,但方言、小語(yǔ)種等低資源語(yǔ)音數(shù)據(jù),用于語(yǔ)音翻譯全流程對(duì)齊的標(biāo)注數(shù)據(jù)仍然較少,另外還涉及到使用權(quán)限、用戶隱私等數(shù)據(jù)安全問(wèn)題,導(dǎo)致應(yīng)用受限。
性能方面,音頻生成本身與場(chǎng)景信息強(qiáng)相關(guān),容易受到環(huán)境因素的干擾,因此在復(fù)雜環(huán)境下合成高質(zhì)量語(yǔ)音對(duì)算法和算力的要求也隨之提高,實(shí)際應(yīng)用中還需要結(jié)合語(yǔ)音識(shí)別、聲紋識(shí)別、自然語(yǔ)言理解、視覺(jué)內(nèi)容理解等能力,將感知、認(rèn)知與合成技術(shù)融合應(yīng)用,提升產(chǎn)品的可控性和泛化能力,在影視、短視頻創(chuàng)作等領(lǐng)域?qū)a(chǎn)生更強(qiáng)的商業(yè)價(jià)值。
個(gè)性化需求方面,一方面需要模型支持不同類型的聲學(xué)條件,支持通過(guò)小數(shù)據(jù)量訓(xùn)練、模型微調(diào)合成個(gè)性化語(yǔ)音,結(jié)合不同領(lǐng)域的專業(yè)知識(shí)提升交互能力,另外定制語(yǔ)音的組件化、可控性、部署交付等工程化能力也是實(shí)現(xiàn)大規(guī)模落地的關(guān)鍵因素。
但綜合來(lái)看,通過(guò)多樣化的“內(nèi)容+場(chǎng)景”創(chuàng)新,音頻行業(yè)正在以全新的姿態(tài)迎接未來(lái)市場(chǎng)格局的變化,為用戶帶來(lái)更優(yōu)質(zhì)的使用體驗(yàn),未來(lái)已來(lái)。