今天,由聲網(wǎng)主辦的RTE2022第八屆實(shí)時(shí)互聯(lián)網(wǎng)大會(huì)正式開(kāi)幕在主論壇上,音網(wǎng)創(chuàng)始人兼CEO趙斌,音網(wǎng)CTO兼首席科學(xué)家鐘升分別從行業(yè)和技術(shù)的角度對(duì)實(shí)時(shí)交互進(jìn)行了深度解讀查普曼大學(xué)電影學(xué)院教授,《福布斯》周刊《XR Express》專(zhuān)欄作家查理·芬克本周分享了年度熱詞超宇宙聯(lián)合國(guó)人口基金駐華代表兼蒙古辦事處主任康佳婷博士分享了實(shí)時(shí)互動(dòng)技術(shù)在促進(jìn)可持續(xù)社會(huì)和經(jīng)濟(jì)發(fā)展方面的關(guān)鍵作用
RTE的概念和邊界逐漸明晰,元宇宙博弈仍有待突破。
伴隨著行業(yè)的發(fā)展,RTE的概念和邊界也逐漸清晰2020年,王聲在上市招股書(shū)中首次公開(kāi)提出RTE的概念此后,這一理念逐漸被全行業(yè)認(rèn)可和使用趙斌說(shuō),從傳播學(xué)的角度來(lái)看,RTC強(qiáng)調(diào)語(yǔ)義信息的優(yōu)質(zhì)高效傳遞RTE更側(cè)重于用戶需要的共享空間和時(shí)間,也就是俗話說(shuō)的場(chǎng)景而且能夠達(dá)到甚至超越線下場(chǎng)景的交互體驗(yàn)和效果,這才是RTE真正的重點(diǎn),其內(nèi)涵和外延遠(yuǎn)遠(yuǎn)超過(guò)RTC領(lǐng)域
從RTC到RTE服務(wù),也是從基礎(chǔ)能力到場(chǎng)景能力的快速演進(jìn)在這樣的需求下,聲網(wǎng)推出的Native NG SDK 4.0.0是專(zhuān)為RTE場(chǎng)景構(gòu)建而設(shè)計(jì)的新一代SDK趙斌表示,它在模塊化設(shè)計(jì)上提供了更加靈活,便捷,易于解耦和組合的能力,同時(shí)也提供了強(qiáng)大的插件平臺(tái),使得各種場(chǎng)景的搭建和插件開(kāi)發(fā)更加簡(jiǎn)單方便同時(shí),也很容易為各種應(yīng)用場(chǎng)景搭建aPaaS這個(gè)場(chǎng)景工具庫(kù)的完備,為下一代場(chǎng)景的誕生做了充分的準(zhǔn)備
幾年前,Soundnet成為第一家將AI算法全面引入實(shí)時(shí)交互領(lǐng)域的服務(wù)提供商在過(guò)去的一年里,AI算法在音頻領(lǐng)域取得了巨大的進(jìn)步AI降噪,AI回聲消除,空間音頻等音頻新技術(shù)能力為各種場(chǎng)景帶來(lái)更純粹,更身臨其境的聽(tīng)覺(jué)體驗(yàn)趙斌表示,我們很高興看到AI降噪在過(guò)去一年取得了突破與傳統(tǒng)的DSP算法相比,AI降噪可以有效降低各種突發(fā)的,不可持續(xù)的,甚至不規(guī)則的噪聲信號(hào)
在線k歌時(shí),在不傷害演唱者回聲的前提下,AI回聲消除可以精準(zhǔn)消除伴奏的回聲,讓玩家和用戶在不戴耳機(jī),不在外面放音樂(lè)的情況下,依然可以有非常好的演唱效果。
空間對(duì)于元宇宙的重要性不容忽視趙斌認(rèn)為,只要有左右聲道,空間音頻就沒(méi)有空間感人耳是一個(gè)超級(jí)敏感的器官,有能力感知和分辨任何聲音的變化除了左右方向,還有空間的大小,距離,空間是充滿物體還是相對(duì)空曠等等如果這些和現(xiàn)實(shí)有出入,那么在元宇宙場(chǎng)景中的場(chǎng)景感,沉浸感,真實(shí)感都會(huì)有很大的損失
在過(guò)去的一年里,元宇宙的熱度持續(xù)飆升,許多App都沖上了App Store的榜首,但宣傳效果仍然與現(xiàn)實(shí)相差甚遠(yuǎn)經(jīng)過(guò)一年多的行業(yè)實(shí)踐,聲網(wǎng)也對(duì)元宇宙有了進(jìn)一步的認(rèn)識(shí)
BeReal應(yīng)用的爆炸式增長(zhǎng)讓我們看到,真實(shí)圖像遠(yuǎn)比虛擬圖像更能滿足陌生人社交的需求趙斌說(shuō),我們發(fā)現(xiàn),用戶在使用陌生人的社交應(yīng)用時(shí),在某種程度上正在與孤獨(dú)進(jìn)行一場(chǎng)戰(zhàn)爭(zhēng)當(dāng)你對(duì)抗孤獨(dú)時(shí),虛擬影像的豐富性和真實(shí)性遠(yuǎn)不如真實(shí)影像,能讓你覺(jué)得自己戰(zhàn)勝了孤獨(dú)
而在非陌生人的社交領(lǐng)域,如熟人社交,興趣社交場(chǎng)景,虛擬影像也是小眾人群的弱需求熟人之間往往結(jié)合了通訊工具的功能在這種情況下,大家一般都認(rèn)識(shí)或者了解另一個(gè)人,甚至是熟悉的這個(gè)時(shí)候,形象的轉(zhuǎn)化和改變,其實(shí)是一種微弱的訴求再比如,我們發(fā)現(xiàn)在很多有趣的社交應(yīng)用下,玩家對(duì)你在這個(gè)感興趣的話題下的觀點(diǎn),信息,內(nèi)容更感興趣個(gè)人認(rèn)同中的形象補(bǔ)充也是非常弱的訴求和價(jià)值點(diǎn)趙斌說(shuō)
無(wú)論是頭像還是其他玩法,超宇宙要想在社交領(lǐng)域大展拳腳,在玩法上還有更大的突破空間鑒于此,Soundnet還將元宇宙能力和API進(jìn)化集中在基礎(chǔ)能力模塊上,以組合的方式提供,方便合作伙伴靈活選擇組件,自行打造不同的組合和互動(dòng)游戲
在超宇宙人氣飆升的時(shí)候,由此衍生出的各種新潮游戲?yàn)樯缃粖蕵?lè)提供了新的想象空間音視頻互動(dòng)不僅不會(huì)在元宇宙中消失,還會(huì)給元宇宙帶來(lái)更多層次的沉浸感查普曼大學(xué)電影學(xué)院教授,福布斯周刊《XR Express》本周專(zhuān)欄作家查理·芬克認(rèn)為,互聯(lián)網(wǎng)并沒(méi)有擺脫電視,它讓電視變得更好我相信這是元宇宙將會(huì)發(fā)生的事情,它將包括視頻,語(yǔ)音和我們今天所做的事情所以,即使你身處3D虛擬世界,它仍然需要語(yǔ)音和視頻的存在
實(shí)時(shí)感知和理解成為RTE技術(shù)的關(guān)鍵能力。
實(shí)時(shí)互聯(lián)網(wǎng)越來(lái)越智能化實(shí)時(shí)音視頻端到端鏈路各個(gè)環(huán)節(jié)對(duì)場(chǎng)景的實(shí)時(shí)感知和理解,已經(jīng)成為實(shí)時(shí)交互的重要基礎(chǔ)能力聲網(wǎng)CTO兼首席科學(xué)家鐘升分享了其中的關(guān)鍵環(huán)節(jié)和技術(shù)他認(rèn)為就像一個(gè)信息傳遞的管道,承載不了當(dāng)下的交流需求,整個(gè)實(shí)時(shí)音視頻端到端的鏈接具有提取知識(shí),識(shí)別情緒,做出決策的能力,成為實(shí)時(shí)交互不可或缺的要素
實(shí)時(shí)感知和理解的能力在實(shí)時(shí)交互的許多方面都發(fā)揮了重要的作用,或者說(shuō)帶來(lái)了價(jià)值,包括對(duì)用戶體驗(yàn)的感知質(zhì)量的估計(jì),對(duì)整個(gè)傳輸網(wǎng)絡(luò)的質(zhì)量監(jiān)控,以及場(chǎng)景尤其是人體和物體的重建,以及人機(jī)交互等在未來(lái)的實(shí)時(shí)交互場(chǎng)景中,需求會(huì)越來(lái)越多伴隨著技術(shù)的進(jìn)步,在這方面帶給用戶的體驗(yàn)和價(jià)值會(huì)越來(lái)越高鐘聲表明
實(shí)時(shí)互動(dòng)促進(jìn)社會(huì)經(jīng)濟(jì)的可持續(xù)發(fā)展。
面向技術(shù)的創(chuàng)新對(duì)于中國(guó)實(shí)現(xiàn)可持續(xù)發(fā)展目標(biāo)非常重要聯(lián)合國(guó)人口基金駐華代表,聯(lián)合國(guó)人口基金駐蒙古辦事處主任康佳婷博士分享說(shuō),聯(lián)合國(guó)人口基金正在通過(guò)實(shí)時(shí)互動(dòng)技術(shù),為偏遠(yuǎn)地區(qū)13—15歲的學(xué)生提供互動(dòng),全面,科學(xué)的青少年健康教育,幫助他們?cè)诔砷L(zhǎng)過(guò)程中做出負(fù)責(zé)任的選擇這個(gè)項(xiàng)目的實(shí)時(shí)交互技術(shù)在很多方面都得益于聲音網(wǎng)絡(luò)的支持
康佳婷博士表示,得益于音網(wǎng)的資助及其提供的實(shí)時(shí)互動(dòng)技術(shù),聯(lián)合國(guó)人口基金青少年健康教育課程的學(xué)生容量將進(jìn)一步擴(kuò)大,預(yù)計(jì)將覆蓋至少10000名來(lái)自中國(guó)各地的學(xué)生未來(lái),音網(wǎng),人口基金和我們的合作伙伴將繼續(xù)通過(guò)科技創(chuàng)新,促進(jìn)青少年身心健康發(fā)展2023年,聯(lián)合國(guó)人口基金和音網(wǎng)計(jì)劃聯(lián)合舉辦全球青年創(chuàng)新大賽,歡迎持續(xù)關(guān)注
影音技術(shù)賦能企業(yè)數(shù)字化轉(zhuǎn)型新趨勢(shì)
未來(lái)音視頻技術(shù)會(huì)給企業(yè)的數(shù)字化轉(zhuǎn)型和賦能帶來(lái)哪些新趨勢(shì)王聲首席運(yùn)營(yíng)官劉斌,新希望集團(tuán)首席投資官俞峰,微醫(yī)集團(tuán)副總裁李磊,水滴寶研發(fā)負(fù)責(zé)人林露等嘉賓發(fā)表了各自的觀點(diǎn)
互聯(lián)網(wǎng)正逐漸向保險(xiǎn)的深水區(qū)發(fā)展,即線下經(jīng)紀(jì)業(yè)務(wù)林露說(shuō),在這個(gè)過(guò)程中,音頻和視頻技術(shù)是非常寶貴的未來(lái),通過(guò)與用戶的遠(yuǎn)程視頻聊天,以及與保險(xiǎn)業(yè)務(wù)系統(tǒng)的進(jìn)一步溝通,可以提供更多的展示工具和交互,從而提供更深入,更長(zhǎng)期的保險(xiǎn)服務(wù)這是下一個(gè)應(yīng)用場(chǎng)景的發(fā)展趨勢(shì)
音視頻技術(shù)也是醫(yī)療服務(wù)中的核心手段李磊說(shuō),無(wú)論是醫(yī)生之間,醫(yī)患之間,還是其他場(chǎng)景的服務(wù),音視頻都是廣泛使用的我們希望音視頻不僅僅是作為一種服務(wù)方式,而是能夠成為服務(wù)的天線或者入口,更好的服務(wù)用戶比如我們希望推出微醫(yī)健康維護(hù)機(jī)構(gòu)HMO系統(tǒng),對(duì)人進(jìn)行全生命周期的管理在這個(gè)過(guò)程中,需要家庭醫(yī)生和醫(yī)療資源的參與,這就需要音視頻技術(shù)
于峰認(rèn)為,未來(lái)5年或10年,豬的語(yǔ)音數(shù)據(jù)庫(kù)會(huì)非常豐富,甚至可以識(shí)別更多豬想要表達(dá)的情感和語(yǔ)言同時(shí),目前通過(guò)圖像技術(shù),可以通過(guò)手持稱(chēng)重儀或類(lèi)似的遠(yuǎn)程監(jiān)控,準(zhǔn)確估計(jì)豬的體重因此,我們看到從人類(lèi)交互到真實(shí)生物資產(chǎn)的音視頻機(jī)會(huì),通過(guò)豬的語(yǔ)音識(shí)別和豬的圖像估計(jì),實(shí)現(xiàn)人類(lèi),生物和動(dòng)物之間的交流
從云服務(wù)提供商的角度,劉斌對(duì)行業(yè)的未來(lái)趨勢(shì)提出了四點(diǎn)觀察他認(rèn)為首先,云服務(wù)被越來(lái)越多的傳統(tǒng)企業(yè)接受,逐漸接受混合云模式,其次,AI技術(shù)的應(yīng)用越來(lái)越多,比如語(yǔ)音AI降噪,空間音頻方位識(shí)別等,包括視頻人臉識(shí)別和未來(lái)脊柱識(shí)別,第三,虛擬現(xiàn)實(shí)的組合趨勢(shì)明顯,第四,在一些有積累的垂直行業(yè),先做低碼會(huì)更容易,而不是簡(jiǎn)單的用低碼
鄭重聲明:此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊,目的在于傳播更多信息,與本站立場(chǎng)無(wú)關(guān)。僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。