很可惜 T 。T 您現(xiàn)在還不是作者身份,不能自主發(fā)稿哦~
如有投稿需求,請把文章發(fā)送到郵箱tougao@appcpx.com,一經(jīng)錄用會有專人和您聯(lián)系
咨詢?nèi)绾纬蔀榇河鹱髡哒埪?lián)系:鳥哥筆記小羽毛(ngbjxym)
短短幾個月內(nèi),幾乎每一家擁有智能語音技術(shù)能力的大廠都在采取行動布局虛擬數(shù)字人。
百度、華為、阿里等都紛紛引入AI數(shù)字人入職,擔(dān)任技術(shù)宣講員、形象代言人;OPPO、小米接連宣布其智能語音助手的虛擬形象;騰訊聯(lián)合搜狗一口氣推出了五款數(shù)智人,為企業(yè)定制智能客服、數(shù)字員工;科大訊飛、華為、OPPO、英偉達(dá)等都推出了虛擬人生成或交互平臺……
今日,百度APP上線龔俊數(shù)字人語音助手
如何讓一個智能語音助手更像人?在圍繞智能音箱展開的探索中受挫后,頭部玩家們紛紛將目光投向了擁有擬人形象、能說會動的“虛擬數(shù)字人”。
關(guān)于虛擬數(shù)字人當(dāng)下沒有一致定義,一般認(rèn)為是具有人的外觀、語言和肢體表達(dá)能力的數(shù)字化的人物。背后,主要是語音生成、動畫生成、音視頻合成、對話交互等多個智能語音及多模態(tài)模塊的配合。
“元宇宙”概念的走紅,讓龔俊數(shù)字人、清華數(shù)字學(xué)生“華智冰”、虛擬偶像 “A-SOUL”等虛擬數(shù)字人看起來更具有改變世界的潛力。
他們就像來自一個新星球的外星人,模仿人類的講話和行動方式,又通過影響人的情感和思維方式對真實世界產(chǎn)生作用。而在軀殼之下,很多是被安裝上了人類研發(fā)的AI“大腦”,或者嵌入了AI語音能力。
生動形象的虛擬數(shù)字人為存量不足的智能語音賽道帶來新玩法,這也讓智能語音玩家們看到潛藏的“造富”新故事。
不知從何時起,“虛擬數(shù)字人”已經(jīng)火出了圈。
他們出現(xiàn)在短視頻平臺和直播中——穿著簡單的白T,喝著可樂打著哈欠,一個叫“阿喜”的小姑娘沒有臺詞,不跟用戶互動,卻獲得了抖音50w粉絲;能說能互動的女團(tuán)“A-SOUL”則獲得了更高人氣,在直播中,五個二次元的小姐姐與用戶聊天,相互打趣,收獲了很多愿意去現(xiàn)場看他們表演的死忠粉。
左圖為抖音網(wǎng)紅“阿喜”,右圖為虛擬女團(tuán)“A-SOUL”
他們出現(xiàn)在手機(jī)APP里、帶屏智能音箱上,以活潑生動的形象充當(dāng)用戶的智能助手,甚至讓喜歡的偶像對自己“言聽計從”,做信息搜索等語音識別服務(wù);
數(shù)字人出現(xiàn)在手機(jī)APP中
他們也早已出現(xiàn)在新聞播報中——在新華社APP上,一位像真人一樣的AI合成主播已經(jīng)累計播報新聞超過1萬條,并且零誤差,可實現(xiàn)對日常和突發(fā)事件的實時響應(yīng);
在新華社上線的AI合成女主播
他們出現(xiàn)在各種服務(wù)場合里,在金融、醫(yī)療等APP的客服界面中,像真人一樣和需要答疑解惑的用戶進(jìn)行互動,連續(xù)7×24小時提供服務(wù)……
除了國內(nèi),國外虛擬數(shù)字人也十分火熱,比如近日,韓國的創(chuàng)企DeepBrain AI正在用提供能代替群眾演員的虛擬數(shù)字演員;2019年,一位名為“安德魯”的美國作家在AI技術(shù)的幫助下有了首個孿生“數(shù)字人”,用以在百年之后依然在云端陪伴家人……
從實驗室到現(xiàn)實應(yīng)用場景,從無智能交互能力到有智能交互,從2C端市場到2B市場……
據(jù)我們不完全統(tǒng)計,在過去2~3年里,國內(nèi)以“數(shù)字人”、“虛擬人”、“數(shù)智人”等標(biāo)簽出道并引起關(guān)注的虛擬數(shù)字人物眾多。目前,已經(jīng)有眾多虛擬數(shù)字人具備智能驅(qū)動或交互功能,究其背后推手,有很多都是2017~2019年那場智能音箱大戰(zhàn)中的頭部選手,以及其他智能語音玩家。
“虛擬數(shù)字人”一詞最早源于1989年美國國立醫(yī)學(xué)圖書館發(fā)起的“可視人計劃”(Visible Human Project, YHP)。1982 年,日本動畫《超時空要塞》的女主角林明美被包裝成歌手,成為世界上第一位虛擬歌姬。2007年,“初音未來”在日本誕生于成本較高的CG(計算機(jī)動畫)技術(shù),是第一個被廣泛認(rèn)可的虛擬數(shù)字人 。近年來,隨著深度學(xué)習(xí)算法突破,智能驅(qū)動的虛擬數(shù)字人開始嶄露頭角。
從視覺發(fā)展角度來看,當(dāng)下虛擬數(shù)字人在“捏臉”設(shè)計人形的環(huán)節(jié)門檻降低,往視覺形象上加智能驅(qū)動和交互能力成為新趨勢。當(dāng)我們反過來從智能語音交互技術(shù)發(fā)展的角度來看,語音助手正在實現(xiàn)技術(shù)的變道和升維,進(jìn)化為多模態(tài)的虛擬數(shù)字人。
虛擬數(shù)字人正在成為令智能語音玩家興奮的新故事。在這個故事中,語音助手更加具有人情味,但這與“元宇宙”中的虛擬人不同的是,它們更關(guān)注促進(jìn)現(xiàn)實世界的產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型。
正如騰訊智能產(chǎn)品副總裁李學(xué)朝在采訪中談到他的觀點:元宇宙很火,但騰訊現(xiàn)在主要是當(dāng)成數(shù)字世界的打造的數(shù)字員工,它與“元宇宙”中的虛擬人有技術(shù)上的重疊,但騰訊打造數(shù)智人不是往元宇宙方向,而是從數(shù)字員工怎么更好的服務(wù)行業(yè)場景。
相比于元宇宙,虛擬數(shù)字人顯然是一個更加落到實處、更聚焦的技術(shù)應(yīng)用領(lǐng)域,擁有從To C到To B的更廣大市場想象空間。
作為智能語音技術(shù)的主要落地方向,在前兩年還炙手可熱的“語音助手”故事,如今似乎已不再動聽?!安幌袢恕?、“缺乏人情味”是被廣為吐槽的點。
就拿各大玩家悉數(shù)入局的智能音箱來說,2018年出貨增長1051.8%,2019年繼續(xù)翻一番達(dá)4589萬臺(IDC咨詢數(shù)據(jù)),智能音箱一度成為百度、阿里、小米等玩家進(jìn)行瘋狂技術(shù)和價格戰(zhàn)的大戰(zhàn)場。然而,市場行情卻在2020年以來陡轉(zhuǎn)直下——2020上半年同比下降14.8%,2021年最新數(shù)據(jù)顯示第三季度同比下降1.5%,智能音箱告別高速增長期,究其背后原因,離不開“傻瓜對話”、“難以理解深度含義”等技術(shù)上的發(fā)展瓶頸。
以“智能音箱”為代表的語音助手故事再難以引起市場和資本的太大興奮,但令一眾智能語音玩家欣慰的是,一個圍繞“虛擬數(shù)字人”新形態(tài)展開的新故事、新玩法已經(jīng)雛形初顯。
這是一個池子更大、場景更豐富的市場,而各大智能語音助手早已入局,成為這一領(lǐng)域的龍頭玩家。根據(jù)調(diào)查機(jī)構(gòu)頭豹研究所發(fā)布的預(yù)測,當(dāng)前虛擬數(shù)字人市場規(guī)模已超2000億元,2030年有望達(dá)2703億元。
1、騰訊聯(lián)合搜狗VS百度,互聯(lián)網(wǎng)巨頭之戰(zhàn)打響
在互聯(lián)網(wǎng)玩家陣營中,騰訊和搜狗聯(lián)合組成的戰(zhàn)隊無疑是打頭陣的玩家。就在11月剛剛舉辦的騰訊數(shù)字生態(tài)大會上,騰訊一口氣推出五款不同能力的數(shù)智人,面向AI播報、手語播報、客服對話等場景有需求的客戶賦能;同時,騰訊推出一款“云小微”數(shù)智人平臺,這也成為整個騰訊云智能發(fā)力產(chǎn)業(yè)互聯(lián)網(wǎng)的三大平臺之一。
騰訊推出多種風(fēng)格的數(shù)智人
在智能音箱大戰(zhàn)中,騰訊直到2018年才發(fā)布其第一款智能音箱騰訊聽聽,彼時,百度和阿里正為新的帶屏音箱打的火熱。但面向虛擬數(shù)字人的新風(fēng)口,騰訊首先將能力值拉滿,對這個市場龍頭寶座勢在必得。
騰訊自己早在2018年就布局3D實時動作捕捉的數(shù)字人,而新并入的搜狗則為其帶來自2018年就積累的虛擬主播數(shù)字人能力。同時,從騰訊CSIG(云與智慧事業(yè)部)內(nèi)部發(fā)展來看,其在5月最新建立的技術(shù)委員會組織架構(gòu)下,與擁有多模態(tài)智能語音技術(shù)的AI Lab實驗室進(jìn)一步跨部門合作,使其在虛擬數(shù)字人領(lǐng)域獲得了雙重能力加成。
能與騰訊“掰腕子”的互聯(lián)網(wǎng)玩家,當(dāng)屬百度。百度在智能音箱熱潮中當(dāng)之無愧的贏家,曾占據(jù)近三成市場。
眼看騰訊聯(lián)合搜狗在虛擬數(shù)字人領(lǐng)域大大發(fā)力,百度也緊鑼密鼓。近日,百度節(jié)奏緊密地上線了冬奧會手語機(jī)器人、龔俊數(shù)字人語音助手等多款應(yīng)用,一把用虛擬數(shù)字人抓住年輕人、體育愛好者等不同人群的心。而早在兩年前,百度就推出了一款名為“小浦”的虛擬數(shù)字人,進(jìn)入浦發(fā)銀行作為國內(nèi)首個虛擬數(shù)字員工正式上崗,完成身份審核、答疑解惑等工作。
浦發(fā)銀行行長親手為小浦佩戴上了正式員工工牌
百度創(chuàng)始人李彥宏曾透露了自己做虛擬人的一大初衷:因為想在懷念時,與過世的父親溝通,他認(rèn)為這種情感需求會促進(jìn)虛擬人交互方式產(chǎn)生很大的市場。
百度早在2010年就率先成立了“自然語言處理部門”,據(jù)彭博報道,從自然語言處理到語音交互領(lǐng)域,百度過去十年中已投入了數(shù)十億美元。百度的虛擬數(shù)字人背后是實打?qū)嵮邪l(fā)資金砸出來的,可以說可與騰訊+搜狗一敵高下。接下來,要看的就是誰能夠在這條賽道找到更加巧妙應(yīng)用場景。
再看看其他曾經(jīng)參團(tuán)“智能語音助手”大戰(zhàn)的互聯(lián)網(wǎng)玩家,阿里、京東、網(wǎng)易都已迅速在一些垂直領(lǐng)域探索落地虛擬數(shù)字人。比如,阿里、京東近期紛紛將數(shù)字人引入電商,擔(dān)任代言人、賣貨人;網(wǎng)易也在教育、游戲等領(lǐng)域推出了文本驅(qū)動的虛擬講解員、虛擬講師等應(yīng)用。
當(dāng)然,更不能忽視字節(jié)跳動、快手這樣的新興移動互聯(lián)網(wǎng)玩家,它們原生具有人工智能基因。比如字節(jié)跳動與樂華娛樂合作打造的“A-SOUL”的虛擬二次元女團(tuán)獲得了無數(shù)的粉絲。虛擬主播領(lǐng)域已經(jīng)展現(xiàn)出商業(yè)化價值,視頻網(wǎng)站嗶哩嗶哩數(shù)據(jù)顯示,2020年6月~2021年5月已有32,412位主播在其上開播,同比增長40%。
作為當(dāng)下最接近“元宇宙”代言人Facebook的公司,下一步字節(jié)是否會為“A-SOUL”嵌入AI交互能力取代背后扮演的真人?這想想就很“元宇宙”。
可以看到,新老互聯(lián)網(wǎng)巨頭正成為虛擬數(shù)字人的主要玩家,背后的深層次邏輯也不再僅僅是它們擅長的“2C故事”。
當(dāng)下,互聯(lián)網(wǎng)行業(yè)高速增長時代已經(jīng)遠(yuǎn)去,百度、騰訊、阿里等互聯(lián)網(wǎng)巨頭們比之前任何時候都更需要考慮第二增長曲線。虛擬數(shù)字人雖然看起來只是一條很小、且還很初期的賽道,卻可能暗藏云與AI技術(shù)在未來產(chǎn)業(yè)互聯(lián)網(wǎng)中的諸多新機(jī)遇。
2、科大訊飛商湯等AI玩家,可與互聯(lián)網(wǎng)巨頭一戰(zhàn)?
除了互聯(lián)網(wǎng)巨頭,AI企業(yè)也是這場“造人”派對的主場玩家。
其中,智能語音龍頭企業(yè)科大訊飛無疑是這一玩家陣營的龍頭??拼笥嶏w早在2012年就上線語音智能助手,2015年與京東聯(lián)合發(fā)布了國內(nèi)第一款智能音箱“叮咚智能音箱”,而到了虛擬數(shù)字人時代,對于科大訊飛這樣的玩家來說更多是技術(shù)的自然演變。
去年1024開發(fā)者節(jié)現(xiàn)場,科大訊飛就推出了AI虛擬人5G交互一體機(jī)硬件,其虛擬數(shù)字人“愛加”已陸需進(jìn)入春節(jié)拜年、“兩會”播報等應(yīng)用場景。在今年10月剛剛過去的1024開發(fā)者節(jié)上,科大訊飛更進(jìn)一步,推出了賦能B端生態(tài)伙伴的虛擬人交互平臺1.0,虛擬人家族形象已經(jīng)達(dá)到了54位,并且還支持自定義形象,未來將在多模感知、情感貫穿、多維表達(dá)和自主定制上持續(xù)升級。
科大訊飛在2021年1024開發(fā)者節(jié)上推出的虛擬數(shù)字人
科大訊飛有聲平臺總經(jīng)理郜靜文告訴我們,傳統(tǒng)的智能語音賽道是以聲音為傳遞的,虛擬人的加入,使得信息的傳遞在有聲化的基礎(chǔ)上實現(xiàn)了可視化。虛擬人多元化、個性化、情感表現(xiàn)等特點,將拓寬智能語音的賽道,有更多的應(yīng)用方向和場景,反向又驅(qū)動人工智能有更高的智能化表現(xiàn)。
除了科大訊飛,其他智能語音玩家布局虛擬數(shù)字人也都比較早。如AI創(chuàng)企思必馳公司在2019年就推出能夠?qū)崟r對話的導(dǎo)演陸川數(shù)字人,追一科技、硅基智能等創(chuàng)企也都推出了落地銀行、公檢法等場景的數(shù)字人產(chǎn)品。對于這些智能語音玩家來說,虛擬數(shù)字人一方面是其技術(shù)迭代的自然而然演化出的新形態(tài),另一方面也是一個新的吸引資本的好故事。
好故事并不僅僅屬于智能語音玩家,還有從視覺相向切入的智能視覺玩家,以及下一代通用人工智能玩家。
比如,計算機(jī)視覺廠家如商湯科技的“小糖”、通用AI研究機(jī)構(gòu)智源研究院的清華虛擬學(xué)生“華智冰”、冬奧會的手語數(shù)字播報員,都將虛擬數(shù)字人可能達(dá)到的交互效果和應(yīng)用空間不斷拓展。
商湯科技推出的數(shù)字人“小糖”
可以看到,早先一批做智能語音助手、電話機(jī)器人的玩家無疑是這場虛擬數(shù)字人搶灘大戰(zhàn)的主場玩家;同時,更多擁有跨界能力的AI玩家也在成為這一領(lǐng)域的爆品制造者,有望成為新的“黑馬”。
從虛擬數(shù)字人長期的發(fā)展路徑來看,AI企業(yè)有望將數(shù)字人生動形象之下的“內(nèi)涵”大大提升,讓其更加接近人的思維和對話水平,這是AI類玩家更大的優(yōu)勢。但與此同時,互聯(lián)網(wǎng)玩家廣泛的C端入口和客戶渠道也是AI企業(yè)難以追趕的。
3、智能手機(jī)商:華米OV你追我趕,從2C到2B
在上一波智能語音技術(shù)的落地中,華為、OPPO、小米等智能手機(jī)玩家既是這一市場的推動者也是獲益者。他們的智能語音助手、智能音箱產(chǎn)品活躍在人居生活的多個場景,正在成為全屋智能的中樞。
如果有什么企業(yè)希望通過讓智能語音助手變得更加有人情味這種方式,俘獲更多的用戶量和更大的用戶黏度,非智能手機(jī)廠商莫屬,而虛擬數(shù)字人做的正是這件事。
就在今年,在智能音箱大戰(zhàn)時代錯過機(jī)遇的OPPO已經(jīng)在虛擬數(shù)字人這件事上擺出態(tài)度和實力。就在10月剛剛舉辦的OPPO開發(fā)者大會上,OPPO推出了小布虛擬人和小布虛擬人定制平臺。小布是OPPO月活用戶突破1.3億的智能語音助手,此次小布助手從純粹的手機(jī)語音助手升級為多終端、多模態(tài)的對話式智能助手。
OPPO推出了小布虛擬人和小布虛擬人定制平臺
在OPPO數(shù)智工程事業(yè)部總裁劉海鋒的暢想中,OPPO希望構(gòu)建一個以小布助手為中心,實現(xiàn)智能設(shè)備之間的萬物互融??梢韵胂?,小布虛擬人未來在智能家居場景,也有望成為一個更有人情味的管家。
同樣快速布局的還有華為公司,作為一家在ICT和消費(fèi)電子跨界的玩家,華為做虛擬數(shù)字人的布局在To B領(lǐng)域具有更寬廣的想象空間。
就在今年9月,華為推出了一款名為“云笙”的虛擬數(shù)字人,擔(dān)任華為云內(nèi)部員工,會進(jìn)行技術(shù)內(nèi)容宣講、答疑解惑等工作。一個月后,華為又推出了一款虛擬數(shù)字人平臺,要把這一能力開放給行業(yè)。華為此舉既讓我們看到其對自身虛擬數(shù)字人技術(shù)的自信,也能看出,當(dāng)下華為的業(yè)務(wù)中心正在從消費(fèi)電子端向To B領(lǐng)域有所偏移。
華為云CEO張平安在與云笙互動
除了今年動作迅猛的OPPO、華為,其他智能手機(jī)玩家在虛擬數(shù)字人也不甘示弱。比如小米公司,就在OPPO公布“小布”虛擬數(shù)字人的前后腳,小米也宣布在新款Civi手機(jī)中上線“小愛同學(xué)”的虛擬數(shù)字人形象,而早在2020年8月,這一技術(shù)已經(jīng)在小米用戶中內(nèi)測這一應(yīng)用。
結(jié)合前面互聯(lián)網(wǎng)玩家的動作來看,各家做虛擬數(shù)字人的落地,其實越來越跳出智能音箱時代聚焦的消費(fèi)互聯(lián)網(wǎng),而是更加寬廣的產(chǎn)業(yè)互聯(lián)網(wǎng)。
說完產(chǎn)業(yè),我們再來看看技術(shù)。
不同的場景選用不同的虛擬人驅(qū)動方案,目前包括AI算法、真人捕捉等驅(qū)動方案,各有優(yōu)劣勢,不同應(yīng)用場景選擇不同的方案,綜合從成本、體驗效果考慮會有不同選擇。
根據(jù)驅(qū)動方式的不同,我們可把市面上存在的虛擬數(shù)字人大致分為四類:
1、文本驅(qū)動的虛擬數(shù)字人,比如搜狗AI合成主播“雅妮”、“兩會”期間播報的愛加和小C等,多以文本或語音驅(qū)動,多用于新聞播報等領(lǐng)域。
2、會話場景驅(qū)動的虛擬數(shù)字人,比如OPPO推出的小布虛擬人、騰訊的金融數(shù)字客服等,它們可以與人對話,同步嘴型和動作。
3、真人(實時捕捉)驅(qū)動的虛擬數(shù)字人,如 “A-SOUL”女團(tuán),它們一般在形象背后由真人扮演,通過實時捕捉實時驅(qū)動。
4、無智能化驅(qū)動,如抖音網(wǎng)紅“阿喜”,暫時還沒有顯示出AI驅(qū)動及智能語音能力,強(qiáng)調(diào)形象逼真而非動感交互。
在過去很長一段時間里,智能語音技術(shù)的研究主要解決兩大挑戰(zhàn),第一大挑戰(zhàn)是圍繞著“聽得清”做研究,“前言不搭后語”,尤其是出現(xiàn)指代不明的問題,這主要是因為需要的數(shù)據(jù)以指數(shù)函數(shù)增加,但實際可用的對話數(shù)據(jù)太少。
第二大挑戰(zhàn),則是多模態(tài)——即除了語音,還通過視覺、觸覺等多種感知來支持機(jī)器對話決策,比如眼神、唇語等。
在克服第一重挑戰(zhàn)中,很多企業(yè)仍然還有很長的路再走。而在克服第二重挑戰(zhàn)的過程中,很多玩家看到了“虛擬數(shù)字人”這一條新路。既然語音識別的瓶頸一時難以破除,何不轉(zhuǎn)個彎,從多模態(tài)的角度讓AI更加像人,實現(xiàn)服務(wù)升級?
為此,虛擬數(shù)字人應(yīng)運(yùn)而生。當(dāng)下國內(nèi)這些布局虛擬數(shù)字人的公司,正是率先掌握了唇語識別技術(shù)進(jìn)而將語音識別的準(zhǔn)確度大大提升,形成了技術(shù)壁壘。
一般來說,市面上的虛擬數(shù)字人主要包括人物形象、語音生成、動畫生成、音視頻合成顯示、交互等5個模塊構(gòu)成,其中多個環(huán)節(jié)主要用到的就是智能語音技術(shù),以及智能語音與視覺融合的多模態(tài)技術(shù)。
圖源《2020年虛擬數(shù)字人發(fā)展白皮書》
在語音生成方面,基于文本生成對應(yīng)的人物語音,主要采用了TTS(從文本到語音)技術(shù),比如很多人知道的明星語音包,早已不是由明星一句句錄制,而是只需要錄制幾句話,就可以合成明星的聲音。
在動畫生成方面,2D、3D數(shù)字人的嘴型動作,基本可以靠AI模型實現(xiàn)智能合成。這是對已采集到的文本到語音和嘴型視頻(2D)/嘴型動畫(3D)的數(shù)據(jù)進(jìn)行模型訓(xùn)練,得到一個輸入任意文本都可以驅(qū)動嘴型的模型,再通過模型智能合成。但對于一些肢體動作來說,大多采取錄播形式。
另外,動態(tài)實時捕捉也是一種方案,光學(xué)式和慣性式動作捕捉占據(jù)主導(dǎo)地位,此外,基于計算機(jī)視覺的動作捕捉成為聚焦熱點。
交互模塊使得數(shù)字人具備交互功能,比如通過語音語義識別能實時明白用戶的意圖,并據(jù)此對用戶進(jìn)行語音、表情、動作的反饋。這其中需要用到的基礎(chǔ)技術(shù)包括智能語音識別、自然語言處理、圖文合成技術(shù)等。交互能力并不是當(dāng)下虛擬數(shù)字人的標(biāo)配,也是智能語音玩家的門檻所在。
當(dāng)下,深度學(xué)習(xí)技術(shù)的進(jìn)步使得虛擬數(shù)字人技術(shù)成本越來越低,效果更好。但與此同時,虛擬數(shù)字人的規(guī)?;渴鹑匀幻媾R難點。
騰訊智能產(chǎn)品副總裁李學(xué)朝在接受智東西等媒體的采訪中指出:“當(dāng)通過虛擬數(shù)字人這一外形變得更加像人,這樣用戶對數(shù)字人的期待就會變得更高。這時,如果語音交互能力依然得不到提升,‘答非所問’,其實得到的落差會更大?!睋Q句話說,逼真好看的外貌對智能語音應(yīng)用只是錦上添花,在“人人捏臉”的時代,過硬的AI交互能力成為一大更核心的競爭力。
可以看到,盡管虛擬數(shù)字人為智能語音賽道帶來了新故事,但這并不代表智能語音玩家就可以完全繞開先前的障礙。這一難點,即便是在虛擬數(shù)字人階段,依然是玩家們繞不過去的大石頭。
此外,除了智能語音技術(shù)發(fā)展的瓶頸無法真正繞開,還需要注意的是安全問題。當(dāng)虛擬數(shù)字人變得更像人,更加容易地牽動人的心智,也意味著可能的風(fēng)險越大。比如,如果虛擬數(shù)字人如果用來制作現(xiàn)實人的形象,沒有得到本人的同意,可能帶來非??植赖挠绊?。
可以看到,盡管一陣“元宇宙”的風(fēng)讓大家對虛擬數(shù)字人都興奮不已,但回到虛擬數(shù)字人技術(shù)本身,這個動聽故事其實更接近智能語音玩家推進(jìn)企業(yè)將產(chǎn)品和服務(wù)進(jìn)入一個新的階段——從智能語音階段到虛擬數(shù)字人階段,從單維的智能語音技術(shù)到多模態(tài)技術(shù),從消費(fèi)互聯(lián)網(wǎng)市場拓展到產(chǎn)業(yè)互聯(lián)網(wǎng)市場……
而在這一新階段,不論是騰訊(搜狗)、科大訊飛這樣的老牌智能語音龍頭,還是百度、阿里、華米OV這樣的智能音箱時代的收割者,亦或者商湯、智源研究院、字節(jié)這樣的跨界新玩家,都正在爭奪入場券。
我們從中國智能語音技術(shù)十年發(fā)展脈絡(luò)來看,對于虛擬數(shù)字人新玩法的探索,不僅是一場搜狗(騰訊)和科大訊飛兩大智能語音技術(shù)龍頭的對拼,更是一場將整個互聯(lián)網(wǎng)、消費(fèi)電子、行業(yè)玩家圈入混戰(zhàn)的開始。
從語音助手進(jìn)化到虛擬數(shù)字人,是人工智能技術(shù)與人類交互方式進(jìn)化新的重要節(jié)點。當(dāng)然,正如騰訊李學(xué)朝指出的,當(dāng)下,虛擬數(shù)字人發(fā)展仍處于探索階段,還有很長的路要走。這很有可能是一場智能語音賽道的升維戰(zhàn),也是AI交互領(lǐng)域的未來新戰(zhàn)場。
本文為作者獨(dú)立觀點,不代表鳥哥筆記立場,未經(jīng)允許不得轉(zhuǎn)載。
《鳥哥筆記版權(quán)及免責(zé)申明》 如對文章、圖片、字體等版權(quán)有疑問,請點擊 反饋舉報
我們致力于提供一個高質(zhì)量內(nèi)容的交流平臺。為落實國家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評論自律管理,為了保護(hù)用戶創(chuàng)造的內(nèi)容、維護(hù)開放、真實、專業(yè)的平臺氛圍,我們團(tuán)隊將依據(jù)本公約中的條款對注冊用戶和發(fā)布在本平臺的內(nèi)容進(jìn)行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質(zhì)內(nèi)容,同時也將采取必要措施管理違法、侵權(quán)或有其他不良影響的網(wǎng)絡(luò)信息。
一、根據(jù)《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護(hù)法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進(jìn)行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
1)反對憲法所確定的基本原則;
2)危害國家安全,泄露國家秘密,顛覆國家政權(quán),破壞國家統(tǒng)一,損害國家榮譽(yù)和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽(yù)、榮譽(yù);
4)宣揚(yáng)恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
5)煽動民族仇恨、民族歧視,破壞民族團(tuán)結(jié);
6)破壞國家宗教政策,宣揚(yáng)邪教和封建迷信;
7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
8)宣揚(yáng)淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動非法集會、結(jié)社、游行、示威、聚眾擾亂社會秩序;
10)侮辱或者誹謗他人,侵害他人名譽(yù)、隱私和其他合法權(quán)益;
11)通過網(wǎng)絡(luò)以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進(jìn)行網(wǎng)絡(luò)欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內(nèi)容;
2. 不友善:不尊重用戶及其所貢獻(xiàn)內(nèi)容的信息或行為。主要表現(xiàn)為:
1)輕蔑:貶低、輕視他人及其勞動成果;
2)誹謗:捏造、散布虛假事實,損害他人名譽(yù);
3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進(jìn)行揭露或描述,以此來激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應(yīng),蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
6)謾罵:以不文明的語言對他人進(jìn)行負(fù)面評價;
7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網(wǎng)站秩序的內(nèi)容,或進(jìn)行相關(guān)行為。主要表現(xiàn)為:
1)多次發(fā)布包含售賣產(chǎn)品、提供服務(wù)、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
2)單個帳號多次發(fā)布包含垃圾廣告的內(nèi)容;
3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉(zhuǎn)網(wǎng)站等,誘騙用戶點擊鏈接
5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當(dāng)曝光;
6)購買或出售帳號之間虛假地互動,發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關(guān)交易。
7)發(fā)布包含欺騙性的惡意營銷內(nèi)容,如通過偽造經(jīng)歷、冒充他人等方式進(jìn)行惡意營銷;
8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。
4. 色情低俗信息,主要表現(xiàn)為:
1)包含自己或他人性經(jīng)驗的細(xì)節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內(nèi)容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚(yáng)低俗、庸俗、媚俗內(nèi)容。
5. 不實信息,主要表現(xiàn)為:
1)可能存在事實性錯誤或者造謠等內(nèi)容;
2)存在事實夸大、偽造虛假經(jīng)歷等誤導(dǎo)他人的內(nèi)容;
3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機(jī)構(gòu)或個人存在關(guān)聯(lián)。
6. 傳播封建迷信,主要表現(xiàn)為:
1)找人算命、測字、占卜、解夢、化解厄運(yùn)、使用迷信方式治病;
2)求推薦算命看相大師;
3)針對具體風(fēng)水等問題進(jìn)行求助或咨詢;
4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運(yùn)勢,東西寵物丟了能不能找回、取名改名等;
7. 文章標(biāo)題黨,主要表現(xiàn)為:
1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來誘導(dǎo)用戶;
2)內(nèi)容與標(biāo)題之間存在嚴(yán)重不實或者原意扭曲;
3)使用夸張標(biāo)題,內(nèi)容與標(biāo)題嚴(yán)重不符的。
8.「飯圈」亂象行為,主要表現(xiàn)為:
1)誘導(dǎo)未成年人應(yīng)援集資、高額消費(fèi)、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
4)以號召粉絲、雇用網(wǎng)絡(luò)水軍、「養(yǎng)號」形式刷量控評等行為
5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導(dǎo)未成年人不良嗜好影響未成年人身心健康的;
2)不當(dāng)評述自然災(zāi)害、重大事故等災(zāi)難的;
3)美化、粉飾侵略戰(zhàn)爭行為的;
4)法律、行政法規(guī)禁止,或可能對網(wǎng)絡(luò)生態(tài)造成不良影響的其他內(nèi)容。
二、違規(guī)處罰
本網(wǎng)站通過主動發(fā)現(xiàn)和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質(zhì)量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當(dāng)一個用戶發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將依據(jù)相關(guān)用戶違規(guī)情節(jié)嚴(yán)重程度,對帳號進(jìn)行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當(dāng)涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將加重處罰。
三、申訴
隨著平臺管理經(jīng)驗的不斷豐富,本網(wǎng)站出于維護(hù)本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網(wǎng)站進(jìn)行反饋。
(規(guī)則的最終解釋權(quán)歸屬本網(wǎng)站所有)