chinesefreesexvideos高潮,欧美极品少妇性运交,久久久国产一区二区三区,99久久婷婷国产综合精品,成人国产一区二区三区

APP推廣合作
聯(lián)系“鳥(niǎo)哥筆記小喬”
實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯
2024-08-06 15:52:40

@科技新知 原創(chuàng)

作者丨余寐

六個(gè)月前,由OpenAI研發(fā)的文生視頻大模型Sora橫空出世,給了科技圈一點(diǎn)大大的震撼。

用AI生成視頻并不是新鮮事,只不過(guò)此前一直無(wú)法突破合成10秒自然連貫視頻的瓶頸。而Sora在發(fā)布時(shí)就已經(jīng)能合成1分鐘超長(zhǎng)視頻,視頻質(zhì)量畫面也效果驚人。

盡管Sora一直沒(méi)有開(kāi)放公測(cè)供用戶體驗(yàn),但其底層架構(gòu)還是被扒了個(gè)遍。被稱之為“Sora路線”的DiT,全稱為Diffusion Transformer,本質(zhì)是把訓(xùn)練大模型方法機(jī)制融入到了擴(kuò)散模型之中。

自此,相關(guān)平臺(tái)不甘落后,紛紛摸著Sora過(guò)河,你方唱罷我登場(chǎng),競(jìng)爭(zhēng)不可謂不激烈。有媒體統(tǒng)計(jì),國(guó)內(nèi)有至少超20家公司推出了自研AI視頻產(chǎn)品/模型。入局玩家紛雜。

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

在剛剛過(guò)去的7月,商湯推出最新AI視頻模型 Vimi,阿里達(dá)摩院也發(fā)布AI視頻創(chuàng)作平臺(tái)“尋光”,愛(ài)詩(shī)科技則發(fā)布PixVerse V2,快手可靈宣布基礎(chǔ)模型再次升級(jí),并全面開(kāi)放內(nèi)測(cè),智譜AI也宣布AI生成視頻模型清影(Ying)正式上線智譜清言。互聯(lián)網(wǎng)企業(yè)之間的賽場(chǎng)也有了新故事。字節(jié)跳動(dòng)是第一批發(fā)布AI視頻模型的選手,3月率先發(fā)布剪映Dreamina(即夢(mèng)),三個(gè)月后,快手可靈AI正式開(kāi)放內(nèi)測(cè)。

AI視頻大模型賽道如此之“卷”,究其原因,無(wú)疑是其背后蘊(yùn)藏的商業(yè)空間與想象力。不過(guò),用戶更關(guān)心的是產(chǎn)品本身。這也是行業(yè)必須要直面的問(wèn)題:AI視頻大模型到了哪一步?Sora帶來(lái)的“光環(huán)”,究竟值不值得期待?

目前深度學(xué)習(xí)的框架,“數(shù)據(jù)是燃料、模型是引擎、算力是加速器”。在掌握模型搭建方法后,不斷投喂數(shù)據(jù)并提升算力和準(zhǔn)確性是各平臺(tái)采取的主要策略。而進(jìn)展是有限的。普遍來(lái)看,大模型在生成具有連貫性和邏輯一致性的視頻方面仍然存在困難。

本次我們選取幾個(gè)國(guó)內(nèi)頭部視頻生成模型進(jìn)行實(shí)測(cè),包括可靈、即夢(mèng)、PixVerse、清影(智譜清言),具體直觀地測(cè)試不同的模型表現(xiàn)。

為盡可能客觀地比較測(cè)試結(jié)果,我們采用如下設(shè)定:

1.使用統(tǒng)一的中文提示詞,包括簡(jiǎn)易提示詞和復(fù)合提示詞;

2.測(cè)試包含圖生視頻和文生視頻兩種方式;

3.測(cè)試場(chǎng)景包括大模型對(duì)人物、動(dòng)物、城市建筑等的生成效果;

4.模擬新手用戶使用場(chǎng)景,統(tǒng)一采用各模型平臺(tái)電腦端默認(rèn)設(shè)置;

5.展示呈現(xiàn)采用一次生成結(jié)果,不進(jìn)行二次調(diào)整優(yōu)化。

以下是各模型的實(shí)際生成效果:

場(chǎng)景1:二次創(chuàng)作場(chǎng)景

提示詞:做出加油的動(dòng)作后做出鬼臉,吐舌頭并眨右眼。

場(chǎng)景說(shuō)明:使用梗圖《握拳寶寶》,模擬用戶二次創(chuàng)作,測(cè)試模型對(duì)于圖片的理解和生成能力。對(duì)于模型主要的難點(diǎn)在于需要理解“鬼臉”的含義,并能對(duì)“吐舌頭”和“眨眼”兩個(gè)動(dòng)作做出反饋和生成?,F(xiàn)階段,模型一般只能識(shí)別一個(gè)動(dòng)詞。

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

網(wǎng)絡(luò)上曾經(jīng)爆火的“握拳寶寶”

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

↑即夢(mèng):主體的手部、嘴部產(chǎn)生了明顯畸變,對(duì)于提示詞動(dòng)作的理解沒(méi)有非常明顯。

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

↑可靈:主體動(dòng)作流暢自然,具有真實(shí)感,對(duì)于提示詞動(dòng)作理解不夠到位。

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

↑PixVerse:主體動(dòng)作流暢自然,能夠做出提示詞相關(guān)的動(dòng)作,這是幾個(gè)生成視頻中唯一一個(gè)做出“眨眼”動(dòng)作的模型。

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

↑清影:不敢說(shuō)話了,我怕說(shuō)錯(cuò)了一不小心被吃掉。

場(chǎng)景2:人物吃東西場(chǎng)景

提示詞:一個(gè)亞洲年輕男性在家里用筷子津津有味地吃一碗面條,風(fēng)格真實(shí),類似于電影《天使愛(ài)美麗》,環(huán)境舒適溫馨,鏡頭逐漸拉近對(duì)準(zhǔn)人物。

場(chǎng)景說(shuō)明:對(duì)于模型來(lái)說(shuō),需要圍繞“亞洲年輕男性”“筷子”“面條”生成視頻,同時(shí)要理解電影風(fēng)格和環(huán)境,并按照指示進(jìn)行運(yùn)鏡。更重要的是,通過(guò)吃飯這個(gè)場(chǎng)景可以更清晰地讓模型展示手部細(xì)節(jié),并通過(guò)吃面條這個(gè)動(dòng)作來(lái)展示模型對(duì)于物理世界的理解。

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

↑即夢(mèng):第一幀很帥,光影也很自然。但依舊存在臉部和手部畸變的問(wèn)題,以及模型明顯不能夠理解筷子的使用方式和面條的食用方式。

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

↑可靈:非常驚艷的視頻!環(huán)境的光線、人物的坐姿和使用筷子的手部姿勢(shì)都非常真實(shí),甚至嘴部的油光反射都清晰可見(jiàn),不愧是據(jù)說(shuō)可靈最擅長(zhǎng)的吃播領(lǐng)域。唯一是面條的運(yùn)動(dòng)軌跡有一些小暇疵。

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

↑PixVerse:慘不忍睹,甚至還被動(dòng)卡出了一個(gè)不連貫的分鏡,也沒(méi)有理解運(yùn)鏡。

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

↑清影:如果不看主體人物動(dòng)作,其實(shí)還算過(guò)得去。光線、環(huán)境和氛圍都到位了。

場(chǎng)景3:動(dòng)物擬人場(chǎng)景

提示詞(簡(jiǎn)單版):一頭大熊貓戴著金邊眼鏡在教室黑板前講課。

提示詞(復(fù)雜版):電影膠片感風(fēng)格的場(chǎng)景中,一頭大熊貓戴著金邊眼鏡,在教室黑板前講課。它的動(dòng)作自然流暢,周圍是充滿質(zhì)感的教室環(huán)境,學(xué)生們認(rèn)真聽(tīng)講。整個(gè)場(chǎng)景如同電影畫面,光影處理細(xì)膩,色彩飽滿。電影膠片感風(fēng)格,氣氛溫馨,8K電影級(jí)。

場(chǎng)景說(shuō)明:該場(chǎng)景通過(guò)設(shè)置兩版提示詞,來(lái)測(cè)試大模型對(duì)于想象力的理解。簡(jiǎn)單版提示詞僅有大熊貓、金邊眼鏡、黑板,模型可以通過(guò)這三個(gè)關(guān)鍵詞生成具有可自主添加其他內(nèi)容的視頻,來(lái)展現(xiàn)模型的想象力和細(xì)節(jié)搭建;復(fù)雜版提示詞按照清影內(nèi)設(shè)的提示詞調(diào)試小程序生成,涉及場(chǎng)景、風(fēng)格、人物、環(huán)境、色彩、氛圍和清晰度等,測(cè)試模型的細(xì)節(jié)刻畫。

先看簡(jiǎn)單版提示詞生成的效果:

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

↑即夢(mèng):很不錯(cuò)的視頻生成,除了“金邊眼鏡”外,要素齊全,神態(tài)動(dòng)作也非常自然,光影非常優(yōu)秀。黑板上的字甚至有些以假亂真。

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

↑可靈:各種素材都齊了,但是沒(méi)能特別理解講課和吃竹子的區(qū)別。為了減少失誤,畫面整體相對(duì)單調(diào),沒(méi)有添加更多細(xì)節(jié)。

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

↑PixVerse:要素都齊全,風(fēng)格也不錯(cuò),就是眼鏡稍微有點(diǎn)出戲(也比沒(méi)有強(qiáng))

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

↑清影:完全沒(méi)有領(lǐng)悟提示詞的意思表達(dá)

升級(jí)提示詞后的效果:

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

↑即夢(mèng):效果依然不錯(cuò),光影理解也在線,唯一小瑕疵還是眼鏡部分,有畸變,以及好像不太能理解“講課”這一場(chǎng)景的座位排列。

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

↑可靈:真·熊貓大師講課圖,沒(méi)得說(shuō),優(yōu)秀!

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

↑PixVerse:模型自己添加了運(yùn)鏡和細(xì)節(jié)成分,最后有一些扭曲,整體效果跟前一版差不多。

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

↑清影:有景深和運(yùn)鏡,畫面質(zhì)感還需要提升,相比前一版有了很大進(jìn)步。

場(chǎng)景4:科技想象場(chǎng)景

提示詞(簡(jiǎn)單版):充滿科技感的未來(lái)城市一角,仰視視角。

提示詞(復(fù)雜版):在充滿科技感的科幻風(fēng)格未來(lái)城市中,使用推近鏡頭,展現(xiàn)建筑和交通工具的細(xì)節(jié),無(wú)人機(jī)在空中穿梭,天氣晴朗,陽(yáng)光灑在高樓大廈的玻璃幕墻上陽(yáng)光透過(guò)高樓的縫隙灑下,周圍環(huán)境充滿未來(lái)感,科幻風(fēng)格,氣氛激昂明朗,HDR高動(dòng)態(tài)。

場(chǎng)景說(shuō)明:該場(chǎng)景同樣設(shè)置兩版關(guān)鍵詞,簡(jiǎn)單版只給出科技感、城市和視角三個(gè)關(guān)鍵詞,由模型填充生成剩下的內(nèi)容;復(fù)雜版提示詞同樣使用清影的提示詞調(diào)試程序生成,涉及風(fēng)格、運(yùn)鏡、場(chǎng)景、環(huán)境、色彩、氣氛和清晰度。一方面,該場(chǎng)景主要測(cè)試模型在不同顆粒度的提示詞下所生成的視頻內(nèi)容豐富性;另一方面。“未來(lái)”是現(xiàn)實(shí)物理世界與想象世界的結(jié)合,可以測(cè)試模型對(duì)于建筑、光影和科幻的理解。

同樣先看簡(jiǎn)單版:

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

↑即夢(mèng):運(yùn)鏡角度、色彩等方面做得都很好,突出了科技感,對(duì)于提示詞的理解是到位的。

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

↑可靈:不出錯(cuò)的方案。建筑有畸變,對(duì)于“未來(lái)”的想象力有一些欠缺,僅僅是城市建筑的堆砌。不過(guò)能夠在建筑外立面添加LED大屏,也算是一個(gè)亮點(diǎn)。

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

↑PixVerse:科幻感十足,交通工具、城市、環(huán)境都做得非常到位。不過(guò)好像沒(méi)有特別理解仰視視角。

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

↑清影:倒是對(duì)仰視視角非常有心得體會(huì),但是色彩和“未來(lái)城市”對(duì)理解依然還是差一些。

再看復(fù)雜提示詞版生成效果:

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

↑即夢(mèng):很優(yōu)秀的視頻了,除去無(wú)人機(jī)的物理運(yùn)動(dòng)方式不能完全理解以外,對(duì)于提示詞和風(fēng)格的理解和把握非常到位。

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

↑可靈:依然是不會(huì)出錯(cuò)的方案,有一些畸變,就是看起來(lái)好像是北京動(dòng)物園公交樞紐的實(shí)拍是怎么回事。

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

↑PixVerse:有點(diǎn)抽象的科幻,不太知道該怎么評(píng)價(jià)?;冇行﹪?yán)重,但科幻感還是很足的。

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

↑清影:陽(yáng)光很好,以至于只能看見(jiàn)玻璃幕墻。

除了場(chǎng)景應(yīng)用,我們還從另外四個(gè)維度對(duì)所選取的四個(gè)大模型進(jìn)行了測(cè)評(píng):

1)視頻生成質(zhì)量和清晰度

2)內(nèi)容生成準(zhǔn)確性、一致性和豐富性

3)使用成本和價(jià)格

4)生成速度和交互界面

基于「科技新知」的測(cè)試情況,在視頻質(zhì)量和清晰度方面,可靈大模型在四個(gè)模型中更勝一籌,例如在生成大熊貓視頻時(shí),其能夠較為清晰細(xì)膩地表現(xiàn)出大熊貓毛發(fā)的紋理、質(zhì)感和色澤;對(duì)于物體的邊框勾勒也區(qū)分明確,畫面更真實(shí),相對(duì)來(lái)說(shuō)物體畸變也是最少的。清晰度方面,幾個(gè)大模型生成效果都還不錯(cuò),PixVerse效果相對(duì)落后。

從準(zhǔn)確性和一致性比較,四個(gè)模型對(duì)于部分提示詞的忽略是普遍情況。對(duì)于兩個(gè)及以上動(dòng)詞,通常模型只會(huì)關(guān)注其中一個(gè),側(cè)重選擇哪些關(guān)鍵詞和關(guān)鍵信息也是考量模型理解能力的重要判斷方式。

從生成視頻的豐富性上,即夢(mèng)和PixVerse表現(xiàn)較好。在一些除主體元素外的細(xì)節(jié)方面,二者都在盡量擴(kuò)充內(nèi)容,尤其是即夢(mèng)對(duì)光線光影頗有理解。反觀可靈,在這部分則相對(duì)保守,主要以保證主體元素和動(dòng)作不出差錯(cuò)為主要聚焦。

從使用成本上,目前四個(gè)模型均可以免費(fèi)或付費(fèi)使用。具體來(lái)看,截至測(cè)評(píng)日,清影可以無(wú)限量使用,可靈、即夢(mèng)和PicVerse則采用每日贈(zèng)送積分點(diǎn)數(shù)的方式供用戶體驗(yàn)。除此之外,每家的付費(fèi)機(jī)制各有側(cè)重。

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

四個(gè)頭部AI視頻生成模型對(duì)比表

從生成速度上,我們同步實(shí)測(cè)了幾個(gè)模型的生成速度,得到如下結(jié)果:

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

四個(gè)頭部AI視頻生成模型生成速度對(duì)比表(數(shù)據(jù)測(cè)試時(shí)間為8月3日上午11時(shí))

從交互來(lái)看,在注冊(cè)登錄門檻上,清影僅采用手機(jī)驗(yàn)證碼注冊(cè)登錄,相對(duì)簡(jiǎn)單;可靈支持手機(jī)驗(yàn)證碼和快手賬號(hào)兩種登錄方式,默認(rèn)使用手機(jī)驗(yàn)證碼;PixVerse則遵循海外主流產(chǎn)品的登錄方式,提供谷歌、Discord綁定和郵箱三種登錄方式;即夢(mèng)帶有一貫的字節(jié)系產(chǎn)品特色,比如在電腦端使用產(chǎn)品之前,需要先下載抖音才能掃碼登錄,當(dāng)然也可以選擇使用手機(jī)驗(yàn)證碼登錄,但又必須授權(quán)抖音驗(yàn)證。

在頁(yè)面布局上,PixVerse采用純英文界面,右上角為賬戶等個(gè)人信息,左側(cè)為功能性按鈕,界面交互非常簡(jiǎn)單,可調(diào)節(jié)參數(shù)也并不多,主要是正向提示詞、負(fù)提示詞,模型選擇,時(shí)長(zhǎng),畫面比例等。

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

可靈的頁(yè)面布局也類似,使用傳統(tǒng)操作臺(tái)界面,右上角為賬戶信息,左側(cè)為調(diào)試臺(tái),中間為預(yù)覽窗口,右側(cè)為歷史記錄,動(dòng)線流暢??烧{(diào)節(jié)等參數(shù)包括正向提示詞、創(chuàng)意想象力/創(chuàng)意相關(guān)性,生成模式、時(shí)長(zhǎng)、視頻比例、運(yùn)鏡、負(fù)提示詞等。

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

智譜清言將AI生成視頻作為整個(gè)平臺(tái)的一個(gè)子功能,嵌入到平臺(tái)看板中,因此在界面布局上稍顯雜亂。界面共分為四個(gè)部分,最左側(cè)是平臺(tái)的功能模塊,再到歷史記錄、視頻預(yù)覽,對(duì)于生成視頻可操作性不高。最右側(cè)才是控制臺(tái),僅有提示詞輸入,視頻風(fēng)格、情感氛圍和運(yùn)鏡方式可以選擇,需要用戶自行探索部分隱性功能,有一定學(xué)習(xí)門檻。

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

即夢(mèng)模型主界面簡(jiǎn)潔,總體色調(diào)和布局承襲剪映的風(fēng)格,分為左側(cè)調(diào)試和右側(cè)預(yù)覽兩部分,調(diào)試部分與其他模型大同小異。在右側(cè)預(yù)覽部分,對(duì)生成的視頻可以實(shí)現(xiàn)延長(zhǎng)時(shí)長(zhǎng)、對(duì)口型、補(bǔ)幀、提升分辨率等會(huì)員功能,用于對(duì)生成視頻的調(diào)整,也符合用戶工作流習(xí)慣。

實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯

測(cè)評(píng)觀察

總體使用下來(lái),「科技新知」個(gè)人的感受是產(chǎn)品使用不及預(yù)期,頗有雷聲大雨點(diǎn)小之意。就「科技新知」的測(cè)試體驗(yàn)而言,幾款模型中體驗(yàn)最好的是可靈,不論是文生視頻還是圖生視頻,相對(duì)來(lái)說(shuō)都比較絲滑。對(duì)新手用戶來(lái)說(shuō),不需要掌握非常復(fù)雜的提示詞技巧,僅按照模型操作界面的提示,使用純自然語(yǔ)言就能夠達(dá)到相對(duì)滿意的效果。另一方面,生成的視頻在細(xì)節(jié)(比如手部)方面處理得較平滑,失誤率較少。對(duì)于現(xiàn)階段生成視頻通常需要“抽卡”(碰運(yùn)氣)的賽道常態(tài)來(lái)說(shuō),減少失誤率就意味著提升質(zhì)量。

在本次測(cè)試場(chǎng)景的反饋中,即夢(mèng)和PixVerse生成的視頻質(zhì)量相對(duì)不穩(wěn)定,一定程度上表現(xiàn)出了模型穩(wěn)定性還有待提升。而清影模型,不知是否因?yàn)橛?xùn)練素材的原因,生成的視頻總是帶有濃郁的色彩和卡通風(fēng)格,讓人不由想起B(yǎng)站“學(xué)了五年動(dòng)畫的朋友”系列。

技術(shù)的發(fā)展固然鼓舞人心。除了速度提升以外,不少AI視頻生成模型已經(jīng)初步具備了“理解”世界的能力。即在視頻生成時(shí)可以理解物體運(yùn)動(dòng)過(guò)程中的物理世界,也能預(yù)測(cè)視頻下一步可能發(fā)生什么。

但在實(shí)際應(yīng)用層面,這類大模型的局限也很顯然。5到10秒的可選視頻長(zhǎng)度對(duì)于用戶來(lái)說(shuō)稍顯尷尬,很難進(jìn)行任何故事性創(chuàng)作。目前最匹配的領(lǐng)域,或許只能是制作一些表情包或梗圖二次創(chuàng)作。企業(yè)并非沒(méi)有意識(shí)到問(wèn)題,只是現(xiàn)實(shí)很骨感——長(zhǎng)度限制是由開(kāi)發(fā)成本導(dǎo)致的?,F(xiàn)階段在AI視頻生成賽道上,玩家比的不只是技術(shù),還有資金。為了“回血”,平臺(tái)紛紛設(shè)計(jì)了會(huì)員機(jī)制,怎奈花的比掙的多得多。

據(jù)調(diào)查機(jī)構(gòu) Factorial Funds 的數(shù)據(jù),以 Sora 為例,它 30 億參數(shù)(主流猜測(cè) )的訓(xùn)練成本,比 1.8 萬(wàn)億參數(shù)的 GPT-4 還要多。這還只是訓(xùn)練,實(shí)際使用的推理成本要更多。國(guó)內(nèi)有 AI 企業(yè)做過(guò)一個(gè)折算,生成一個(gè)差不多兩分鐘的視頻,企業(yè)的成本是 180 元。收取的會(huì)員制費(fèi)用相對(duì)于其研發(fā)成本來(lái)說(shuō)簡(jiǎn)直是九牛一毛。

從這個(gè)層面看,像抖音、快手這類擁有短視頻平臺(tái)的玩家自帶天然優(yōu)勢(shì)。一方面,其訓(xùn)練數(shù)據(jù)并不缺乏,另一方面,自身的海量用戶也使企業(yè)更容易實(shí)現(xiàn)商業(yè)化路徑的閉環(huán)。但變現(xiàn)門檻也無(wú)法忽視。設(shè)想一下,如果只是一名普通的C端用戶,除了一開(kāi)始的新鮮勁兒,如何保證其付費(fèi)率和付費(fèi)意愿?

因此,成為“中國(guó)版的Sora”遠(yuǎn)不是這場(chǎng)AI視頻大模型競(jìng)賽的終點(diǎn),而恰恰只是起點(diǎn)。產(chǎn)品問(wèn)世之后,誰(shuí)能找到可持續(xù)的商業(yè)化之路,落地產(chǎn)業(yè)化應(yīng)用,才是國(guó)產(chǎn)AI賽道的終極玩家。

科技新知
分享到朋友圈
收藏
收藏
評(píng)分

綜合評(píng)分:

我的評(píng)分
Xinstall 15天會(huì)員特權(quán)
Xinstall是專業(yè)的數(shù)據(jù)分析服務(wù)商,幫企業(yè)追蹤渠道安裝來(lái)源、裂變拉新統(tǒng)計(jì)、廣告流量指導(dǎo)等,廣泛應(yīng)用于廣告效果統(tǒng)計(jì)、APP地推與CPS/CPA歸屬統(tǒng)計(jì)等方面。
20羽毛
立即兌換
一書一課30天會(huì)員體驗(yàn)卡
領(lǐng)30天VIP會(huì)員,110+門職場(chǎng)大課,250+本精讀好書免費(fèi)學(xué)!助你提升職場(chǎng)力!
20羽毛
立即兌換
順豐同城急送全國(guó)通用20元優(yōu)惠券
順豐同城急送是順豐推出的平均1小時(shí)送全城的即時(shí)快送服務(wù),專業(yè)安全,準(zhǔn)時(shí)送達(dá)!
30羽毛
立即兌換
科技新知
科技新知
發(fā)表文章215
讀懂硬核科技,記錄產(chǎn)業(yè)革新。公眾號(hào):科技新知(kejixinzhi)
確認(rèn)要消耗 羽毛購(gòu)買
實(shí)測(cè)4款國(guó)產(chǎn)頭部AI視頻大模型:不及預(yù)期、差異明顯嗎?
考慮一下
很遺憾,羽毛不足
我知道了

我們致力于提供一個(gè)高質(zhì)量?jī)?nèi)容的交流平臺(tái)。為落實(shí)國(guó)家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評(píng)論自律管理,為了保護(hù)用戶創(chuàng)造的內(nèi)容、維護(hù)開(kāi)放、真實(shí)、專業(yè)的平臺(tái)氛圍,我們團(tuán)隊(duì)將依據(jù)本公約中的條款對(duì)注冊(cè)用戶和發(fā)布在本平臺(tái)的內(nèi)容進(jìn)行管理。平臺(tái)鼓勵(lì)用戶創(chuàng)作、發(fā)布優(yōu)質(zhì)內(nèi)容,同時(shí)也將采取必要措施管理違法、侵權(quán)或有其他不良影響的網(wǎng)絡(luò)信息。


一、根據(jù)《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國(guó)未成年人保護(hù)法》等法律法規(guī),對(duì)以下違法、不良信息或存在危害的行為進(jìn)行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
    1)反對(duì)憲法所確定的基本原則;
    2)危害國(guó)家安全,泄露國(guó)家秘密,顛覆國(guó)家政權(quán),破壞國(guó)家統(tǒng)一,損害國(guó)家榮譽(yù)和利益;
    3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽(yù)、榮譽(yù);
    4)宣揚(yáng)恐怖主義、極端主義或者煽動(dòng)實(shí)施恐怖活動(dòng)、極端主義活動(dòng);
    5)煽動(dòng)民族仇恨、民族歧視,破壞民族團(tuán)結(jié);
    6)破壞國(guó)家宗教政策,宣揚(yáng)邪教和封建迷信;
    7)散布謠言,擾亂社會(huì)秩序,破壞社會(huì)穩(wěn)定;
    8)宣揚(yáng)淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
    9)煽動(dòng)非法集會(huì)、結(jié)社、游行、示威、聚眾擾亂社會(huì)秩序;
    10)侮辱或者誹謗他人,侵害他人名譽(yù)、隱私和其他合法權(quán)益;
    11)通過(guò)網(wǎng)絡(luò)以文字、圖片、音視頻等形式,對(duì)未成年人實(shí)施侮辱、誹謗、威脅或者惡意損害未成年人形象進(jìn)行網(wǎng)絡(luò)欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法規(guī)禁止的其他內(nèi)容;


2. 不友善:不尊重用戶及其所貢獻(xiàn)內(nèi)容的信息或行為。主要表現(xiàn)為:
    1)輕蔑:貶低、輕視他人及其勞動(dòng)成果;
    2)誹謗:捏造、散布虛假事實(shí),損害他人名譽(yù);
    3)嘲諷:以比喻、夸張、侮辱性的手法對(duì)他人或其行為進(jìn)行揭露或描述,以此來(lái)激怒他人;
    4)挑釁:以不友好的方式激怒他人,意圖使對(duì)方對(duì)自己的言論作出回應(yīng),蓄意制造事端;
    5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對(duì)方難堪;
    6)謾罵:以不文明的語(yǔ)言對(duì)他人進(jìn)行負(fù)面評(píng)價(jià);
    7)歧視:煽動(dòng)人群歧視、地域歧視等,針對(duì)他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
    8)威脅:許諾以不良的后果來(lái)迫使他人服從自己的意志;


3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗(yàn)、擾亂本網(wǎng)站秩序的內(nèi)容,或進(jìn)行相關(guān)行為。主要表現(xiàn)為:
    1)多次發(fā)布包含售賣產(chǎn)品、提供服務(wù)、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
    2)單個(gè)帳號(hào)多次發(fā)布包含垃圾廣告的內(nèi)容;
    3)多個(gè)廣告帳號(hào)互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
    4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉(zhuǎn)網(wǎng)站等,誘騙用戶點(diǎn)擊鏈接
    5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當(dāng)曝光;
    6)購(gòu)買或出售帳號(hào)之間虛假地互動(dòng),發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關(guān)交易。
    7)發(fā)布包含欺騙性的惡意營(yíng)銷內(nèi)容,如通過(guò)偽造經(jīng)歷、冒充他人等方式進(jìn)行惡意營(yíng)銷;
    8)使用特殊符號(hào)、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。


4. 色情低俗信息,主要表現(xiàn)為:
    1)包含自己或他人性經(jīng)驗(yàn)的細(xì)節(jié)描述或露骨的感受描述;
    2)涉及色情段子、兩性笑話的低俗內(nèi)容;
    3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
    4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
    5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
    6)炒作緋聞、丑聞、劣跡等;
    7)宣揚(yáng)低俗、庸俗、媚俗內(nèi)容。


5. 不實(shí)信息,主要表現(xiàn)為:
    1)可能存在事實(shí)性錯(cuò)誤或者造謠等內(nèi)容;
    2)存在事實(shí)夸大、偽造虛假經(jīng)歷等誤導(dǎo)他人的內(nèi)容;
    3)偽造身份、冒充他人,通過(guò)頭像、用戶名等個(gè)人信息暗示自己具有特定身份,或與特定機(jī)構(gòu)或個(gè)人存在關(guān)聯(lián)。


6. 傳播封建迷信,主要表現(xiàn)為:
    1)找人算命、測(cè)字、占卜、解夢(mèng)、化解厄運(yùn)、使用迷信方式治病;
    2)求推薦算命看相大師;
    3)針對(duì)具體風(fēng)水等問(wèn)題進(jìn)行求助或咨詢;
    4)問(wèn)自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過(guò)占卜方法問(wèn)婚姻、前程、運(yùn)勢(shì),東西寵物丟了能不能找回、取名改名等;


7. 文章標(biāo)題黨,主要表現(xiàn)為:
    1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來(lái)誘導(dǎo)用戶;
    2)內(nèi)容與標(biāo)題之間存在嚴(yán)重不實(shí)或者原意扭曲;
    3)使用夸張標(biāo)題,內(nèi)容與標(biāo)題嚴(yán)重不符的。


8.「飯圈」亂象行為,主要表現(xiàn)為:
    1)誘導(dǎo)未成年人應(yīng)援集資、高額消費(fèi)、投票打榜
    2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
    3)鼓動(dòng)「飯圈」粉絲攀比炫富、奢靡享樂(lè)等行為
    4)以號(hào)召粉絲、雇用網(wǎng)絡(luò)水軍、「養(yǎng)號(hào)」形式刷量控評(píng)等行為
    5)通過(guò)「蹭熱點(diǎn)」、制造話題等形式干擾輿論,影響傳播秩序


9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
    1)可能引發(fā)未成年人模仿不安全行為和違反社會(huì)公德行為、誘導(dǎo)未成年人不良嗜好影響未成年人身心健康的;
    2)不當(dāng)評(píng)述自然災(zāi)害、重大事故等災(zāi)難的;
    3)美化、粉飾侵略戰(zhàn)爭(zhēng)行為的;
    4)法律、行政法規(guī)禁止,或可能對(duì)網(wǎng)絡(luò)生態(tài)造成不良影響的其他內(nèi)容。


二、違規(guī)處罰
本網(wǎng)站通過(guò)主動(dòng)發(fā)現(xiàn)和接受用戶舉報(bào)兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質(zhì)量、傷害平臺(tái)氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當(dāng)一個(gè)用戶發(fā)布違規(guī)內(nèi)容時(shí),本網(wǎng)站將依據(jù)相關(guān)用戶違規(guī)情節(jié)嚴(yán)重程度,對(duì)帳號(hào)進(jìn)行禁言 1 天、7 天、15 天直至永久禁言或封停賬號(hào)的處罰。當(dāng)涉及欺凌未成年人、危害未成年人身心健康、通過(guò)作弊手段注冊(cè)、使用帳號(hào),或者濫用多個(gè)帳號(hào)發(fā)布違規(guī)內(nèi)容時(shí),本網(wǎng)站將加重處罰。


三、申訴
隨著平臺(tái)管理經(jīng)驗(yàn)的不斷豐富,本網(wǎng)站出于維護(hù)本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對(duì)本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過(guò)「建議反饋」功能向本網(wǎng)站進(jìn)行反饋。
(規(guī)則的最終解釋權(quán)歸屬本網(wǎng)站所有)

我知道了
恭喜你~答對(duì)了
+5羽毛
下一次認(rèn)真讀哦
成功推薦給其他人
+ 10羽毛
評(píng)論成功且進(jìn)入審核!審核通過(guò)后,您將獲得10羽毛的獎(jiǎng)勵(lì)。分享本文章給好友閱讀最高再得15羽毛~
(羽毛可至 "羽毛精選" 兌換禮品)
好友微信掃一掃
復(fù)制鏈接