chinesefreesexvideos高潮,欧美极品少妇性运交,久久久国产一区二区三区,99久久婷婷国产综合精品,成人国产一区二区三区

APP推廣合作
聯(lián)系“鳥哥筆記小喬”
機器學(xué)習(xí)預(yù)測未來!Google華人新模型,打個雞蛋就懂要做煎餅!
2021-11-25 15:57:14

編輯:LRS

【新智元導(dǎo)讀】預(yù)測未來一直是人類夢寐以求的事,而剛好機器學(xué)習(xí)模型正好擅于預(yù)測。最近Google、布朗大學(xué)的華人博士在ICCV 2021發(fā)表了他的新工作,在菜譜視頻數(shù)據(jù)集中可以合理預(yù)測未來,還不受時間限制,打個雞蛋就知道你要做煎餅!

隨著機器學(xué)習(xí)的模型在現(xiàn)實世界中的應(yīng)用和部署越來越多,AI 的決策也能夠用于幫助人們在日常生活中做出決策。

在計算機視覺領(lǐng)域的決策過程中,預(yù)測(Prediction)一直都是一個核心問題。

如何在不同的時間尺度上對未來作出合理的預(yù)測也是這些機器模型的重要的能力之一,這種能力可以讓模型預(yù)測出周圍世界的變化,包括其他模型的行為,并計劃下一步如何行動與決策。

更重要的是,成功的未來預(yù)測(future prediction)既需要捕捉環(huán)境中的有意義的物體變化,也需要了解環(huán)境如何隨著時間的推移進(jìn)行變化,以便作出決策和預(yù)測。

計算機視覺中關(guān)于未來預(yù)測的工作主要受限于其輸出的形式,輸出可能是圖像的像素或者是人工預(yù)定義的一些標(biāo)簽(例如預(yù)測某人是否會繼續(xù)行走、坐下等)。

這些預(yù)測內(nèi)容都太過詳細(xì)以至于難以完全預(yù)測成功,并且對現(xiàn)實世界信息的豐富性也缺乏有效利用。也就是說,如果一個模型在預(yù)測「跳躍行為」時,并不知道為什么他們會跳躍,或者他們在跳什么等等,那就沒辦法預(yù)測成功,結(jié)果基本等于亂猜。

此外,除了極少數(shù)例外,之前的模型被設(shè)計成對未來進(jìn)行固定偏移(offset)的預(yù)測,無法進(jìn)行動態(tài)時間間隔的預(yù)測,雖然這是一個限制性的假設(shè),因為我們很少知道何時會出現(xiàn)有意義的未來狀態(tài)。

在一個制作冰淇淋的視頻中,從cream到ice cream在視頻中的時間間隔為35 秒,因此預(yù)測這種變化的模型需要提前35秒來預(yù)判。但這一間隔在不同的行為和視頻中變化很大,例如有的博主可能用了更詳細(xì)、更長時間來制作冰淇淋,也就是說在未來的任何時間都有可能制作完成冰淇淋。

此外,可以大規(guī)模、數(shù)以百萬計收集此類視頻逐幀標(biāo)注,許多教學(xué)視頻都有語音轉(zhuǎn)換記錄,通常在整個視頻中提供簡明、一般的描述。這種數(shù)據(jù)源可以引導(dǎo)模型關(guān)注視頻中的重要部分,而無需手動標(biāo)注就能夠?qū)ξ磥硎录M(jìn)行靈活的數(shù)據(jù)驅(qū)動預(yù)測。

基于這個思路,Google在ICCV 2021上發(fā)表了一篇文章,提出了一種自監(jiān)督的方法,使用了一個大型、未標(biāo)記的人類活動數(shù)據(jù)集。所建立的模型具有高度的抽象性,可以任意時間間隔對未來進(jìn)行遠(yuǎn)距離預(yù)測,并能夠根據(jù)上下文選擇對未來的遠(yuǎn)期預(yù)測。

模型具有多模態(tài)周期一致性(Multi-Modal Cycle Consistency,MMCC)的目標(biāo)函數(shù),能夠利用敘事教學(xué)視頻來學(xué)習(xí)一個強大的未來預(yù)測模型。研究人員在文中還展示了如何在不進(jìn)行微調(diào)的情況下,將MMCC應(yīng)用于各種具有挑戰(zhàn)性的任務(wù),并對其預(yù)測進(jìn)行了量化測試實驗。

文章的作者Chen Sun來自Google和布朗大學(xué),目前是布朗大學(xué)計算機科學(xué)助理教授,研究計算機視覺、機器學(xué)習(xí)和人工智能,也是谷歌研究所的一名研究科學(xué)家。

他在2016年博士畢業(yè)于南加州大學(xué),導(dǎo)師是Ram Nevatia教授,于2011年完成清華大學(xué)計算機科學(xué)學(xué)士學(xué)位。

正在進(jìn)行的研究項目包括從無標(biāo)簽視頻中學(xué)習(xí)多模式表示和視覺交流,識別人類活動、對象及其隨時間的相互作用,并將表示轉(zhuǎn)移到embodied agents。

研究中主要解決了未來預(yù)測的三個核心問題:

1. 手動標(biāo)注視頻中的時間關(guān)系是非常耗時耗力的,而且很難定義標(biāo)簽的正確性。所以模型應(yīng)當(dāng)能夠從大量未標(biāo)記的數(shù)據(jù)中自主學(xué)習(xí)和發(fā)現(xiàn)事件的變換,從而實現(xiàn)實際應(yīng)用。

2. 對現(xiàn)實世界中復(fù)雜的長期事件變換進(jìn)行編碼需要學(xué)習(xí)更高層次的概念,這些概念通常在抽象的潛在表示中可以找到,而非只是圖像中的像素。

3. 時序的事件變換非常依賴于上下文,所以模型必須能夠在可變時間間隔下預(yù)測未來。

為了滿足這些需求,研究人員引入了一個新的自監(jiān)督訓(xùn)練目標(biāo)函數(shù)MMCC以及一個學(xué)習(xí)表達(dá)式來解決這一問題的模型。

模型從敘事視頻中的一個樣本幀開始,學(xué)習(xí)如何在所有敘事文本中找到相關(guān)的語言表述。結(jié)合視覺和文本這兩種模式,該模型能夠用到整個視頻來學(xué)習(xí)到如何預(yù)測潛在未來的事件,并估計該幀的相應(yīng)語言描述,并以類似的方式學(xué)習(xí)預(yù)測過去幀的函數(shù)。

循環(huán)約束(cycle constraint)要求最終模型預(yù)測等于起始幀。

另一方面,由于該模型不知道其輸入數(shù)據(jù)來自哪個模式,因此必須在視覺和語言上共同運作,因此無法選擇較低級別的未來預(yù)測框架。

模型學(xué)習(xí)嵌入所有視覺和文本節(jié)點,然后在其他模式下仔細(xì)計算與起始節(jié)點對應(yīng)的跨模式節(jié)點。這兩個節(jié)點的表示都被轉(zhuǎn)換為全連接層,預(yù)測了在初始模態(tài)下使用注意力的未來幀。然后重復(fù)backward過程,模型損失是通過預(yù)測起始節(jié)點來訓(xùn)練模型的最終輸出來結(jié)束循環(huán)(cycle)。

在實驗部分,由于大多數(shù)先前的benchmark側(cè)重于具有固定類別和時間偏移的有監(jiān)督行為預(yù)測,這篇論文中研究人員設(shè)計了一系列新的定性和定量實驗來評估不同的方法。

首先是數(shù)據(jù),研究人員在無約束的真實世界視頻數(shù)據(jù)上訓(xùn)練模型。使用HowTo100M數(shù)據(jù)集的子集,其中包含大約123萬個視頻及其自動提取的音頻腳本。此數(shù)據(jù)集中的視頻大致按主題區(qū)域分類,并且只使用分類為 Recipe 的視頻,大約是數(shù)據(jù)集中的四分之一。

在338033個Recipe視頻中,80% 為訓(xùn)練集,15%在驗證集,5%在測試集。Recipe視頻包含了豐富的復(fù)雜對象、操作和狀態(tài)轉(zhuǎn)換,并且該子集能夠讓開發(fā)者更快地訓(xùn)練模型。

為了進(jìn)行更多的控制測試(controlled test),研究人員使用CrossTask數(shù)據(jù)集,包含相似的視頻以及特定于任務(wù)的標(biāo)注。

所有視頻都與任務(wù)相關(guān),例如制作煎餅等,其中每個任務(wù)都有一個預(yù)先定義的高級別子任務(wù)序列,這些子任務(wù)具有豐富的長時間的相互依賴性,例如,要先把糊弄到碗里,然后才能把雞蛋打成碗,再加入糖漿等等。

使用TOP-K召回指標(biāo)評估模型預(yù)測行動的能力來衡量了模型預(yù)測正確未來的能力(越高越好)。

對于MMCC,為了確定整個視頻中有意義的隨時間推移的事件變化,研究人員根據(jù)模型的預(yù)測,為視頻中的每個幀對(pair)定義了一個可能的過渡分?jǐn)?shù),預(yù)測的幀越接近實際幀,則分?jǐn)?shù)越高。


參考資料:

https://ai.googleblog.com/2021/11/making-better-future-predictions-by.html


-END-

新智元
分享到朋友圈
收藏
收藏
評分

綜合評分:

我的評分
Xinstall 15天會員特權(quán)
Xinstall是專業(yè)的數(shù)據(jù)分析服務(wù)商,幫企業(yè)追蹤渠道安裝來源、裂變拉新統(tǒng)計、廣告流量指導(dǎo)等,廣泛應(yīng)用于廣告效果統(tǒng)計、APP地推與CPS/CPA歸屬統(tǒng)計等方面。
20羽毛
立即兌換
一書一課30天會員體驗卡
領(lǐng)30天VIP會員,110+門職場大課,250+本精讀好書免費學(xué)!助你提升職場力!
20羽毛
立即兌換
順豐同城急送全國通用20元優(yōu)惠券
順豐同城急送是順豐推出的平均1小時送全城的即時快送服務(wù),專業(yè)安全,準(zhǔn)時送達(dá)!
30羽毛
立即兌換
新智元
新智元
發(fā)表文章33
智能+中國主平臺,致力于推動中國從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點關(guān)注人工智能、機器人等前沿領(lǐng)域發(fā)展,關(guān)注人機融合、人工智能和機器人革命對人類
熱門文章
確認(rèn)要消耗 0羽毛購買
機器學(xué)習(xí)預(yù)測未來!Google華人新模型,打個雞蛋就懂要做煎餅!嗎?
考慮一下
很遺憾,羽毛不足
我知道了

我們致力于提供一個高質(zhì)量內(nèi)容的交流平臺。為落實國家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評論自律管理,為了保護(hù)用戶創(chuàng)造的內(nèi)容、維護(hù)開放、真實、專業(yè)的平臺氛圍,我們團隊將依據(jù)本公約中的條款對注冊用戶和發(fā)布在本平臺的內(nèi)容進(jìn)行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質(zhì)內(nèi)容,同時也將采取必要措施管理違法、侵權(quán)或有其他不良影響的網(wǎng)絡(luò)信息。


一、根據(jù)《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護(hù)法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進(jìn)行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
    1)反對憲法所確定的基本原則;
    2)危害國家安全,泄露國家秘密,顛覆國家政權(quán),破壞國家統(tǒng)一,損害國家榮譽和利益;
    3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
    4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
    5)煽動民族仇恨、民族歧視,破壞民族團結(jié);
    6)破壞國家宗教政策,宣揚邪教和封建迷信;
    7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
    8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
    9)煽動非法集會、結(jié)社、游行、示威、聚眾擾亂社會秩序;
    10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權(quán)益;
    11)通過網(wǎng)絡(luò)以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進(jìn)行網(wǎng)絡(luò)欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法規(guī)禁止的其他內(nèi)容;


2. 不友善:不尊重用戶及其所貢獻(xiàn)內(nèi)容的信息或行為。主要表現(xiàn)為:
    1)輕蔑:貶低、輕視他人及其勞動成果;
    2)誹謗:捏造、散布虛假事實,損害他人名譽;
    3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進(jìn)行揭露或描述,以此來激怒他人;
    4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應(yīng),蓄意制造事端;
    5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
    6)謾罵:以不文明的語言對他人進(jìn)行負(fù)面評價;
    7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
    8)威脅:許諾以不良的后果來迫使他人服從自己的意志;


3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網(wǎng)站秩序的內(nèi)容,或進(jìn)行相關(guān)行為。主要表現(xiàn)為:
    1)多次發(fā)布包含售賣產(chǎn)品、提供服務(wù)、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
    2)單個帳號多次發(fā)布包含垃圾廣告的內(nèi)容;
    3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
    4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉(zhuǎn)網(wǎng)站等,誘騙用戶點擊鏈接
    5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當(dāng)曝光;
    6)購買或出售帳號之間虛假地互動,發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關(guān)交易。
    7)發(fā)布包含欺騙性的惡意營銷內(nèi)容,如通過偽造經(jīng)歷、冒充他人等方式進(jìn)行惡意營銷;
    8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。


4. 色情低俗信息,主要表現(xiàn)為:
    1)包含自己或他人性經(jīng)驗的細(xì)節(jié)描述或露骨的感受描述;
    2)涉及色情段子、兩性笑話的低俗內(nèi)容;
    3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
    4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
    5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
    6)炒作緋聞、丑聞、劣跡等;
    7)宣揚低俗、庸俗、媚俗內(nèi)容。


5. 不實信息,主要表現(xiàn)為:
    1)可能存在事實性錯誤或者造謠等內(nèi)容;
    2)存在事實夸大、偽造虛假經(jīng)歷等誤導(dǎo)他人的內(nèi)容;
    3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構(gòu)或個人存在關(guān)聯(lián)。


6. 傳播封建迷信,主要表現(xiàn)為:
    1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治??;
    2)求推薦算命看相大師;
    3)針對具體風(fēng)水等問題進(jìn)行求助或咨詢;
    4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;


7. 文章標(biāo)題黨,主要表現(xiàn)為:
    1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來誘導(dǎo)用戶;
    2)內(nèi)容與標(biāo)題之間存在嚴(yán)重不實或者原意扭曲;
    3)使用夸張標(biāo)題,內(nèi)容與標(biāo)題嚴(yán)重不符的。


8.「飯圈」亂象行為,主要表現(xiàn)為:
    1)誘導(dǎo)未成年人應(yīng)援集資、高額消費、投票打榜
    2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
    3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
    4)以號召粉絲、雇用網(wǎng)絡(luò)水軍、「養(yǎng)號」形式刷量控評等行為
    5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序


9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
    1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導(dǎo)未成年人不良嗜好影響未成年人身心健康的;
    2)不當(dāng)評述自然災(zāi)害、重大事故等災(zāi)難的;
    3)美化、粉飾侵略戰(zhàn)爭行為的;
    4)法律、行政法規(guī)禁止,或可能對網(wǎng)絡(luò)生態(tài)造成不良影響的其他內(nèi)容。


二、違規(guī)處罰
本網(wǎng)站通過主動發(fā)現(xiàn)和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質(zhì)量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當(dāng)一個用戶發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將依據(jù)相關(guān)用戶違規(guī)情節(jié)嚴(yán)重程度,對帳號進(jìn)行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當(dāng)涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將加重處罰。


三、申訴
隨著平臺管理經(jīng)驗的不斷豐富,本網(wǎng)站出于維護(hù)本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網(wǎng)站進(jìn)行反饋。
(規(guī)則的最終解釋權(quán)歸屬本網(wǎng)站所有)

我知道了
恭喜你~答對了
+5羽毛
下一次認(rèn)真讀哦
成功推薦給其他人
+ 10羽毛
評論成功且進(jìn)入審核!審核通過后,您將獲得10羽毛的獎勵。分享本文章給好友閱讀最高再得15羽毛~
(羽毛可至 "羽毛精選" 兌換禮品)
好友微信掃一掃
復(fù)制鏈接