很可惜 T 。T 您現在還不是作者身份,不能自主發(fā)稿哦~
如有投稿需求,請把文章發(fā)送到郵箱tougao@appcpx.com,一經錄用會有專人和您聯系
咨詢如何成為春羽作者請聯系:鳥哥筆記小羽毛(ngbjxym)
來源 |深響
作者|何理
AI這把火,燒了一年多?,F在,有AI可以幫你寫PPT,有的會寫歌,有的能幫公司批量生成營銷素材,有的擅長“量子速讀”提煉長文本??傊?,幾乎每個月都有AI熱點出現。
各種熱點背后,有兩個事情值得注意:
第一,實踐證明,AI落地一定是貼近已有需求,用原先無法想象的效率,完成用戶想做或必須做的事;第二,已有的AI應用涉及文本、音頻、圖像等多種形式,但大多處于分散狀態(tài)。如果它們能被整合成一個多模態(tài)一站式AI應用平臺,AI落地會更加廣泛。
百度文庫是“跨模態(tài)+一站式“內容創(chuàng)作的AI原生應用代表。在Create2024百度AI開發(fā)者大會上,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏介紹了百度文庫的新成果——智能漫畫和智能畫本功能。李彥宏表示:“百度文庫的智能漫畫能力,極大地提高了創(chuàng)作漫畫的效率,降低了漫畫創(chuàng)作的成本和門檻,可以讓更多有想法、有創(chuàng)意的人實現自己的漫畫創(chuàng)作夢。”
除了生成漫畫和畫本,用戶還可以在百度文庫生成研究報告、PPT、文檔、思維導圖,還能進行拍圖生文等等。百度集團資深副總裁、百度移動生態(tài)事業(yè)群組總經理何俊杰表示:“大語言模型重新打開了文庫的想象空間,它已經進化為一站式AI內容創(chuàng)作平臺。”
如何理解百度文庫的新成果?我們不妨從直觀的體驗開始講起。
如果你愛看漫畫和小說,肯定有過這樣的時刻——這部漫畫劇情太精彩了,可是作者更新好慢,真想替他畫下去;作品里這兩人CP感好強!好想做二創(chuàng);這部玄幻小說設定有意思,要是文字能變成漫畫就更好了。
如果你是家長,在給孩子講故事時肯定也有過這樣的想法:孩子對故事里的場景和動物有些陌生,理解起來有困難,有對應的繪本就簡單多了。
這些需求很普遍,但在以前很難實現。大部分人沒接受過繪圖、分鏡訓練,即使能想象出精彩畫面,創(chuàng)意也無法落地。但借助百度文庫,一切都變得可行。
例如,《周處除三害》是一個在《晉書》和《世說新語》里都有記載的歷史故事。用戶可以借百度文庫,用簡單幾個步驟,把年代久遠的文字轉變?yōu)樯鷦拥漠嬅妫?/p>
在百度文庫上,只需要輸入《周處除三害》相關的「一句話」主題,百度文庫將檢索相關內容,自動生成完整的故事分鏡和腳本
用戶進行內容調整后,可以選擇多種漫畫風格,設定多種角色形象;
設置完畢后,百度文庫AI將自動生成完整漫畫作品,自動匹配豐富的人物對話文本,用戶可繼續(xù)在編輯器中進行精調。
《周處除三害》智能漫畫創(chuàng)作全過程
漫畫是風格化的,畫本則更廣泛通用。大會上,百度演示的智能畫本案例《小明不愛洗澡》,在畫風上明顯更“包容”,適用于更低年齡段讀者的需求,可以有效填補家庭教育場景里的“繪本空白”。
《小明不愛洗澡》智能畫本生成結果
「深響」近期試用了百度文庫的智能漫畫和智能畫本功能,如大會演示的那樣,兩個功能易上手、速度快、效果好——只需輸入主題即可生成故事大綱,選擇“制作畫本”后稍加等待就能獲得完整結果。
試用過程中,「深響」也把百度文庫生成的繪本發(fā)給有娃的朋友,這位年輕媽媽對繪本的反饋是“畫面質量、閱讀體驗和市面上的親子繪本很接近”??赐旰笏€發(fā)來一些需求,比如“能不能以‘吃飯前要洗手’為主題做個繪本”,“小朋友剛跟我說了一些奇思妙想,能不能把它們變成繪本”。
和之前的體驗一樣,這兩個需求同樣都只需“一句話”主題輸入,就能變成繪本輸出(輸入“吃飯前要洗手”,可以獲得《小貓咪咪學洗手》的繪本),整個操作過程幾乎是“傻瓜式”,它可以發(fā)生在親子互動的各個環(huán)節(jié),家長和孩子的交流也因此變得更有趣生動。
當然,如果想更精細地編輯故事文本,百度文庫也給了相應的選項。你可以對生成的故事大綱進行編輯,也可以對分鏡腳本進行修改?;蛘?,你也可以和孩子一起,在百度文庫的智能文檔里,利用AI交互,把孩子的創(chuàng)意變成一個完整的故事,然后再把這個故事變成好看的漫畫或繪本。正好423世界讀書日馬上要到了,利用百度文庫,家長和孩子都能實現“繪本自由”,讀書這件事會因為AI變得更易得、更有趣。
這樣的交互體驗和交付質量是開創(chuàng)性的。目前,行業(yè)在“AI繪制漫畫”上仍存在一定痛點,多數工具只能生成單圖、四宮格圖片,在場景關聯性、人物一致性、劇情還原度上都有待完善,且通常需要大量后期工作來調整。
而百度文庫不只是解決“繪制”環(huán)節(jié)的難點,還將AI封裝于整個工作流程,在“指令生成故事”等方面進行優(yōu)化提升,同時強化多場景及多人物處理、人物一致性、故事完整性、畫面細膩度、圖文與劇情匹配度等方面的專業(yè)表現,這使得其生成的作品達到能“直接交付”的水平。
就體驗而言,智能漫畫和智能畫本都是幫助用戶零門檻落地創(chuàng)意的好工具,但它們并不僅僅是兩款“創(chuàng)意工具”。兩款產品是“結果”,共同成長于百度文庫的跨模態(tài)和一站式能力之上。
跨模態(tài)指的是,百度文庫能夠處理各種文字、語音、圖像信息,能把不同模態(tài)的信息綜合起來,實現更精確的情境理解和輸出。在此基礎上,用戶可以在百度文庫一個平臺上,一站式實現不同類型的內容創(chuàng)作。
簡言之,跨模態(tài)和一站式能力讓百度文庫有更廣泛的落地可能。它可以橫向進入更多場景,縱向進入更多環(huán)節(jié)。
“進入更多場景”指的是,在工作生活中,你可以利用百度文庫完成更多需求,比如生成思維導圖、做研究報告、智能合成多個文檔、寫PPT和年終匯報,或者直接發(fā)一張圖,讓文庫幫你生成小紅書文案。基于自然語言交互,你的產出過程會簡便得多、高效得多。
百度文庫AI解圖創(chuàng)作小紅書文案
以研究報告和PPT為例,一份研究報告涉及大量文字和圖表,一份精美的PPT需要用戶不斷調整樣式、文字、排版,傳統(tǒng)內容編輯工具操作起來又很繁瑣,完成相應的產出往往要耗費大量精力。
借助百度文庫,用戶能輕松實現原本繁復操作才能達到的效果——做個研究報告,只需輸入報告主題,或者用簡單的語音交互,幾分鐘內便能獲得一份結構嚴謹、圖表清晰、內容翔實的報告。基于這份報告,用戶還能進行精細化的編輯調整,選擇不同風格的模版封面及導出格式。
百度文庫“智能生成研究報告”演示
類似的,用戶只需要輸入主題或上傳文檔,或者簡單“動動嘴”,就能利用百度文庫在幾十秒內生成一份邏輯清晰、配圖準確的PPT。此外,百度文庫也支持模版上傳、文檔生成PPT、PPT內生成專業(yè)圖表、PPT在線調整編輯、一鍵生成演講稿和思維導圖等功能,能夠做到多格式、多文檔的生成、編輯全能力打通。
全能力打通破解的是當前AI應用的核心痛點。一直以來,市場關于AI有種“矛盾”的態(tài)度,大家都覺得AI很強,但實際應用體驗總是“不盡人意”。目前,AI在工作生活中的落地還是處于“分散”狀態(tài),大部分人只用AI解決點狀需求,沒能把它融入工作流程中。如果想用AI完整、順暢地解決需求,則需要專門搭建一套AI工作流,整個過程費時費力。
百度文庫的升級打破了僵局。從“頭腦風暴”、“寫大綱”,到生成和編輯文檔,再到PPT生成、思維導圖等文件的生成,各個場景的需求用戶都可以基于百度文庫解決。重要的是,百度文庫“進入更多環(huán)節(jié)”的同時,用戶操作門檻低,且體驗順滑,無需在文件傳輸和轉換等問題上多花費精力。
而百度文庫的全場景指令創(chuàng)作和編輯,意味著用戶僅需簡單的語音指令,即可不受地點限制地高效完成工作中的常見需求。低門檻操作+全場景覆蓋+靈活編輯+PC移動雙端操作,百度文庫帶來的是新的辦公體驗。百度文庫并非只解決單一環(huán)節(jié)的問題,而是成長為一個完整的生產力平臺。
百度文庫全場景指令創(chuàng)作和編輯演示
新技術發(fā)展總遵循這樣的規(guī)律:最開始,它是少數愛好者的“趣味工具”,但隨著技術能力的完善以及用戶的增長,它會越來越快地滲透到大眾的工作和生活中,滲透到千行百業(yè)里。
早年,在圖形界面交互出現前,計算機交互靠的是各種指令和參數,學習門檻高,只有少數極客玩得轉。但隨著計算機交互方式和技術的發(fā)展,大眾經過簡單學習就能操作個人電腦,PC和互聯網時代得以到來。
今天的AI技術也是如此。一年多以前,大家都在鉆研怎么寫Prompt,精調一張繪畫作品需要不斷測試提示詞。隨著技術和產品的發(fā)展,繁瑣和專業(yè)的操作被不斷簡化,AI生成結果變得穩(wěn)定且高質,外加自然語言本身就是“零門檻”的交互方式,AI正在加速往更大眾化的方向滲透。
AI時代的敘事漸漸從“趣味技術工具”轉向“生產力革新”。用戶和行業(yè)都將從中受益——用戶側,原先無法實現的需求變得觸手可及;行業(yè)側,隨著以智能漫畫和智能畫本為代表的多模態(tài)AI能力的成熟,影視文娛行業(yè)、家庭教育行業(yè)、出版行業(yè)都能從中找到提效空間。
僅僅一年多,AI的發(fā)展就又進入了新的階段。“跨模態(tài)+一站式”趨勢正在推動AI內容創(chuàng)作進一步落地,而百度文庫和趨勢同頻,且是趨勢中的領先者。
這是多重因素共同造就的——百度文庫在文本理解與數據分析領域有豐富積累,能準確抓取并分析文字中的數據信息,再轉換生成適合的圖表;文心大模型又為百度文庫注入了新活力。據悉,相比一年前,文心大模型的算法訓練效率提升到了原來的5.1倍,周均訓練有效率達到98.8%,推理性能提升了105倍,推理的成本降到了原來的1%;疊加百度文庫多年來對用戶需求的洞察,百度文庫得以重構為“一站式AI內容創(chuàng)作平臺”。
大會上,李彥宏提到,AI正在掀起一場創(chuàng)造力革命。“未來開發(fā)應用就像拍個短視頻一樣簡單,人人都是開發(fā)者,人人都是創(chuàng)造者”。
百度文庫的進展,正在讓“零門檻、一站式”創(chuàng)作落地現實。從過往的技術變革經驗來看,新技術的發(fā)展和滲透常常是指數級的,智能漫畫和智能畫本將推動AI大眾化進程。AI時代的增長曲線,顯然越來越陡峭了。
本文為作者獨立觀點,不代表鳥哥筆記立場,未經允許不得轉載。
《鳥哥筆記版權及免責申明》 如對文章、圖片、字體等版權有疑問,請點擊 反饋舉報
我們致力于提供一個高質量內容的交流平臺。為落實國家互聯網信息辦公室“依法管網、依法辦網、依法上網”的要求,為完善跟帖評論自律管理,為了保護用戶創(chuàng)造的內容、維護開放、真實、專業(yè)的平臺氛圍,我們團隊將依據本公約中的條款對注冊用戶和發(fā)布在本平臺的內容進行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質內容,同時也將采取必要措施管理違法、侵權或有其他不良影響的網絡信息。
一、根據《網絡信息內容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進行處理。
1. 違反法律法規(guī)的信息,主要表現為:
1)反對憲法所確定的基本原則;
2)危害國家安全,泄露國家秘密,顛覆國家政權,破壞國家統(tǒng)一,損害國家榮譽和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
5)煽動民族仇恨、民族歧視,破壞民族團結;
6)破壞國家宗教政策,宣揚邪教和封建迷信;
7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動非法集會、結社、游行、示威、聚眾擾亂社會秩序;
10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權益;
11)通過網絡以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進行網絡欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內容;
2. 不友善:不尊重用戶及其所貢獻內容的信息或行為。主要表現為:
1)輕蔑:貶低、輕視他人及其勞動成果;
2)誹謗:捏造、散布虛假事實,損害他人名譽;
3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進行揭露或描述,以此來激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應,蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
6)謾罵:以不文明的語言對他人進行負面評價;
7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網站秩序的內容,或進行相關行為。主要表現為:
1)多次發(fā)布包含售賣產品、提供服務、宣傳推廣內容的垃圾廣告。包括但不限于以下幾種形式:
2)單個帳號多次發(fā)布包含垃圾廣告的內容;
3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內容;
4)多次發(fā)布包含欺騙性外鏈的內容,如未注明的淘寶客鏈接、跳轉網站等,誘騙用戶點擊鏈接
5)發(fā)布大量包含推廣鏈接、產品、品牌等內容獲取搜索引擎中的不正當曝光;
6)購買或出售帳號之間虛假地互動,發(fā)布干擾網站秩序的推廣內容及相關交易。
7)發(fā)布包含欺騙性的惡意營銷內容,如通過偽造經歷、冒充他人等方式進行惡意營銷;
8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內容審核的廣告內容。
4. 色情低俗信息,主要表現為:
1)包含自己或他人性經驗的細節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內容;
4)帶有性暗示、性挑逗等易使人產生性聯想;
5)展現血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚低俗、庸俗、媚俗內容。
5. 不實信息,主要表現為:
1)可能存在事實性錯誤或者造謠等內容;
2)存在事實夸大、偽造虛假經歷等誤導他人的內容;
3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構或個人存在關聯。
6. 傳播封建迷信,主要表現為:
1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治??;
2)求推薦算命看相大師;
3)針對具體風水等問題進行求助或咨詢;
4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;
7. 文章標題黨,主要表現為:
1)以各種夸張、獵奇、不合常理的表現手法等行為來誘導用戶;
2)內容與標題之間存在嚴重不實或者原意扭曲;
3)使用夸張標題,內容與標題嚴重不符的。
8.「飯圈」亂象行為,主要表現為:
1)誘導未成年人應援集資、高額消費、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
4)以號召粉絲、雇用網絡水軍、「養(yǎng)號」形式刷量控評等行為
5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內容,主要表現為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導未成年人不良嗜好影響未成年人身心健康的;
2)不當評述自然災害、重大事故等災難的;
3)美化、粉飾侵略戰(zhàn)爭行為的;
4)法律、行政法規(guī)禁止,或可能對網絡生態(tài)造成不良影響的其他內容。
二、違規(guī)處罰
本網站通過主動發(fā)現和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內容質量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當一個用戶發(fā)布違規(guī)內容時,本網站將依據相關用戶違規(guī)情節(jié)嚴重程度,對帳號進行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內容時,本網站將加重處罰。
三、申訴
隨著平臺管理經驗的不斷豐富,本網站出于維護本網站氛圍和秩序的目的,將不斷完善本公約。
如果本網站用戶對本網站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網站進行反饋。
(規(guī)則的最終解釋權歸屬本網站所有)