很可惜 T 。T 您現(xiàn)在還不是作者身份,不能自主發(fā)稿哦~
如有投稿需求,請把文章發(fā)送到郵箱tougao@appcpx.com,一經(jīng)錄用會有專人和您聯(lián)系
咨詢如何成為春羽作者請聯(lián)系:鳥哥筆記小羽毛(ngbjxym)
DeepSeek正在產(chǎn)生連鎖反應,開放成為了大勢所趨,行業(yè)頭部都在主動選擇開放。
2月6日,OpenAI宣布ChatGPT Search向所有人開放,無需注冊,來到OpenAI官網(wǎng)首頁就可以直接使用搜索功能。
就在OpenAI公布ChatGPT Search全面開放的前幾個小時,谷歌也剛剛宣布向所有人開放最新Gemini 2.0模型,包括Flash、Pro Experimental和Flash-Lite三個版本。
而在國內,屬百度反應最為迅速,立即跟上了開源和免費的步伐。
2月13日,文心一言在官網(wǎng)宣布將于4月1日起全面免費,所有PC端和App端用戶均可體驗文心系列最新模型,以及超長文檔處理、專業(yè)檢索增強、高級AI繪畫、多語種對話等功能。
2月14日,百度宣布將在未來幾個月中陸續(xù)推出文心大模型4.5系列,并于6月30日起正式開源。
另一方面,主動接入DeepSeek成為了新的“時髦”。國內大小規(guī)模企業(yè)紛紛宣布部署DeepSeek模型,大廠則以開放的心態(tài),將新的推理功能融入到業(yè)務生態(tài)中。
2月16日晚,百度搜索和文心智能體平臺宣布將全面接入DeepSeek和文心大模型最新的深度搜索功能。搜索用戶可免費使用DeepSeek和文心大模型深度搜索功能,文心智能體平臺的開發(fā)者也將能隨時調用DeepSeek模型創(chuàng)建并調優(yōu)智能體。
DeepSeek-R1在行業(yè)中產(chǎn)生了一種正向的反饋,大廠與大廠之間,開源與閉源之間逐漸開始打破壁壘,促進技術的流動和落地。各玩家不在抱有對峙的態(tài)度,而是把重點轉向了如何利用行業(yè)先進模型能力來賦能業(yè)務場景,促進應用產(chǎn)品升級,從而讓更多用戶享受到技術的普惠成果。
作為長期在閉源大模型上深耕,從未放棄過大模型預訓練的玩家,百度在開放上反應最為迅速。梳理其近期的動作,從大模型到搜索,百度打出了一套開放“組合拳”。
在開放的大趨勢影響下,百度自研大模型加入了開源、免費的行列。百度宣布將在未來幾個月中陸續(xù)推出文心大模型4.5系列,并6月30起正式開源。
對于DeepSeek,百度也表現(xiàn)出了積極擁抱態(tài)度。
先是在春節(jié)DeepSeek爆火期間,百度智能云宣布在千帆ModelBuilder平臺上架DeepSeek-R1及DeepSeek-V3兩款模型,以低于DeepSeek-V3官方刊例價3折和DeepSeek-R1官方刊例價5折的價格,讓企業(yè)用戶優(yōu)先、實惠地率先體驗到了“滿血版”的最新模型。
正是因為開放,才帶來了正向的拉動效應。數(shù)據(jù)顯示,模型上線首日,已有超1.5萬家客戶通過千帆平臺進行模型調用。
更深度的開放體現(xiàn)在,百度敢于將自身核心業(yè)務和重點業(yè)務與DeepSeek做探索融合。DeepSeek的推理功能驚艷,但本質上還是底座模型,缺乏使用功能的場景。而百度的搜索和智能體就是最佳的“練兵場”。
有人誤以為,有了DeepSeek-R1就能打敗所有的大模型。但實際上,DeepSeek-R1也有自身的局限性,快速接入推理功能的意義在于,跳過重復“造輪子”,減少無謂的浪費,優(yōu)先讓模型在場景中跑起來,也讓更多用戶成為模型測試員。
從目前來看,DeepSeek的誕生,并沒有讓閉源大模型躺平,反而刺激了行業(yè)對自身的反思,從而加速模型升級和新產(chǎn)品推出。
卷模型性能、性價比正在成為行業(yè)主要趨勢。OpenAI首席執(zhí)行官Sam Altman發(fā)布消息稱,GPT-4.5、GPT-5即將陸續(xù)發(fā)布,免費版ChatGPT將在標準智能設置下無限制使用GPT-5進行對話。
文心大模型自身的深度搜索功能已經(jīng)上線,在其推理功能基礎上,還同時具備更強大的思考規(guī)劃和工具調用能力,可為用戶提供專家級內容回復,并處理多場景任務,實現(xiàn)多模態(tài)輸入與輸出。
當DeepSeek爆火后,還是有很多人持觀望狀態(tài),原因在于不知道推理模型能具體在哪些場景產(chǎn)生明顯的提效。目前逐漸清晰的是,“推理大模型+搜索”將帶來1+1大于2的效果。
DeepSeek-R1模型以“思維鏈”功能著稱,可清晰展示問題解決的邏輯過程,回答問題深度大大增強。但自從其上線以來,就存在幻覺問題。百度搜索的龐大搜索生態(tài)和RAG(檢索增強生成)技術,對DeepSeek-R1是一個有效的補充。
RAG的概念其實并不復雜。簡單來說,就是讓大模型在執(zhí)行生成之前參考或引用某些數(shù)據(jù),而這些數(shù)據(jù)通常并不在該大模型的訓練數(shù)據(jù)集內,屬于專有或私有數(shù)據(jù)。百度的RAG可通過引用外部知識有效減少生成內容出現(xiàn)事實性錯誤的問題。再加上百度實時和全面的搜索生態(tài)加持,整個推理的過程就做到了,拿著參考案例和解題思路作答的效果。
在原有基礎上,此次百度搜索還接入了文心一言的深度搜索新功能,搜索的深度廣度和工具調用上了強化“推理”。具體體現(xiàn)在,推理的背后都藏著一個“專家”為用戶提供復雜問題和查詢的解答。該“專家”起初就會對“搜”這個動作去分類,搜專業(yè)問題、熱點還是寫代碼,而后會根據(jù)搜索目的確定搜索路徑和分析呈現(xiàn)方式。通過真實模擬人的思考步驟和過程,來實現(xiàn)解決問題的目標。
此外,文心一言深度搜索功能還提供了多項工具調用,包含了高級聯(lián)網(wǎng)、文檔問答、圖片理解、iRAG等功能,以此彌補了DeepSeek-R1單模態(tài)的缺陷。
例如,當用戶上傳了兩張圖片,采用“文心大模型4.0工具版”識別圖片信息并且比較分析時。它會自動選擇調用圖片理解、高級聯(lián)網(wǎng)、代碼解釋器等工具,模擬人的思考過程,先分析意圖,還原分析路徑的過程中調取合適的工具,最后以圖表的方式直觀呈現(xiàn)異同。
如果想根據(jù)原有的照片風格生成類似的圖片,就可以調用百度獨有的iRAG(image based RAG),檢索增強的文生圖技術。將百度搜索的億級圖片資源跟強大的基礎模型能力相結合,就可以生成各種超真實的圖片,整體效果遠遠超過文生圖原生系統(tǒng),去掉了AI味兒,而且創(chuàng)作成本接近于0。
去年,各個玩家都在角逐AI應用第一的寶座,僅憑投流推廣,還是無法達到一款超級應用的水平?,F(xiàn)在,接入DeepSeek推理模型,全新的模型能力和原有的場景、用戶相結合。一夜之間,就冒出了多個超大用戶量級別的AI應用產(chǎn)品。
百度App月活7.04億,推理和搜索能力升級后,讓廣泛的用戶瞬間進入了AI搜索新時代。
此外,百家號有1100萬內容創(chuàng)作者,百度文心智能體平臺開發(fā)者突破80萬。
生態(tài)的優(yōu)勢將逐漸顯。一方面,百度搜索的開放性使其能整合全網(wǎng)信息,結合DeepSeek的推理能力與文心大模型的多模態(tài)處理能力,覆蓋更廣泛的用戶需求場景;另一發(fā)面,通過智能體平臺吸引開發(fā)者共創(chuàng)工具,形成“技術+開發(fā)者+場景”多輪驅動的良性生態(tài)。
百度搜索已經(jīng)集齊技術、生態(tài)、場景的王牌,接下來將引領搜索的新變革。
OpenAI的首席執(zhí)行官Sam Altman認為,正是因為技術曲線發(fā)展到了一個新的節(jié)點,所以各方競爭之下大模型效率正在加速提升。
百度大模型和搜索能夠迅速調轉方向,加入到世界的潮流中,正是源于技術與變革的底氣。大模型和相關產(chǎn)品的降價只是表現(xiàn),歸根到底源于背后訓練成本和推理成本的降低。
近期,百度智能云成功點亮昆侖芯三代萬卡集群,這也是國內首個正式點亮的自研萬卡集群。據(jù)悉,百度智能云將進一步點亮三萬卡集群。
大規(guī)模集群的優(yōu)勢在于,可以通過任務并行調度、彈性算力管理等方式,提高計算資源利用率,避免算力閑置,提高單任務的計算效率,降低整體算力成本。其昆侖芯在性能上表現(xiàn)卓越,能夠在更少的計算資源下運行大規(guī)模模型(如DeepSeek-V3/R1)。
百舸平臺實現(xiàn)大規(guī)模集群的高效部署管理。為了解決大模型訓練時高通信帶寬的需求,百度建設了超大規(guī)模HPN高性能網(wǎng)絡,通過優(yōu)化的擁塞控制算法、集合通信算法策略,提升了通信效率,將帶寬有效性提升到90%以上。
同時,萬卡集群的能耗極高,常規(guī)的散熱方案能耗可達十兆瓦或更高,這將提升企業(yè)進行模型訓練的電力成本。為此,百舸采用了創(chuàng)新性散熱方案,可以降低能耗,進一步降低模型訓練成本。
為了提升GPU的有效利用率,百舸優(yōu)化并完善模型的分布式訓練策略,通過高效并行化任務切分策略,將訓練主流開源模型的集群MFU提升至58%。
為了保證大規(guī)模集群執(zhí)行訓練任務的穩(wěn)定性,百度自研的BCCL(百度集合通信庫),能夠快速定位故障同時提供自動化的容錯能力,重新調度任務到健康節(jié)點,繼續(xù)完成訓練。目前已經(jīng)將故障恢復時間從小時級降低到分鐘級,保障集群有效訓練率達到98%。
除了訓練成本,現(xiàn)階段,訓練成本下降才是更主要的因素。有分析人士認為,此次文心一言全面功能開放,背后最大的原因之一就是推理成本不斷降低。
根據(jù)其分析,百度在模型推理部署方面有比較大的優(yōu)勢,尤其是在飛槳深度學習框架的支持下,其中并行推理、量化推理等都是飛槳在大模型推理上的自研技術。飛槳和文心的聯(lián)合優(yōu)化可以實現(xiàn)推理性能提升,推理成本降低。
從技術發(fā)展曲線來看,大模型推理和AI成本一直在下降。
以GPT為例,2023年GPT-4的token成本為36美元/百萬token,到了2024年中期GPT-4o成本下降為了4美元/百萬token,在此期間每個token價格下降了約150倍,摩爾定律以每18個月性能翻倍的速度改變了世界。
“過去,我們談論摩爾定律時,每18個月,性能水平或價格都會減半。但是今天,當我們談論大語言模型時,增加的成本基本上降低了,可以在12個月內降低90%以上”,百度CEO李彥宏在阿聯(lián)酋迪拜出席“世界政府峰會”說道。
開源、普惠、人人都用得上AI,也許已經(jīng)在路上了。
本文為作者獨立觀點,不代表鳥哥筆記立場,未經(jīng)允許不得轉載。
《鳥哥筆記版權及免責申明》 如對文章、圖片、字體等版權有疑問,請點擊 反饋舉報
我們致力于提供一個高質量內容的交流平臺。為落實國家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評論自律管理,為了保護用戶創(chuàng)造的內容、維護開放、真實、專業(yè)的平臺氛圍,我們團隊將依據(jù)本公約中的條款對注冊用戶和發(fā)布在本平臺的內容進行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質內容,同時也將采取必要措施管理違法、侵權或有其他不良影響的網(wǎng)絡信息。
一、根據(jù)《網(wǎng)絡信息內容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
1)反對憲法所確定的基本原則;
2)危害國家安全,泄露國家秘密,顛覆國家政權,破壞國家統(tǒng)一,損害國家榮譽和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
5)煽動民族仇恨、民族歧視,破壞民族團結;
6)破壞國家宗教政策,宣揚邪教和封建迷信;
7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動非法集會、結社、游行、示威、聚眾擾亂社會秩序;
10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權益;
11)通過網(wǎng)絡以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進行網(wǎng)絡欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內容;
2. 不友善:不尊重用戶及其所貢獻內容的信息或行為。主要表現(xiàn)為:
1)輕蔑:貶低、輕視他人及其勞動成果;
2)誹謗:捏造、散布虛假事實,損害他人名譽;
3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進行揭露或描述,以此來激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應,蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
6)謾罵:以不文明的語言對他人進行負面評價;
7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網(wǎng)站秩序的內容,或進行相關行為。主要表現(xiàn)為:
1)多次發(fā)布包含售賣產(chǎn)品、提供服務、宣傳推廣內容的垃圾廣告。包括但不限于以下幾種形式:
2)單個帳號多次發(fā)布包含垃圾廣告的內容;
3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內容;
4)多次發(fā)布包含欺騙性外鏈的內容,如未注明的淘寶客鏈接、跳轉網(wǎng)站等,誘騙用戶點擊鏈接
5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內容獲取搜索引擎中的不正當曝光;
6)購買或出售帳號之間虛假地互動,發(fā)布干擾網(wǎng)站秩序的推廣內容及相關交易。
7)發(fā)布包含欺騙性的惡意營銷內容,如通過偽造經(jīng)歷、冒充他人等方式進行惡意營銷;
8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內容審核的廣告內容。
4. 色情低俗信息,主要表現(xiàn)為:
1)包含自己或他人性經(jīng)驗的細節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內容;
4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚低俗、庸俗、媚俗內容。
5. 不實信息,主要表現(xiàn)為:
1)可能存在事實性錯誤或者造謠等內容;
2)存在事實夸大、偽造虛假經(jīng)歷等誤導他人的內容;
3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構或個人存在關聯(lián)。
6. 傳播封建迷信,主要表現(xiàn)為:
1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治?。?br /> 2)求推薦算命看相大師;
3)針對具體風水等問題進行求助或咨詢;
4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;
7. 文章標題黨,主要表現(xiàn)為:
1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來誘導用戶;
2)內容與標題之間存在嚴重不實或者原意扭曲;
3)使用夸張標題,內容與標題嚴重不符的。
8.「飯圈」亂象行為,主要表現(xiàn)為:
1)誘導未成年人應援集資、高額消費、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
4)以號召粉絲、雇用網(wǎng)絡水軍、「養(yǎng)號」形式刷量控評等行為
5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內容,主要表現(xiàn)為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導未成年人不良嗜好影響未成年人身心健康的;
2)不當評述自然災害、重大事故等災難的;
3)美化、粉飾侵略戰(zhàn)爭行為的;
4)法律、行政法規(guī)禁止,或可能對網(wǎng)絡生態(tài)造成不良影響的其他內容。
二、違規(guī)處罰
本網(wǎng)站通過主動發(fā)現(xiàn)和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內容質量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當一個用戶發(fā)布違規(guī)內容時,本網(wǎng)站將依據(jù)相關用戶違規(guī)情節(jié)嚴重程度,對帳號進行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內容時,本網(wǎng)站將加重處罰。
三、申訴
隨著平臺管理經(jīng)驗的不斷豐富,本網(wǎng)站出于維護本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網(wǎng)站進行反饋。
(規(guī)則的最終解釋權歸屬本網(wǎng)站所有)