很可惜 T 。T 您現(xiàn)在還不是作者身份,不能自主發(fā)稿哦~
如有投稿需求,請把文章發(fā)送到郵箱tougao@appcpx.com,一經(jīng)錄用會有專人和您聯(lián)系
咨詢?nèi)绾纬蔀榇河鹱髡哒埪?lián)系:鳥哥筆記小羽毛(ngbjxym)
DeepSeek證明了另一條路的可行性
@松果財經(jīng)原創(chuàng)
作者丨半夏
OpenAI 在2月1日正式上線o3-mini系列模型,號稱要推動低成本推理的邊界,并且首次向免費用戶開放了推理模型的權(quán)限,顯然是為了對沖DeepSeek的影響。而與此同時,DeepSeek正處于冰火兩重天之中。
一方面,據(jù)中新社、澎湃新聞、環(huán)球時報等媒體報道,DeepSeek遭遇多方圍剿,美國等國家從數(shù)據(jù)安全、個人信息等方面出發(fā),對DeepSeek進行或明或暗的限制。
此外,奇安信Xlab實驗室監(jiān)測發(fā)現(xiàn),1月30日起,針對DeepSeek的攻擊烈度突然升級,較1月28日暴增上百倍。其中至少有2個僵尸網(wǎng)絡(luò)參與了攻擊。“僵尸網(wǎng)絡(luò)”指的是攻擊者用惡意軟件感染和控制其他設(shè)備,比如電腦,組成設(shè)備網(wǎng)絡(luò),再控制這些設(shè)備進行攻擊。
本次攻擊大約起始于1月初,早期為低強度攻擊,1月27日左右開始升級。到1月30日,有用戶稱,從半夜開始DeepSeek卡頓程度劇增,且需要頻繁退出后重新登錄才能使用。
來自奇安信XLab實驗室的安全專家表示:“僵尸網(wǎng)絡(luò)的加入,標志著職業(yè)打手已經(jīng)開始下場,這說明DeepSeek面對的攻擊方式一直在持續(xù)進化和復(fù)雜化,防御難度不斷增加,網(wǎng)絡(luò)安全形勢愈發(fā)復(fù)雜嚴峻。”
據(jù)鞭牛士報道,DeepSeek周二向美國專利商標局提交了AI聊天機器人應(yīng)用、產(chǎn)品和工具注冊商標申請,但一家總部位于特拉華州的名為Delson Group Inc.的企業(yè)搶先申請了DeepSeek商標,而后面這家公司的創(chuàng)始人Willie Lu和DeepSeek創(chuàng)始人梁文鋒是校友,雙方都畢業(yè)于浙江大學。
另一方面,DeepSeek正在極速改變現(xiàn)有AI應(yīng)用生態(tài),并成功在全球用戶心中留下了深刻印象,尤其是削弱了OpenAI的影響力。因DeepSeek股價大跌的英偉達剛剛推出采用DeepSeek R1 671b的NIM微服務(wù)預(yù)覽版開發(fā)工具;微軟一開始說明正在調(diào)查DeepSeek“以不正當方式獲取OpenAI的數(shù)據(jù)”,但又迅速在Azure上部署了R1模型,且為免費使用。
和DeepSeek遭遇攻擊的新聞放在一起對比,各方心態(tài)十分明顯:
對OpenAI來說,DeepSeek雖然規(guī)模不對等,但卻打了它個措手不及;對微軟等大企業(yè)而言,DeepSeek的開源策略非常符合它們的應(yīng)用需求,它們雖有自己的立場,卻也需要削弱對OpenAI的依賴;對更多AI領(lǐng)域的中小企業(yè)、個人用戶、愛好者來說,DeepSeek宛如用“農(nóng)村包圍城市”的打法解決了算力圍城問題。而對整個行業(yè)來說,DeepSeek公開了一條不同的技術(shù)路線的可行性,即單純利用強化學習(RL)進行自我迭代:
傳統(tǒng)方法的RLHF,也就是基于人類偏好的強化學習,讓人類為AI打分。預(yù)訓練撞墻后,推理變成了模型能力提升的關(guān)鍵路徑。OpenAI在去年第三季度以o1和后來的o3模型都沿著這條路徑探索。但OpenAI并沒有公布技術(shù)細節(jié),而DeepSeek R1開源后,業(yè)界收獲了首個完全公開的模型,也證明了RL路線的潛力。
至于商業(yè)層面,知名分析師郭明錤表示,DeepSeek R1的出現(xiàn),讓兩個趨勢更加值得關(guān)注——一個是Scaling Law放緩后AI算力的優(yōu)化訓練,一個則是被討論得最多的成本問題,Token價格越來越便宜,AI應(yīng)用多元化發(fā)展才會更輕松。這是生成式AI效率突圍期的轉(zhuǎn)折點。
具體來看,DeepSeek把兩個行業(yè)核心問題擺了出來。
第一個是開源即壁壘的思路。OpenAI等公司的閉源路線是一種技術(shù)壁壘,但DeepSeek將核心技術(shù)即時開源,同樣構(gòu)建了一種壁壘。當我用詢問DeepSeek這樣做的好處時,AI生成的回答是:
這種看似激進的決策實則構(gòu)建了雙重優(yōu)勢,既通過開發(fā)者生態(tài)快速建立行業(yè)標準,又借助低價策略擴大市場滲透。這本質(zhì)上是在技術(shù)擴散過程中搶占生態(tài)位,當更多企業(yè)基于其框架開發(fā)應(yīng)用時,底層技術(shù)的價值反而會持續(xù)強化。
事實上,Meta對DeepSeek的反應(yīng)其實最為興奮,因為DeepSeek用另一種方式證明了Meta的開源思路有正確性,而且還提供了非常多的“參考資料”。有媒體日前報道稱Meta在DeepSeek的突破中看到了希望。Meta副總裁Ragavan Srinivasan直言:“我們的開源策略得到了驗證,有更多人能夠獲得推動事物更快發(fā)展的技術(shù),就越好。”
并且,Meta通過社交媒體廣告賺錢,反哺AI開源,而DeepSeek也是背靠幻方量化,有支撐AI發(fā)展的資源。Meta作為唯一一家走開源路線的美國大型公司,其做法體現(xiàn)了防御性,在相對安全的情況下用成熟商業(yè)的資源換取AI發(fā)展。而DeepSeek作為創(chuàng)業(yè)公司,則明顯更加積極。
一位海外用戶對此評論:“托馬斯·弗里德曼2005年的著作《世界是平的》,描述了互聯(lián)網(wǎng)如何在全球范圍內(nèi)傳播知識。我猜中國人學會了如何在我們先進的地方打敗我們。(指用開源競爭閉源)”
另一組評論更加發(fā)人深省,DeepSeek將改進的成果免費帶給了全世界,即便是美國的初創(chuàng)企業(yè)也開啟了下一個階段,這才是技術(shù)普惠的雙贏:“Open means worldwide.”
第二個是AI的發(fā)展效率,DeepSeek選擇了一條差異化的技術(shù)路線——在保持模型參數(shù)規(guī)??煽氐那疤嵯拢ㄟ^動態(tài)調(diào)整計算強度來提升效率。這相當于為AI系統(tǒng)安裝了“智能調(diào)節(jié)器”,使其能夠根據(jù)任務(wù)需求自動匹配運算資源。這種思路打破了“參數(shù)越多越好”的固有認知,證明通過算法優(yōu)化完全可以在不增加硬件投入的情況下實現(xiàn)性能突破。
需要注意,這并沒有否認先進大規(guī)模GPU和優(yōu)質(zhì)數(shù)據(jù)的價值,但對于廣大缺乏資源的開發(fā)者,以及想要跳出生成式AI既有缺陷的玩家來說,這一次嘗試的意義很大。
之前,OpenAI因為高昂的定價被市場詬病,SemiAnalysis在前兩天刊發(fā)的DeepSeek事件分析報告中指出:“R1 并非從技術(shù)層面削弱了 o1 的進展,而是以更低的價格實現(xiàn)了相當?shù)哪芰Α?rdquo;OpenAI之所以能定高價,是因為它們一開始基于最前沿的技術(shù)定價,然后享受溢價,而R1達到了類似的能力水平之后,OpenAI就不得不做出反應(yīng)。后續(xù)能力定價依然會是關(guān)鍵因素,每一代能追趕上領(lǐng)先能力的參與者越來越少,同時一旦追趕成功,帶來的影響也就越大。
這也是影響到二級市場投資的主要因素,也就是郭明錤提到的,過去這兩年,市場投資AI產(chǎn)業(yè)鏈是Scaling Law對服務(wù)器和GPU的需求,然后推動出貨量增長。DeepSeek則證明,Scaling Law放緩之后,關(guān)注其他提升模型效益的路徑,也是投資機會。
因為AI的成本足夠低,相關(guān)的應(yīng)用才會獲得更大的試錯空間。在AI成本很高的時候,應(yīng)用的收入增速可能還趕不上成本的增速,也就沒辦法形成可行的盈利模式。而隨著成本下降跌破一個又一個關(guān)口,算法其實“代償”了之前必需的一部分成本,所以真正的創(chuàng)新爆發(fā)必定會延伸到應(yīng)用層。
而這又延伸出兩條思考:第一,AI應(yīng)用需求越多,是否最終依然會提升對算力的需求?算力池總量擴大,依然是潛在的邏輯。第二,這些相對便宜的AI產(chǎn)品有機會促進端側(cè)AI和Agent的發(fā)展,怎么兌現(xiàn)還有待探索,因為單純便宜還不能解決AI落地的所有問題。
OpenAI在1月23日發(fā)布了智能體Operator,也就是Agent,可以完成訂餐、電商購物之類的任務(wù),但后續(xù)熱度很快被DeepSeek相關(guān)話題蓋過。OpenAI雖然認為這種日常任務(wù)自動化蘊藏巨大機遇,但Operator功能被放在每個月需要200美元的ChatGPT Pro訂閱中,顯然并不覺得現(xiàn)在有低價推動Agent普及的必要。
但如果更低成本的AI得到進一步開發(fā),相關(guān)的應(yīng)用必然就會加速。并且DeepSeek作為貫穿整個農(nóng)歷新年的全球性熱點,因其語言方面的能力突出,特別容易被普通用戶發(fā)現(xiàn)亮點,又成功席卷所有平臺的頭條,所以對之前沒有使用過AI產(chǎn)品的用戶的吸引力,也是獨領(lǐng)風騷。
2月1日,硅基流動和華為云團隊合作,聯(lián)合首發(fā)并上線基于華為云昇騰云服務(wù)的DeepSeekR1/V3推理服務(wù)。隨后硅基流動 CEO & 創(chuàng)始人袁進輝在朋友圈表示,DeepSeek需求量超出預(yù)期,只能限流。
總之,無論是在使用體驗上,還是技術(shù)路線上,亦或者行業(yè)發(fā)展水平上,DeepSeek都做出了令人意外的貢獻。它所遇到的一切,也就不難理解。
本文為作者獨立觀點,不代表鳥哥筆記立場,未經(jīng)允許不得轉(zhuǎn)載。
《鳥哥筆記版權(quán)及免責申明》 如對文章、圖片、字體等版權(quán)有疑問,請點擊 反饋舉報
我們致力于提供一個高質(zhì)量內(nèi)容的交流平臺。為落實國家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評論自律管理,為了保護用戶創(chuàng)造的內(nèi)容、維護開放、真實、專業(yè)的平臺氛圍,我們團隊將依據(jù)本公約中的條款對注冊用戶和發(fā)布在本平臺的內(nèi)容進行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質(zhì)內(nèi)容,同時也將采取必要措施管理違法、侵權(quán)或有其他不良影響的網(wǎng)絡(luò)信息。
一、根據(jù)《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
1)反對憲法所確定的基本原則;
2)危害國家安全,泄露國家秘密,顛覆國家政權(quán),破壞國家統(tǒng)一,損害國家榮譽和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
5)煽動民族仇恨、民族歧視,破壞民族團結(jié);
6)破壞國家宗教政策,宣揚邪教和封建迷信;
7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動非法集會、結(jié)社、游行、示威、聚眾擾亂社會秩序;
10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權(quán)益;
11)通過網(wǎng)絡(luò)以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進行網(wǎng)絡(luò)欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內(nèi)容;
2. 不友善:不尊重用戶及其所貢獻內(nèi)容的信息或行為。主要表現(xiàn)為:
1)輕蔑:貶低、輕視他人及其勞動成果;
2)誹謗:捏造、散布虛假事實,損害他人名譽;
3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進行揭露或描述,以此來激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應(yīng),蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
6)謾罵:以不文明的語言對他人進行負面評價;
7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網(wǎng)站秩序的內(nèi)容,或進行相關(guān)行為。主要表現(xiàn)為:
1)多次發(fā)布包含售賣產(chǎn)品、提供服務(wù)、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
2)單個帳號多次發(fā)布包含垃圾廣告的內(nèi)容;
3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉(zhuǎn)網(wǎng)站等,誘騙用戶點擊鏈接
5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當曝光;
6)購買或出售帳號之間虛假地互動,發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關(guān)交易。
7)發(fā)布包含欺騙性的惡意營銷內(nèi)容,如通過偽造經(jīng)歷、冒充他人等方式進行惡意營銷;
8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。
4. 色情低俗信息,主要表現(xiàn)為:
1)包含自己或他人性經(jīng)驗的細節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內(nèi)容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚低俗、庸俗、媚俗內(nèi)容。
5. 不實信息,主要表現(xiàn)為:
1)可能存在事實性錯誤或者造謠等內(nèi)容;
2)存在事實夸大、偽造虛假經(jīng)歷等誤導他人的內(nèi)容;
3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構(gòu)或個人存在關(guān)聯(lián)。
6. 傳播封建迷信,主要表現(xiàn)為:
1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治病;
2)求推薦算命看相大師;
3)針對具體風水等問題進行求助或咨詢;
4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;
7. 文章標題黨,主要表現(xiàn)為:
1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來誘導用戶;
2)內(nèi)容與標題之間存在嚴重不實或者原意扭曲;
3)使用夸張標題,內(nèi)容與標題嚴重不符的。
8.「飯圈」亂象行為,主要表現(xiàn)為:
1)誘導未成年人應(yīng)援集資、高額消費、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
4)以號召粉絲、雇用網(wǎng)絡(luò)水軍、「養(yǎng)號」形式刷量控評等行為
5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導未成年人不良嗜好影響未成年人身心健康的;
2)不當評述自然災(zāi)害、重大事故等災(zāi)難的;
3)美化、粉飾侵略戰(zhàn)爭行為的;
4)法律、行政法規(guī)禁止,或可能對網(wǎng)絡(luò)生態(tài)造成不良影響的其他內(nèi)容。
二、違規(guī)處罰
本網(wǎng)站通過主動發(fā)現(xiàn)和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質(zhì)量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當一個用戶發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將依據(jù)相關(guān)用戶違規(guī)情節(jié)嚴重程度,對帳號進行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將加重處罰。
三、申訴
隨著平臺管理經(jīng)驗的不斷豐富,本網(wǎng)站出于維護本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網(wǎng)站進行反饋。
(規(guī)則的最終解釋權(quán)歸屬本網(wǎng)站所有)