很可惜 T 。T 您現(xiàn)在還不是作者身份,不能自主發(fā)稿哦~
如有投稿需求,請(qǐng)把文章發(fā)送到郵箱tougao@appcpx.com,一經(jīng)錄用會(huì)有專(zhuān)人和您聯(lián)系
咨詢(xún)?nèi)绾纬蔀榇河鹱髡哒?qǐng)聯(lián)系:鳥(niǎo)哥筆記小羽毛(ngbjxym)
人腦,是一個(gè)復(fù)雜且高度優(yōu)化的“大模型”。
很多朋友問(wèn)我,怎樣才能用好大模型?我說(shuō)你把人腦也當(dāng)做一種大模型(雖然大模型本身就是在模仿人腦的運(yùn)作原理),平時(shí)你是如何記憶、理解、思考和輸出的,那你就會(huì)對(duì)大模型的運(yùn)作機(jī)制了如指掌。
我把大語(yǔ)言模型當(dāng)成我的外掛系統(tǒng):
一是它的無(wú)限知識(shí)庫(kù),基于它數(shù)據(jù)庫(kù)的無(wú)限性,彌補(bǔ)我知識(shí)獲取的有限性。
二是它的超強(qiáng)計(jì)算力,調(diào)動(dòng)各個(gè)板塊知識(shí)的算力無(wú)限性,解決我精力有限的問(wèn)題。
*這里講的大模型專(zhuān)指使用大量文本數(shù)據(jù)訓(xùn)練的大語(yǔ)言模型(LLM,Large Language Model)。
大腦是有保護(hù)機(jī)制的,一旦用腦過(guò)度超出負(fù)荷,就會(huì)開(kāi)始頭疼宕機(jī)。
有了大語(yǔ)言模型,就像是鋼鐵俠有了賈維斯??苹闷倪壿嬙谟趶拈L(zhǎng)期角度,預(yù)測(cè)未來(lái)人的可能性,以及人與科技的關(guān)系。
人的天花板不是AI的天花板,AI的天花板更不是人的天花板,雙方配合才能突破天花板。
很多人把智庫(kù)系統(tǒng)當(dāng)成搜索工具,當(dāng)大模型當(dāng)成小助手,這樣的話(huà)可就真的大材小用了。
一個(gè)懂行業(yè)、懂領(lǐng)域、懂大語(yǔ)言模型的人,如果再利用好大語(yǔ)言模型這個(gè)全球級(jí)知識(shí)庫(kù)和超級(jí)計(jì)算機(jī)運(yùn)算能力,可想而知天花板有多高。
我們完全可以踩在巨人的肩上,拾級(jí)而上。
大模型是我的庫(kù),是我的外掛超級(jí)算力系統(tǒng),是我隨意可以克隆出來(lái)的巨擘,細(xì)分領(lǐng)域?qū)<摇V灰腋罄械哪芰υ浇?,我的行業(yè)理解越深,領(lǐng)域研究越深,執(zhí)行能力越強(qiáng),我就可以在這個(gè)基礎(chǔ)上做指數(shù)級(jí)增長(zhǎng)。
大語(yǔ)言模型涉及神經(jīng)科學(xué)、數(shù)學(xué)、計(jì)算機(jī)科學(xué)、數(shù)據(jù)科學(xué)、語(yǔ)言學(xué)等等,這是它存在的底色。
大語(yǔ)言模型的本質(zhì)并非文字本身,要把文字理解成特定的程序代碼。你每次的問(wèn)問(wèn)題,都是一次敲代碼。它每次的答復(fù)你,也是基于對(duì)于代碼的理解。
字詞就是一個(gè)個(gè)代碼,關(guān)系也是一段代碼,而非像人的神經(jīng)元理解一樣,可以做到直接調(diào)取它的語(yǔ)義。你可以把提示詞、知識(shí)庫(kù)、訓(xùn)練當(dāng)成是代碼,而非文案的邏輯。
接下來(lái)我嘗試用通俗的大白話(huà)進(jìn)行理解,希望對(duì)你有用。
大語(yǔ)言模型的知識(shí)庫(kù)基于機(jī)器掃描和處理,人腦的知識(shí)庫(kù)基于過(guò)往工作和生活的日積月累。
1. 收集信息
大語(yǔ)言模型相當(dāng)于是一個(gè)超級(jí)知識(shí)庫(kù),把所有公開(kāi)半公開(kāi)在書(shū)籍、論文、期刊、文章、網(wǎng)頁(yè)都掃描了一遍。
在量的層面直接吊打人腦,但人腦掌握了核心的非公開(kāi)資料,一是本身存在于腦子里,二是這些資料本身未公開(kāi)出來(lái)。人腦是定制化的,是更深度的,是非范式的。
2. 存儲(chǔ)信息
大語(yǔ)言模型記住并非是語(yǔ)言文字本身,而是將文字(字詞為字段)轉(zhuǎn)換成一個(gè)個(gè)對(duì)應(yīng)的數(shù)字代碼(數(shù)學(xué)的邏輯),并通過(guò)計(jì)算這些向量之間的距離來(lái)衡量語(yǔ)義的相似性(你可以理解為大語(yǔ)言模型里的知識(shí)就像無(wú)數(shù)個(gè)小格子,通過(guò)數(shù)學(xué)和概率的邏輯來(lái)調(diào)動(dòng)這些小格子,以及它們的排列組合,連貫起來(lái))。
這里要注意,它是基于龐大數(shù)據(jù)庫(kù)都認(rèn)可的普適性語(yǔ)義理解和常規(guī)式邏輯關(guān)系。
這種存儲(chǔ)方式首先解決了成本和效率的問(wèn)題,更少的存儲(chǔ)空間和更少的并行算力調(diào)取成本,使得模型可以存儲(chǔ)足夠的信息量和快速檢索和處理大量文本數(shù)據(jù)。
當(dāng)然,這種記憶方式?jīng)Q定了很難像單個(gè)人具備的關(guān)聯(lián)性和情境性,你可以把人工比喻成更專(zhuān)業(yè)的小模型和在這個(gè)小模型里更強(qiáng)的算力運(yùn)轉(zhuǎn)。在大模型的概率統(tǒng)計(jì)生成之上,帶有了自己的經(jīng)驗(yàn)和情感,而這兩個(gè)恰恰是更高維的信息庫(kù)。
人對(duì)信息寬度記憶有限,但對(duì)記憶的豐富度更強(qiáng),加入了感官理解。
因?yàn)槊看螌W(xué)習(xí)都會(huì)用過(guò)往的框架進(jìn)行理解,調(diào)動(dòng)的不是單向的,還有實(shí)踐過(guò)程中得到的,這些是基于定制化的,沒(méi)有反映到公開(kāi)的文本環(huán)境中,而是存儲(chǔ)在自己的大腦。
人腦是面和體的吸收,而非線(xiàn)性,是高維多模態(tài),還通過(guò)圖像、聲音甚至肢體語(yǔ)言形成認(rèn)知。人腦是不斷在迭代的,人腦的智能化是用神經(jīng)元,其實(shí)是更高級(jí)的,當(dāng)然,這得是一個(gè)“思考”的人。因?yàn)樗伎嫉倪^(guò)程,也是訓(xùn)練的過(guò)程,也是迭代的邏輯。
如果把人腦和大語(yǔ)言模型的優(yōu)勢(shì)結(jié)合起來(lái),配合起來(lái),可想天花板有多高。
人不是簡(jiǎn)單地存儲(chǔ)數(shù)據(jù)、單純調(diào)用里面的小格子。神經(jīng)元存儲(chǔ)的邏輯在于,建立了一套更高維更立體的關(guān)系,這里面是加入了我們的理解。加入了我們的記憶(和消化),這些記憶是高度情境化,是強(qiáng)大關(guān)聯(lián)性性的,可以靈活地將不同類(lèi)型的記憶串聯(lián)起來(lái)。
當(dāng)你提問(wèn)時(shí),大語(yǔ)言模型會(huì)先分拆問(wèn)題,將你的問(wèn)題拆解成一個(gè)字詞(字段),并提取上下文信息(狹義上是對(duì)話(huà)窗口,廣義上是智能體的提示詞和知識(shí)庫(kù)),以此來(lái)識(shí)別你想要的答案。
1. 接收信息
比如你問(wèn)“什么是人工智能?”,它其實(shí)是不能直接理解這句話(huà)的意思,因?yàn)樗鎯?chǔ)的邏輯是用數(shù)字向量的形式,而非像人一樣一步到位理解語(yǔ)義。
于是它把你的問(wèn)題分解成最小理解單元,“什么”+“是”+“人工智能”+“?”。
每個(gè)最小理解單元,甚至包括標(biāo)點(diǎn)符號(hào),都會(huì)被轉(zhuǎn)換成一個(gè)個(gè)數(shù)字代碼。你可以理解成這是它才能處理的格式。
所以我們的問(wèn)題一定要足夠簡(jiǎn)單,能刪的部分全部都要?jiǎng)h,保留最核心的字段。
2. 理解信息
接下來(lái)它的注意力機(jī)制就會(huì)啟動(dòng),就是找到你這句話(huà)的關(guān)鍵詞,也就是它理解的最重要的數(shù)字代碼。
在這個(gè)問(wèn)題中顯然核心詞是“人工智能”,大模型會(huì)給到這個(gè)詞更高的權(quán)重,以此來(lái)回答針對(duì)性的問(wèn)題。
同時(shí)它還會(huì)關(guān)注周邊的影響代碼,“什么”表示疑問(wèn),“是”表示定義問(wèn)題。
大語(yǔ)言模型記住的語(yǔ)言模型,是字詞句之間的遠(yuǎn)近關(guān)系,從而決定了輸出的概率。
先是信息搜索,在知識(shí)庫(kù)的一個(gè)個(gè)小格子之中找到和“人工智能”相關(guān)的信息。
然后是信息關(guān)聯(lián),將掃描過(guò)不同來(lái)源的信息做關(guān)聯(lián),類(lèi)似與東拼西湊排列組合。
最后是信息組織,根據(jù)你問(wèn)問(wèn)題的方式,來(lái)決定自己的表達(dá)方式,確?;卮鸬慕Y(jié)構(gòu)和邏輯是你想要的。
大語(yǔ)言模型的思考處理是依托于普適化的模式識(shí)別和概率推理。
人腦的思考一方面是自己過(guò)往形成雙重決策系統(tǒng),一是理性邏輯系統(tǒng),二是感性的直覺(jué)經(jīng)驗(yàn)系統(tǒng)。當(dāng)然,這套系統(tǒng)不同人千差萬(wàn)別,上限很高,下限也很低。
這是模仿人腦組織語(yǔ)言表達(dá)的過(guò)程。在輸出回答層面,主要分為五大要點(diǎn):定輸出框架、定專(zhuān)業(yè)程度、定詳細(xì)程度、定表達(dá)風(fēng)格、連貫性表達(dá)。
1. 定輸出框架
即使你就是簡(jiǎn)單問(wèn)“什么是人工智能?”大模型也可能會(huì)做延展,不僅講它的定義,還有技術(shù)構(gòu)成、發(fā)展階段 、應(yīng)用領(lǐng)域、挑戰(zhàn)與風(fēng)險(xiǎn)等。
因?yàn)樵谒乃伎歼^(guò)程中,后面幾個(gè)部分和定義這個(gè)格子關(guān)系很近,需要對(duì)這幾個(gè)部分做產(chǎn)出,才能更全面理解定義。
但人腦就不一樣,很清晰你知道你具體要的是什么,你就是簡(jiǎn)單要一個(gè)定義,我根本不需要進(jìn)行贅述,如果你要問(wèn)其他的,我才會(huì)回答。因?yàn)槲抑滥愕恼Z(yǔ)義意圖,也就是更理解人本身。
2. 定專(zhuān)業(yè)程度
即使同樣的觀(guān)點(diǎn),也有不同的內(nèi)容輸出形式。根據(jù)你的場(chǎng)景,看你需要小白級(jí)、入門(mén)級(jí),還是專(zhuān)業(yè)級(jí)的回答。
這個(gè)時(shí)候?qū)Ψ秸{(diào)動(dòng)的就是它另外的小格子,確定用什么樣的方式能讓你更理解。
3. 定詳細(xì)程度
你可以明確告訴大語(yǔ)言模型的詳細(xì)程度,是細(xì)化還是詳述,還可以具體到多少個(gè)字、字?jǐn)?shù)區(qū)間、多少字以上。
4. 定表達(dá)風(fēng)格
就像寫(xiě)文章一樣,不同的文章有不同的寫(xiě)作風(fēng)格。是專(zhuān)業(yè)級(jí)還是大白話(huà),是客觀(guān)還是主觀(guān)。
5. 連貫性表達(dá)
最后,模型會(huì)檢查自己的回答,確?;卮鸬倪壿嬓院驼w性,做到重點(diǎn)突出、前呼后應(yīng)、層次分明,讓人聽(tīng)得明白。如果不連貫,哪怕每句話(huà)都沒(méi)問(wèn)題,但結(jié)合起來(lái)就會(huì)顯得非常亂。
開(kāi)始很重要,重要的是先開(kāi)始。只有在高強(qiáng)度使用的過(guò)程中,才能找到更多的可能性。
用好AI 的本質(zhì)是理解人,當(dāng)你把人腦看作大模型,并不斷反思自身學(xué)習(xí)與思考的方式時(shí),便能更好地運(yùn)用 AI。
本文為作者獨(dú)立觀(guān)點(diǎn),不代表鳥(niǎo)哥筆記立場(chǎng),未經(jīng)允許不得轉(zhuǎn)載。
《鳥(niǎo)哥筆記版權(quán)及免責(zé)申明》 如對(duì)文章、圖片、字體等版權(quán)有疑問(wèn),請(qǐng)點(diǎn)擊 反饋舉報(bào)
我們致力于提供一個(gè)高質(zhì)量?jī)?nèi)容的交流平臺(tái)。為落實(shí)國(guó)家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評(píng)論自律管理,為了保護(hù)用戶(hù)創(chuàng)造的內(nèi)容、維護(hù)開(kāi)放、真實(shí)、專(zhuān)業(yè)的平臺(tái)氛圍,我們團(tuán)隊(duì)將依據(jù)本公約中的條款對(duì)注冊(cè)用戶(hù)和發(fā)布在本平臺(tái)的內(nèi)容進(jìn)行管理。平臺(tái)鼓勵(lì)用戶(hù)創(chuàng)作、發(fā)布優(yōu)質(zhì)內(nèi)容,同時(shí)也將采取必要措施管理違法、侵權(quán)或有其他不良影響的網(wǎng)絡(luò)信息。
一、根據(jù)《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國(guó)未成年人保護(hù)法》等法律法規(guī),對(duì)以下違法、不良信息或存在危害的行為進(jìn)行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
1)反對(duì)憲法所確定的基本原則;
2)危害國(guó)家安全,泄露國(guó)家秘密,顛覆國(guó)家政權(quán),破壞國(guó)家統(tǒng)一,損害國(guó)家榮譽(yù)和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽(yù)、榮譽(yù);
4)宣揚(yáng)恐怖主義、極端主義或者煽動(dòng)實(shí)施恐怖活動(dòng)、極端主義活動(dòng);
5)煽動(dòng)民族仇恨、民族歧視,破壞民族團(tuán)結(jié);
6)破壞國(guó)家宗教政策,宣揚(yáng)邪教和封建迷信;
7)散布謠言,擾亂社會(huì)秩序,破壞社會(huì)穩(wěn)定;
8)宣揚(yáng)淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動(dòng)非法集會(huì)、結(jié)社、游行、示威、聚眾擾亂社會(huì)秩序;
10)侮辱或者誹謗他人,侵害他人名譽(yù)、隱私和其他合法權(quán)益;
11)通過(guò)網(wǎng)絡(luò)以文字、圖片、音視頻等形式,對(duì)未成年人實(shí)施侮辱、誹謗、威脅或者惡意損害未成年人形象進(jìn)行網(wǎng)絡(luò)欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內(nèi)容;
2. 不友善:不尊重用戶(hù)及其所貢獻(xiàn)內(nèi)容的信息或行為。主要表現(xiàn)為:
1)輕蔑:貶低、輕視他人及其勞動(dòng)成果;
2)誹謗:捏造、散布虛假事實(shí),損害他人名譽(yù);
3)嘲諷:以比喻、夸張、侮辱性的手法對(duì)他人或其行為進(jìn)行揭露或描述,以此來(lái)激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對(duì)方對(duì)自己的言論作出回應(yīng),蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對(duì)方難堪;
6)謾罵:以不文明的語(yǔ)言對(duì)他人進(jìn)行負(fù)面評(píng)價(jià);
7)歧視:煽動(dòng)人群歧視、地域歧視等,針對(duì)他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類(lèi)的攻擊;
8)威脅:許諾以不良的后果來(lái)迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶(hù)體驗(yàn)、擾亂本網(wǎng)站秩序的內(nèi)容,或進(jìn)行相關(guān)行為。主要表現(xiàn)為:
1)多次發(fā)布包含售賣(mài)產(chǎn)品、提供服務(wù)、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
2)單個(gè)帳號(hào)多次發(fā)布包含垃圾廣告的內(nèi)容;
3)多個(gè)廣告帳號(hào)互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉(zhuǎn)網(wǎng)站等,誘騙用戶(hù)點(diǎn)擊鏈接
5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當(dāng)曝光;
6)購(gòu)買(mǎi)或出售帳號(hào)之間虛假地互動(dòng),發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關(guān)交易。
7)發(fā)布包含欺騙性的惡意營(yíng)銷(xiāo)內(nèi)容,如通過(guò)偽造經(jīng)歷、冒充他人等方式進(jìn)行惡意營(yíng)銷(xiāo);
8)使用特殊符號(hào)、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。
4. 色情低俗信息,主要表現(xiàn)為:
1)包含自己或他人性經(jīng)驗(yàn)的細(xì)節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話(huà)的低俗內(nèi)容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚(yáng)低俗、庸俗、媚俗內(nèi)容。
5. 不實(shí)信息,主要表現(xiàn)為:
1)可能存在事實(shí)性錯(cuò)誤或者造謠等內(nèi)容;
2)存在事實(shí)夸大、偽造虛假經(jīng)歷等誤導(dǎo)他人的內(nèi)容;
3)偽造身份、冒充他人,通過(guò)頭像、用戶(hù)名等個(gè)人信息暗示自己具有特定身份,或與特定機(jī)構(gòu)或個(gè)人存在關(guān)聯(lián)。
6. 傳播封建迷信,主要表現(xiàn)為:
1)找人算命、測(cè)字、占卜、解夢(mèng)、化解厄運(yùn)、使用迷信方式治??;
2)求推薦算命看相大師;
3)針對(duì)具體風(fēng)水等問(wèn)題進(jìn)行求助或咨詢(xún);
4)問(wèn)自己或他人的八字、六爻、星盤(pán)、手相、面相、五行缺失,包括通過(guò)占卜方法問(wèn)婚姻、前程、運(yùn)勢(shì),東西寵物丟了能不能找回、取名改名等;
7. 文章標(biāo)題黨,主要表現(xiàn)為:
1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來(lái)誘導(dǎo)用戶(hù);
2)內(nèi)容與標(biāo)題之間存在嚴(yán)重不實(shí)或者原意扭曲;
3)使用夸張標(biāo)題,內(nèi)容與標(biāo)題嚴(yán)重不符的。
8.「飯圈」亂象行為,主要表現(xiàn)為:
1)誘導(dǎo)未成年人應(yīng)援集資、高額消費(fèi)、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動(dòng)「飯圈」粉絲攀比炫富、奢靡享樂(lè)等行為
4)以號(hào)召粉絲、雇用網(wǎng)絡(luò)水軍、「養(yǎng)號(hào)」形式刷量控評(píng)等行為
5)通過(guò)「蹭熱點(diǎn)」、制造話(huà)題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會(huì)公德行為、誘導(dǎo)未成年人不良嗜好影響未成年人身心健康的;
2)不當(dāng)評(píng)述自然災(zāi)害、重大事故等災(zāi)難的;
3)美化、粉飾侵略戰(zhàn)爭(zhēng)行為的;
4)法律、行政法規(guī)禁止,或可能對(duì)網(wǎng)絡(luò)生態(tài)造成不良影響的其他內(nèi)容。
二、違規(guī)處罰
本網(wǎng)站通過(guò)主動(dòng)發(fā)現(xiàn)和接受用戶(hù)舉報(bào)兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質(zhì)量、傷害平臺(tái)氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當(dāng)一個(gè)用戶(hù)發(fā)布違規(guī)內(nèi)容時(shí),本網(wǎng)站將依據(jù)相關(guān)用戶(hù)違規(guī)情節(jié)嚴(yán)重程度,對(duì)帳號(hào)進(jìn)行禁言 1 天、7 天、15 天直至永久禁言或封停賬號(hào)的處罰。當(dāng)涉及欺凌未成年人、危害未成年人身心健康、通過(guò)作弊手段注冊(cè)、使用帳號(hào),或者濫用多個(gè)帳號(hào)發(fā)布違規(guī)內(nèi)容時(shí),本網(wǎng)站將加重處罰。
三、申訴
隨著平臺(tái)管理經(jīng)驗(yàn)的不斷豐富,本網(wǎng)站出于維護(hù)本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶(hù)對(duì)本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過(guò)「建議反饋」功能向本網(wǎng)站進(jìn)行反饋。
(規(guī)則的最終解釋權(quán)歸屬本網(wǎng)站所有)