chinesefreesexvideos高潮,欧美极品少妇性运交,久久久国产一区二区三区,99久久婷婷国产综合精品,成人国产一区二区三区

APP推廣合作
聯(lián)系“鳥哥筆記小喬”
AI大模型折疊:數(shù)據(jù)標(biāo)注“民工”月入不過5000!
2023-10-09 10:55:09

來源|Tech星球

鄭雯至今覺得記得幾個月的下午,那天,她一個小時就賺了2毛錢。她畢業(yè)于湖南的一所??茖W(xué)校,是一名大模型數(shù)據(jù)標(biāo)注師,每天的工作并不復(fù)雜——給自己領(lǐng)取的原始數(shù)據(jù)(如圖像、視頻、文本等)添加標(biāo)簽。

但大模型對于數(shù)據(jù)的質(zhì)量要求很高,那天當(dāng)時一張圖片被要求反復(fù)修改了8次才通過,整個修改過程花費了一個1小時。也就是說,她這一個小時只賺了2毛錢,而正常情況下可以賺到12塊,可以拉600個框。“錢并不好賺”,她反復(fù)強(qiáng)調(diào)。

這幾乎是所有數(shù)據(jù)標(biāo)注從業(yè)者的共識。數(shù)據(jù)標(biāo)注的一端承載著從業(yè)者們不足5000元的月薪,他們?nèi)缥浵佇郾銟?gòu)建起大模型的基石。而另一端則是互聯(lián)網(wǎng)大廠們的AI夢想,他們希望借此超越Chat GPT 4。

數(shù)據(jù)標(biāo)注采用最原始的計件制算工資,并不存在職場上的勾心斗角。唯一的苦惱這份過于枯燥的工作,讓他們中的大部分很難堅持完3個月。并且,幾乎所有人都告訴Tech星球,你最好別去。

可他們不知道的是,要不了多久,他們中的大部分可能會失去這份枯燥的工作。因為,那些簡單的數(shù)據(jù)標(biāo)注將會被AI取代。

從5毛到4分,價格暴跌

林雙在2017年賺到了一筆“快錢”:15天6000多元。對于??飘厴I(yè)的林雙來說,這個收入著實可觀。那是人們對AI期望爆棚的時候,幾乎沒有人懷疑過它的未來,所有的投資機(jī)構(gòu)都堅信這里可以誕生十億、百億甚至千億規(guī)模的企業(yè)。

幾乎所有AI技術(shù)的背后都是算法、算力、算據(jù)的競爭,龐大的數(shù)據(jù)是技術(shù)優(yōu)劣的底層。背景光鮮的程序員們坐在“北上廣”的辦公室里,通過代碼迭代算法描繪AI藍(lán)圖,而大專生、寶媽等在三四線城市的格子間處理龐大數(shù)據(jù)包中的圖片、文字、語音等。

ChatGPT也不例外。一位百度文心一言項目組的員工稱,大模型本身并沒有什么新技術(shù),也沒有太高的技術(shù)壁壘,關(guān)鍵的問題是算力壁壘形成的參數(shù)壁壘。

大模型時代的數(shù)據(jù)標(biāo)注員和以前的也并沒有特別大區(qū)別,為數(shù)不多的差距可能是更加舒適的辦公環(huán)境和對標(biāo)注質(zhì)量的更高要求。一位數(shù)據(jù)標(biāo)注的從業(yè)者向Tech星球介紹,一般剛剛?cè)胄袝r,他們會組建一個10人左右的團(tuán)隊,這其中有一個人承擔(dān)質(zhì)檢工作,如果不合格,就要員工打回去重做。而數(shù)據(jù)的質(zhì)量則決定著大模型的優(yōu)劣。

數(shù)據(jù)民工們也并不關(guān)心,AI技術(shù)又有什么新的分支,他們更在意的是單價,因為這里是計件算工資。

“那會兒單價高的時候,拉一個2D框就有1毛多,我最高的時候干了10多個小時,一天就賺了600多元”,林雙回憶道。不過,這不是最高的,一位標(biāo)注人員稱,早期2D拉框的價格最高能達(dá)到5毛錢。

拉框是數(shù)據(jù)標(biāo)注中常見的一種操作,標(biāo)注員根據(jù)要求對圖片中的物體,如車輛、紅路燈、障礙物等畫框標(biāo)注。拉框分為2D和3D,后者的價格會更貴一些。

但這種熱度并沒有持續(xù)多少,伴隨著越來越多人涌入以及AI行業(yè)整體發(fā)展的不夠順利,標(biāo)注一個圖片的單價越來越低,林雙稱現(xiàn)在最低的只有4分錢。

“如果是拉框,行業(yè)的平均單價是在0.15元左右,但還是要看項目,如果自己可以接到單,接到一手單的最低要求應(yīng)該是100個入職員工,那規(guī)模挺大,3D的框有可能達(dá)到3毛錢一個,不過很少可以有達(dá)到5毛的。”

當(dāng)然,如果你本身具備醫(yī)療、金融方面的專業(yè)知識,那么單價則會更高。比如,很多醫(yī)療大模型會要求標(biāo)注員有是臨床專業(yè),且有相關(guān)從業(yè)經(jīng)驗。

大部分從業(yè)者每個月的收入都不過5000元,其中也不乏少數(shù)的幸運兒。楊碩本來在四川經(jīng)營一家服裝店,但疫情影響了他的生意,他在今年轉(zhuǎn)型做大模型數(shù)據(jù)標(biāo)注,現(xiàn)在,他每個月有8000元收入,“我是和公司簽了合同,交了9500元的加盟費,合同里寫著每個月最低收益是7000元。”

究竟誰賺到了錢

阿里、騰訊、字節(jié)這樣的互聯(lián)網(wǎng)大廠,以及上汽、領(lǐng)克等車企是數(shù)據(jù)標(biāo)注業(yè)務(wù)分發(fā)的源頭,想要以最好的價格直接從源頭獲取訂單,數(shù)據(jù)標(biāo)注公司們需要具備一定的規(guī)模。

一位數(shù)據(jù)標(biāo)注公司員工對Tech星球稱,他們直接從大廠拿到訂單,但是大廠要求他們得有500人,因此他們會選擇通過加盟或者子公司的方式來達(dá)到人員要求。

二者的區(qū)別是加盟適用于初入行的人組建工作室,如果要成立子公司,一般一個區(qū)域就只有一家。小白工作室需要收加盟費,2.5萬或者3萬。子公司是一個區(qū)域的獨家代理商,需要繳納5萬費用。而他們可以三年以內(nèi)保證訂單的充足,并負(fù)責(zé)3年內(nèi)的技術(shù)培訓(xùn),這些工作室或者子公司們組成一個大的工會,幾百到幾千不等。

上述數(shù)據(jù)標(biāo)注公司員工稱,大模型的火熱再次將數(shù)據(jù)標(biāo)注行業(yè)推上熱潮,現(xiàn)在幾乎每天都有人去他們公司拜訪。

但事實上,經(jīng)營一個數(shù)據(jù)標(biāo)注公司并不容易。數(shù)據(jù)標(biāo)注公司告訴你的是,這個行業(yè)前1到2個月比較難做,因為員工需要爬坡期,前期只需要5-8個人就夠了,40多歲的阿姨都沒有問題的。

穩(wěn)定是數(shù)據(jù)標(biāo)注公司或者工作室最重要的因素。但是Tech星球接觸的大部分標(biāo)注員工往往都因為枯燥無趣在3個月內(nèi)“光速”離職,新員工并不是馬上可以到崗實操,人員流動性大的結(jié)果就是數(shù)據(jù)標(biāo)注的質(zhì)量和周期不夠穩(wěn)定。缺錢的寶媽是數(shù)據(jù)標(biāo)注工作室最喜歡招納的人群。

“找兼職肯定不行的,會有空檔期,房租和電腦投入了,會虧錢,最好的方式是全員坐班”,開過數(shù)據(jù)標(biāo)注工作室的人魏銘向Tech星球介紹。

大部分?jǐn)?shù)據(jù)標(biāo)注公司的回款周期是3個月起步,最多半年,但他們需要以月付的方式給員工工資,這需要一定程度的資金儲備,“一個人3500,100個人,3個月就是105萬。”

張建曾經(jīng)加入過一個又200多號員工的工會。第一年,他們趕上行業(yè)的爆發(fā)期,2D拉框的單價高達(dá)5毛,那一年他所在的工會賺了400多萬。

但是第二年,行情急轉(zhuǎn)直下。標(biāo)注的單價變低,員工的流動性更快,空檔期增加,再加上兩個大項目都沒有結(jié)算,一整年過去,他們虧了300多萬。“老板都說短時間內(nèi)堅決不碰數(shù)據(jù)標(biāo)注”,張建表示,“他們現(xiàn)在正在和上游打官司。”

這是利潤微薄的生意。海天瑞聲是目前數(shù)據(jù)標(biāo)注行業(yè)內(nèi)首家主板上市公司,去年這家公司有2.63億元營收,利潤只有2945萬元,凈利潤率剛剛超過10%。但今年上半年,由于客戶數(shù)量減少,這家公司便陷入了虧損。

隨時可能被替代的“螺絲釘”

依靠著肯尼亞工人螞蟻搬家式的積累,最終OpenAI的語言對話大模型能力脫穎而出。這些被稱為數(shù)據(jù)民工的普通人支撐起了山姆·奧特曼(OpenAI創(chuàng)始人)的AI夢,但如果不出意外,他們手中的大部分工作,很快就會被自己參與創(chuàng)造的新產(chǎn)品所取代。

在國外,Open AI 前員工于2021年成立的Anthropic今年已經(jīng)融資51.5億美元,是其過去兩年融資總額的7倍還多。這家公司提供了一種新的方法,可在較少人工參與的情況下,便訓(xùn)練出模型。

今年,AI初創(chuàng)公司refuel推出了一個名為Autolabel的開源工具,可以使用市面上主流的大模型來對數(shù)據(jù)集進(jìn)行標(biāo)注。該公司的測試結(jié)果稱,Autolabel的標(biāo)注效率相比人工標(biāo)注提高了100倍,成本僅為人工成本的1/7。

在國內(nèi),一家名為視智未來的公司也在打造標(biāo)注大模型。他們在接受采訪時表示,有些項目已經(jīng)用GPT交付了,準(zhǔn)確率方面達(dá)到了80%多,與人工接近。

不過,海天瑞聲認(rèn)為,AI一定不會實現(xiàn)完全的自動化標(biāo)注,因為機(jī)器如果想要持續(xù)演進(jìn),使其更接近于人類的判斷和理解,就一定需要人類作為引導(dǎo)。

幾乎所有從事過數(shù)據(jù)標(biāo)注的人員,都向Tech星球透露著同一個觀點:數(shù)據(jù)標(biāo)注是一個沒有門檻的工作,只需要你熟練使用電腦即可。

但事實上,如果簡單的標(biāo)注可以用AI來完成,那么人工參與的將是難度更高的數(shù)據(jù)篩選和標(biāo)準(zhǔn)工作,這也意味著行業(yè)的門檻將會不斷提高,尤其是ChatGPT、文心一言類的大語言模型。

作為對照,早在ChatGPT走紅前,OpenAI就組建十幾位博士生來“打標(biāo)”。而百度在海口的數(shù)據(jù)標(biāo)注基地?fù)碛袛?shù)百名專職大模型數(shù)據(jù)標(biāo)注師,標(biāo)注師的本科率達(dá)到100%。

這類大語言模型的特點是,標(biāo)注員需要具備一定的知識儲備和邏輯分析能力。根據(jù)《財經(jīng)十一人》報道,標(biāo)注師們需要判斷問題類型,隨后給5個回答分別打分并排序,分?jǐn)?shù)區(qū)間為0-5分,如果打分低于3分,還要標(biāo)注出具體原因,例如“答非所問(0分)”、“嚴(yán)重跑題(1分)”、“存在邏輯問題,存在事實性錯誤,比例較小給2分”等。

數(shù)據(jù)標(biāo)注的另一個熱門領(lǐng)域是自動駕駛。據(jù)德勤的報告顯示,2022年自動駕駛領(lǐng)域的標(biāo)注需求占整個AI下游應(yīng)用的38%,預(yù)計到2027年,比例將上漲到52%。相較于大語言模型,對于自動駕駛領(lǐng)域的模型而言,那些簡單的拉框操作依然有著較為寬松的學(xué)歷要求。

標(biāo)注員們是人類從移動互聯(lián)網(wǎng)時代到人工智能時代的基石,Tech星球接觸到的大部分從業(yè)者大多不清楚AI將帶給他們那些改變,也不知道他們?yōu)榱薃I的發(fā)展做出的貢獻(xiàn),他們只是互聯(lián)網(wǎng)時代的新一代螺絲釘,而且隨時可能被替代。

Tech星球
分享到朋友圈
收藏
收藏
評分

綜合評分:

我的評分
Xinstall 15天會員特權(quán)
Xinstall是專業(yè)的數(shù)據(jù)分析服務(wù)商,幫企業(yè)追蹤渠道安裝來源、裂變拉新統(tǒng)計、廣告流量指導(dǎo)等,廣泛應(yīng)用于廣告效果統(tǒng)計、APP地推與CPS/CPA歸屬統(tǒng)計等方面。
20羽毛
立即兌換
一書一課30天會員體驗卡
領(lǐng)30天VIP會員,110+門職場大課,250+本精讀好書免費學(xué)!助你提升職場力!
20羽毛
立即兌換
順豐同城急送全國通用20元優(yōu)惠券
順豐同城急送是順豐推出的平均1小時送全城的即時快送服務(wù),專業(yè)安全,準(zhǔn)時送達(dá)!
30羽毛
立即兌換
Tech星球
Tech星球
發(fā)表文章695
36氪旗下品牌媒體,聚焦互聯(lián)網(wǎng)前沿科技和新商業(yè)。
確認(rèn)要消耗 羽毛購買
AI大模型折疊:數(shù)據(jù)標(biāo)注“民工”月入不過5000!嗎?
考慮一下
很遺憾,羽毛不足
我知道了

我們致力于提供一個高質(zhì)量內(nèi)容的交流平臺。為落實國家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評論自律管理,為了保護(hù)用戶創(chuàng)造的內(nèi)容、維護(hù)開放、真實、專業(yè)的平臺氛圍,我們團(tuán)隊將依據(jù)本公約中的條款對注冊用戶和發(fā)布在本平臺的內(nèi)容進(jìn)行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質(zhì)內(nèi)容,同時也將采取必要措施管理違法、侵權(quán)或有其他不良影響的網(wǎng)絡(luò)信息。


一、根據(jù)《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護(hù)法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進(jìn)行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
    1)反對憲法所確定的基本原則;
    2)危害國家安全,泄露國家秘密,顛覆國家政權(quán),破壞國家統(tǒng)一,損害國家榮譽和利益;
    3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
    4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
    5)煽動民族仇恨、民族歧視,破壞民族團(tuán)結(jié);
    6)破壞國家宗教政策,宣揚邪教和封建迷信;
    7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
    8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
    9)煽動非法集會、結(jié)社、游行、示威、聚眾擾亂社會秩序;
    10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權(quán)益;
    11)通過網(wǎng)絡(luò)以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進(jìn)行網(wǎng)絡(luò)欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法規(guī)禁止的其他內(nèi)容;


2. 不友善:不尊重用戶及其所貢獻(xiàn)內(nèi)容的信息或行為。主要表現(xiàn)為:
    1)輕蔑:貶低、輕視他人及其勞動成果;
    2)誹謗:捏造、散布虛假事實,損害他人名譽;
    3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進(jìn)行揭露或描述,以此來激怒他人;
    4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應(yīng),蓄意制造事端;
    5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
    6)謾罵:以不文明的語言對他人進(jìn)行負(fù)面評價;
    7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
    8)威脅:許諾以不良的后果來迫使他人服從自己的意志;


3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網(wǎng)站秩序的內(nèi)容,或進(jìn)行相關(guān)行為。主要表現(xiàn)為:
    1)多次發(fā)布包含售賣產(chǎn)品、提供服務(wù)、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
    2)單個帳號多次發(fā)布包含垃圾廣告的內(nèi)容;
    3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
    4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉(zhuǎn)網(wǎng)站等,誘騙用戶點擊鏈接
    5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當(dāng)曝光;
    6)購買或出售帳號之間虛假地互動,發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關(guān)交易。
    7)發(fā)布包含欺騙性的惡意營銷內(nèi)容,如通過偽造經(jīng)歷、冒充他人等方式進(jìn)行惡意營銷;
    8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。


4. 色情低俗信息,主要表現(xiàn)為:
    1)包含自己或他人性經(jīng)驗的細(xì)節(jié)描述或露骨的感受描述;
    2)涉及色情段子、兩性笑話的低俗內(nèi)容;
    3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
    4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
    5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
    6)炒作緋聞、丑聞、劣跡等;
    7)宣揚低俗、庸俗、媚俗內(nèi)容。


5. 不實信息,主要表現(xiàn)為:
    1)可能存在事實性錯誤或者造謠等內(nèi)容;
    2)存在事實夸大、偽造虛假經(jīng)歷等誤導(dǎo)他人的內(nèi)容;
    3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機(jī)構(gòu)或個人存在關(guān)聯(lián)。


6. 傳播封建迷信,主要表現(xiàn)為:
    1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治病;
    2)求推薦算命看相大師;
    3)針對具體風(fēng)水等問題進(jìn)行求助或咨詢;
    4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;


7. 文章標(biāo)題黨,主要表現(xiàn)為:
    1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來誘導(dǎo)用戶;
    2)內(nèi)容與標(biāo)題之間存在嚴(yán)重不實或者原意扭曲;
    3)使用夸張標(biāo)題,內(nèi)容與標(biāo)題嚴(yán)重不符的。


8.「飯圈」亂象行為,主要表現(xiàn)為:
    1)誘導(dǎo)未成年人應(yīng)援集資、高額消費、投票打榜
    2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
    3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
    4)以號召粉絲、雇用網(wǎng)絡(luò)水軍、「養(yǎng)號」形式刷量控評等行為
    5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序


9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
    1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導(dǎo)未成年人不良嗜好影響未成年人身心健康的;
    2)不當(dāng)評述自然災(zāi)害、重大事故等災(zāi)難的;
    3)美化、粉飾侵略戰(zhàn)爭行為的;
    4)法律、行政法規(guī)禁止,或可能對網(wǎng)絡(luò)生態(tài)造成不良影響的其他內(nèi)容。


二、違規(guī)處罰
本網(wǎng)站通過主動發(fā)現(xiàn)和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質(zhì)量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當(dāng)一個用戶發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將依據(jù)相關(guān)用戶違規(guī)情節(jié)嚴(yán)重程度,對帳號進(jìn)行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當(dāng)涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將加重處罰。


三、申訴
隨著平臺管理經(jīng)驗的不斷豐富,本網(wǎng)站出于維護(hù)本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網(wǎng)站進(jìn)行反饋。
(規(guī)則的最終解釋權(quán)歸屬本網(wǎng)站所有)

我知道了
恭喜你~答對了
+5羽毛
下一次認(rèn)真讀哦
成功推薦給其他人
+ 10羽毛
評論成功且進(jìn)入審核!審核通過后,您將獲得10羽毛的獎勵。分享本文章給好友閱讀最高再得15羽毛~
(羽毛可至 "羽毛精選" 兌換禮品)
好友微信掃一掃
復(fù)制鏈接