四虎AV成人在线观看|免费免费特黄的欧美大片|人妻丝袜中文字幕一区三区|性爱一级二级三级|日本黄色视频在线观看免费|亚洲午夜天堂超碰大香蕉中出|国产日韩三级黄色AV一区二区三区|a片网站在线观看视频|人人AV播放日韩操在线|国产伦清品一区二区三区

正在閱讀:

給AI打工的人,迷失在數(shù)據(jù)標注里

掃一掃下載界面新聞APP

給AI打工的人,迷失在數(shù)據(jù)標注里

AI數(shù)據(jù)標注師的圍城內外。

圖片來源:界面圖庫

文 | 定焦One 陳丹

編輯 | 魏佳

北京798附近的一家咖啡館內,AI數(shù)據(jù)標注師廖仔在交談中一再提到店里的咖啡機器人。

在這家占地近3000平米的咖啡館內,不少咖啡師圍繞著中央圓形島臺工作,但其中最引人矚目的是一臺人型機械臂的咖啡機器人。據(jù)說,該機器人的臉還是依據(jù)咖啡店主理人建模而成。

如果時間回到三四年前,廖仔想不到機器人可以沖咖啡,也想不到自己會進入AI賽道。

99年出生的他,??茖W歷,曾在深圳一家體制內單位工作,因為不想自己的人生就這樣一輩子看到頭,廖仔離職讀了一個建筑設計相關的課程。后來,他又由設計師切入AI行業(yè),最終成為了大廠的一名外包數(shù)據(jù)標注師。職業(yè)變化背后,廖仔的收入也水漲船高,月薪從一開始3K一路漲到了現(xiàn)在13K。

處在Gap期的蘇打也曾試圖進入這個行業(yè)。

985碩士畢業(yè)的她此前工作一直順風順水,但去年因為跟上司發(fā)生矛盾離職后,進入了漫長的職業(yè)空窗期。近半年來,蘇打也想過轉換賽道。當下火熱的AI行業(yè)讓她心動,數(shù)據(jù)標注師曾被她視為職業(yè)轉型的方向之一。

但經(jīng)過一次兼職后,蘇打打消了這個念頭?!斑@就是一個純燒腦的體力勞動,看不到任何上升的空間。”她對「定焦One」說道。

作為人工智能訓練師的一個工種,數(shù)據(jù)標注師2020年被正式納入國家職業(yè)分類目錄,但圍繞這個職業(yè)前景的討論卻是冰火兩重天。

一邊是基礎大模型高速擴張時期,大廠高薪與“AI紅利”吸引而來的數(shù)以萬計的求職者,全國各地甚至涌現(xiàn)了不少打著AI訓練師旗號的培訓班;另一邊則是彌漫在從業(yè)者之中的不安和焦慮,很多人覺得自己是在為AI打零工,或者只是成為了大模型優(yōu)化的一個耗材,既難以形成技術積累,也隨時可能被AI所取代。

如今,隨著大模型開發(fā)從“拼底層參數(shù)”轉向“爭場景落地”,這一工種的需求也在發(fā)生變化。標注崗位不再像過去那樣“批量放量”,取而代之的是更垂直化的需求和更強的專業(yè)門檻。轉型成功的廖仔,和抽身離開的蘇打,正是這股AI浪潮下的兩個典型注腳。

“擰螺絲”的三種姿勢:數(shù)據(jù)標注師的隱秘分層

如果想要進入AI行業(yè),數(shù)據(jù)標注或許是最沒有門檻的一個崗位——在網(wǎng)絡上隨手就能找到一份兼職。

「定焦One」體驗了一個眾包平臺的視頻審核兼職項目,任務是為自動售貨機做數(shù)據(jù)標注。正式上崗前,求職者先得進群進行一輪訓練——為500條視頻進行標注,且正確率在90%以上才算通過考核。正式接單后,以計件形式收費,每單費用在0.04元到0.1元浮動,標錯還會扣錢。

每個計件視頻長度大概十來秒,需要辨別出顧客從自動售貨機中拿走的商品種類以及數(shù)量。任務看似簡單,做起來卻并不容易。很多飲品、零食的包裝非常接近,加上夜晚光線干擾,極易誤判?!付ń筄ne」嘗試標注了20條視頻,用時25分鐘,完全正確的只有14條。

群里負責培訓的老師一再鼓勵大家:一開始錯誤率高是正常的,后面會越來越熟練、正確率越來越高,熟練后每天最多可做3000條視頻。

但做過類似兼職的人在社交媒體抱怨:真的做不了太久,眼睛受不了。在那個標記為11群的近200人大群內,不斷地有人退出、加入,就像一條永不停歇的虛擬流水線。

蘇打也在類似的一個微信群里。

前不久,她在招聘平臺看到國內某個大廠發(fā)布的數(shù)據(jù)標注兼職崗位。專業(yè)不限、經(jīng)驗不限,唯一的門檻是學歷——必須是985/211碩士及以上。

這份兼職是為大模型思考過程和輸出結果進行打分。輸出結果的正確與否、是否照顧到了用戶的情緒、感受,以及思考過程是否符合邏輯且高效等等都需要納入考量。

蘇打通過篩選后,也被拉到了一個微信群。同樣的,在正式接單之前,需要先進行培訓和測試。

蘇打收到了一份長達幾十頁的文件,詳細介紹了各個打分維度和評判標準。根據(jù)這個打分體系,她需要先進行兩到三輪的試標,達標后才可進行接單。通過測試后,在正式的標注過程中,也需保證正確率。如果正確率低于平均水平,便會失去標注資格,需要重新測試。

據(jù)蘇打觀察,她所在群里測試的通過率并不高。

“這份工作的難點是記憶、理解的成本特別高。在標注之前,你得先理解、記住他們的評價體系和打分標準?!备屘K打難受的是,這些標準并不是固定不變的。有時候,面對相似的問題和回答,她用相同的思考方式去打分,結果卻截然相反。

就像是寫沒有標準答案的一張張試卷,無法通過自我努力或學習提升正確率,只能原地不停得打轉、消耗自己的腦力和體力,最后獲得的報酬微乎其微。蘇打告訴「定焦One」,這份兼職也是按計件收費,標注一件的費用只有3-7元。

比蘇打幸運一些,廖仔沒有這些嚴苛的KPI和考核標準。

廖仔參與標注的是國內另外一家互聯(lián)網(wǎng)大廠的外包項目。他領導著一個由10名標注師組成的小組。項目里,有好幾個這樣的組別,對該大廠的大模型進行評估、鑒定、指定標注規(guī)則。廖仔會對每天需要標注的任務進行分配,再告訴組員具體的規(guī)則和評判標準確??陀^性。除數(shù)據(jù)標注之外,他還需跟算法團隊、產(chǎn)品研發(fā)團隊溝通,根據(jù)上下游反饋調整模型的評估和鑒定。

廖仔還是以咖啡機器人舉例,如果要AI制作咖啡,那么就需告訴它整個鏈路,包括咖啡樹如何種植、咖啡豆有哪些品類、分子結構如何、怎么研磨等等。通過每一步的數(shù)據(jù)標注,對它進行調校,然后再回歸到模型,讓它自主訓練。

三種數(shù)據(jù)標注工作可以大致勾勒出這個職業(yè)背后的隱形分層:自動售貨機標注,考驗“體力+注意力”,靠重復和熟練提升效率;為大模型的思考過程和輸出結果打分,要求較強的理解力和記憶力,像在答一道道沒有標準答案的試卷;大模型評估,則在標注之外承擔流程管理和溝通工作,具備一定自主性。

常有人將數(shù)據(jù)標注比做AI流水線上的“螺絲釘”。在廖仔看來,即便是擰螺絲釘,到他這一步,最起碼清楚了用什么工具擰、怎么擰效率會更高。

尷尬的崗位:重要,但是廉價

站在產(chǎn)業(yè)鏈更上游的Jackson,能從更為完整的流水線上審視數(shù)據(jù)標注的意義。

Jackson是海外一所名校研究生畢業(yè),現(xiàn)在在上海一家科技企業(yè)從事基礎模型訓練工作。他告訴「定焦One」,模型訓練主要包含三個部分:預訓練、監(jiān)督微調和強化學習。

預訓練所需的數(shù)據(jù)量動輒十幾TB,主要來源于公開爬蟲數(shù)據(jù)、模型合成數(shù)據(jù)、第三方采購數(shù)據(jù)或企業(yè)自有數(shù)據(jù)。這一階段對人工標注的依賴較少。

數(shù)據(jù)標注師主要介入的,是后兩個階段。

微調階段(Supervised Fine-Tuning,簡稱SFT)目標是讓預訓練后的通用語言模型適應特定任務或對話場景,使其輸出更符合人類期望。簡而言之,就是輸入特定數(shù)據(jù)后,教會模型“如何回答”。

強化階段(Reinforcement Learning from Human Feedback,簡稱RLHF)的核心是利用人類偏好數(shù)據(jù)優(yōu)化模型輸出質量。

用再通俗一點的話解釋,SFT是要寫出一個答案讓AI學習、模仿;而RLHF則是在AI給出幾個答案后,幫助AI選擇一個更符合人類偏好的答案。

廖仔大部分的工作都屬于前者,很難量化;蘇打的工作則是后者,可以計件考核。而像前文提到的自動售貨機標注這類較為簡單的數(shù)據(jù)收集工作,將很快被AI替代。

Jackson介紹,在微調和強化階段都可以使用一些自動化手段,或是使用其他模型生成的數(shù)據(jù),但其內容的多元性、正確性以及專業(yè)性可能不如人工標注的數(shù)據(jù)。就像DeepSeek生成的內容一眼就能看出來。

“最好的效果肯定是全部由人工標注,但(AI公司)老板們比起做個完美的模型,更在意成本。能用模型合成一個次優(yōu)版本,也是可以接受的。”

據(jù)Jackson估算,一次完整的微調和強化訓練多則需要幾十萬條數(shù)據(jù),而且模型還會更新迭代,數(shù)據(jù)的需求也會成倍累積。據(jù)他觀察,目前國內的大模型團隊有財力做人工數(shù)據(jù)標注的只有幾家頂級大廠,其他團隊大部分都是用別人的模型生成數(shù)據(jù)。

根據(jù)公開資料,字節(jié)跳動在AI上的投入僅2024年就達到了800億,2025年這一數(shù)字還要翻番到1600億。今年2月,阿里巴巴集團CEO吳泳銘宣布,未來三年,阿里將投入超3800億元用于建設云和AI硬件基礎設施。

但即便是這些頭部玩家,也必須在各環(huán)節(jié)精打細算。數(shù)據(jù)標注作為成本可控的一環(huán),被大廠選擇以外包、眾包的形式進行,成為常態(tài)。

蘇打每天兼職的工作量大概在3-4個小時,她計算了一下時薪,也就30-60塊之間。蘇打說,這三四個小時必須全神貫注,一點水分也擠不出。這樣的一個付出和回報,如果不是對這個行業(yè)感興趣真的很難堅持下來。

但蘇打所在的微信群每天還在不斷進人?!澳悴桓?,有的是人肯干,價格自然上不去。”

問題的本質不在于數(shù)據(jù)標注不重要,而在于這類工作缺乏技術壁壘。大模型的生成、優(yōu)化是一個非常精細化的過程。每一條數(shù)據(jù)就好像是布玩偶身上的一個針腳、斑馬身上的一根毛發(fā),很難辨析出其對于整體的意義。在這條流水線上,標注師很難積累出個人能力上的“獨占優(yōu)勢”,非常容易被替代。

沒有壁壘,就難有議價能力。

從招聘網(wǎng)站公開信息來看,兼職數(shù)據(jù)標注師日薪多在120-500元之間,外包崗位月薪大部分在9-17K之間。幾家大廠的正式崗位,月薪則在15-25K之間。相對技術崗和算法崗,這樣的薪資水平并不算高。

被自己訓練的AI替代:誰能突破金字塔?

因為沒有成長性,蘇打最終放棄了兼職,也不打算再投任何數(shù)據(jù)標注相關的崗位。為此,她還專門咨詢了一位從事AI數(shù)據(jù)標注多年的朋友。

這位朋友在大模型爆火之前,便加入了國內的一家大模型團隊,后來又跳槽去了另外一家大廠。朝陽行業(yè)、高薪崗位,很多人羨慕她踩中了風口,但她勸蘇打慎重投遞這個崗位。因為數(shù)據(jù)標注師職業(yè)發(fā)展空間有限,很難跳進AI產(chǎn)業(yè)真正的核心環(huán)節(jié)。

Jackson也持類似的觀點。

他用金字塔形容當前AI從業(yè)者的階梯式分布:塔底是標注,腰部是應用,再往上是做微調和后訓練,塔尖才是基礎模型設計和預訓練?!艾F(xiàn)在基本上是背景決定一切,很難從塔底一層層向上突破?!?/p>

所謂的背景是指學歷和學術背景。譬如,很多崗位,學歷就是一個硬性門檻。Jackson分析,應用層面需要本科學歷,微調和后訓練階段碩士起步,基礎模型基本上都是博士。

就拿他所在的算法崗來說,找工作要看學歷、實習、比賽、論文若干個維度。AI圈尤其重視學術背景。如果沒有過硬的論文,即便是排名還不錯的學校畢業(yè),也很難進入大廠的AI團隊。

“站在金子塔尖的,大部分是頂級學校的博士,還需要發(fā)很多論文的那種?!彼偨Y。

與此同時,標注師們訓練出來的模型本身,在悄然和標注師展開競爭。會不會被AI取代,成為懸在標注師們頭上的達摩克利斯之劍。

Jackson指出,在一些成熟的文本模型中,模型合成的數(shù)據(jù)已經(jīng)替代了80%的人工標注。這背后的邏輯是,模型不強時,對標注的需求就大;標注多了模型能力變強了,AI就會在這個任務或者這個領域把標注師替代了。

在海外的一些高科技企業(yè),這樣的情況已經(jīng)發(fā)生。

據(jù)彭博社報道,蘋果公司于2024年1月關閉了一個與Siri人工智能業(yè)務相關的團隊。他們原本負責對用戶與Siri交互時產(chǎn)生的數(shù)據(jù)進行監(jiān)聽分析、標注和理解用戶需求。同樣因為自動標注能力大幅改善,2022年6月,特斯拉裁撤了200名為其標注視頻以改進輔助系統(tǒng)的美國員工。

另一方面,大廠戰(zhàn)略的變化,也影響著數(shù)據(jù)標注師的職業(yè)前景。

2023年初,基礎大模型是所有科技巨頭競相投入的戰(zhàn)場,百度、字節(jié)、阿里、騰訊等大廠商高調押注自研大模型,數(shù)據(jù)標注一度成為不可或缺的基礎崗位。

但進入2024年,這場競賽明顯降溫。多家大廠陸續(xù)調整重心,開始從“造更大參數(shù)的模型”,轉向“讓模型真正落地”。

這一轉向,也直接影響到數(shù)據(jù)標注這一基礎工種的崗位供給與預算安排。于是,用于支持基礎大模型訓練的數(shù)據(jù)標注需求可能被壓縮。未來企業(yè)需要的將不再是成千上萬“能標數(shù)據(jù)的人”,而是“懂業(yè)務、懂模型的人”。

當然,需求并未完全消失。一方面,Jackson解釋,隨著AI技術的發(fā)展、大模型進一步落地將會產(chǎn)生大量的應用場景。每當有新的場景出現(xiàn),就需要找人標注數(shù)據(jù)。數(shù)據(jù)標注的需求仍將長期、大量存在。另一方面,根據(jù)清華大學發(fā)布的《智能數(shù)據(jù)產(chǎn)業(yè)發(fā)展觀察報告》,2024年數(shù)據(jù)標注產(chǎn)業(yè)有用工需求的企業(yè)從2023年的457家升至1195家。另據(jù)IDC數(shù)據(jù)測算,2025年中國人工智能基礎數(shù)據(jù)服務市場規(guī)模將突破120億元,2019-2025年年均復合增長率(CAGR)約為47%。

只不過,這些增長更多屬于“橫向增量”——也就是新場景帶來的數(shù)據(jù)標注需求擴容,而非“標注師”作為工種本身的上升通道被打開。對絕大多數(shù)從業(yè)者而言,他們所做的,依然是為流水線打工。

已經(jīng)被AI“搶”過一次飯碗的廖仔對自己的職業(yè)未來充滿信心。

在來北京之前,廖仔在上海的一家設計公司做了兩年設計師。那時候,AI對于設計行業(yè)的沖擊已經(jīng)開始,廖仔所在的公司也不得不向AI轉型,決定做一個客服類大模型。他主動請纓參與其中,這個AI項目為他打開了新世界大門。

后來,他從公司離職,對AI進行了更為系統(tǒng)的學習。今年春節(jié)后,他入職了現(xiàn)在的公司。每天下班不管多晚,廖仔都會學習兩個小時AI相關的內容,他還開了一個小紅書賬號“炸毛瘋兔”,記錄AI心得。

“凡事發(fā)生,皆有利于我?!痹诮涣鲿r,廖仔一再引用這句古語。

咖啡店的工作人員時不時會送來一些新品試吃,服務細致妥帖。而引人注目的咖啡機器人一下午并沒有沖調一杯咖啡。最起碼現(xiàn)階段,機器人對這家咖啡館而言,更多是一個裝飾品。盡管未來不可控,但人的主動性始終是關鍵。

(文中廖仔、蘇打、Jackson皆為化名)

本文為轉載內容,授權事宜請聯(lián)系原著作權人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

給AI打工的人,迷失在數(shù)據(jù)標注里

AI數(shù)據(jù)標注師的圍城內外。

圖片來源:界面圖庫

文 | 定焦One 陳丹

編輯 | 魏佳

北京798附近的一家咖啡館內,AI數(shù)據(jù)標注師廖仔在交談中一再提到店里的咖啡機器人。

在這家占地近3000平米的咖啡館內,不少咖啡師圍繞著中央圓形島臺工作,但其中最引人矚目的是一臺人型機械臂的咖啡機器人。據(jù)說,該機器人的臉還是依據(jù)咖啡店主理人建模而成。

如果時間回到三四年前,廖仔想不到機器人可以沖咖啡,也想不到自己會進入AI賽道。

99年出生的他,??茖W歷,曾在深圳一家體制內單位工作,因為不想自己的人生就這樣一輩子看到頭,廖仔離職讀了一個建筑設計相關的課程。后來,他又由設計師切入AI行業(yè),最終成為了大廠的一名外包數(shù)據(jù)標注師。職業(yè)變化背后,廖仔的收入也水漲船高,月薪從一開始3K一路漲到了現(xiàn)在13K。

處在Gap期的蘇打也曾試圖進入這個行業(yè)。

985碩士畢業(yè)的她此前工作一直順風順水,但去年因為跟上司發(fā)生矛盾離職后,進入了漫長的職業(yè)空窗期。近半年來,蘇打也想過轉換賽道。當下火熱的AI行業(yè)讓她心動,數(shù)據(jù)標注師曾被她視為職業(yè)轉型的方向之一。

但經(jīng)過一次兼職后,蘇打打消了這個念頭?!斑@就是一個純燒腦的體力勞動,看不到任何上升的空間?!彼龑Α付ń筄ne」說道。

作為人工智能訓練師的一個工種,數(shù)據(jù)標注師2020年被正式納入國家職業(yè)分類目錄,但圍繞這個職業(yè)前景的討論卻是冰火兩重天。

一邊是基礎大模型高速擴張時期,大廠高薪與“AI紅利”吸引而來的數(shù)以萬計的求職者,全國各地甚至涌現(xiàn)了不少打著AI訓練師旗號的培訓班;另一邊則是彌漫在從業(yè)者之中的不安和焦慮,很多人覺得自己是在為AI打零工,或者只是成為了大模型優(yōu)化的一個耗材,既難以形成技術積累,也隨時可能被AI所取代。

如今,隨著大模型開發(fā)從“拼底層參數(shù)”轉向“爭場景落地”,這一工種的需求也在發(fā)生變化。標注崗位不再像過去那樣“批量放量”,取而代之的是更垂直化的需求和更強的專業(yè)門檻。轉型成功的廖仔,和抽身離開的蘇打,正是這股AI浪潮下的兩個典型注腳。

“擰螺絲”的三種姿勢:數(shù)據(jù)標注師的隱秘分層

如果想要進入AI行業(yè),數(shù)據(jù)標注或許是最沒有門檻的一個崗位——在網(wǎng)絡上隨手就能找到一份兼職。

「定焦One」體驗了一個眾包平臺的視頻審核兼職項目,任務是為自動售貨機做數(shù)據(jù)標注。正式上崗前,求職者先得進群進行一輪訓練——為500條視頻進行標注,且正確率在90%以上才算通過考核。正式接單后,以計件形式收費,每單費用在0.04元到0.1元浮動,標錯還會扣錢。

每個計件視頻長度大概十來秒,需要辨別出顧客從自動售貨機中拿走的商品種類以及數(shù)量。任務看似簡單,做起來卻并不容易。很多飲品、零食的包裝非常接近,加上夜晚光線干擾,極易誤判。「定焦One」嘗試標注了20條視頻,用時25分鐘,完全正確的只有14條。

群里負責培訓的老師一再鼓勵大家:一開始錯誤率高是正常的,后面會越來越熟練、正確率越來越高,熟練后每天最多可做3000條視頻。

但做過類似兼職的人在社交媒體抱怨:真的做不了太久,眼睛受不了。在那個標記為11群的近200人大群內,不斷地有人退出、加入,就像一條永不停歇的虛擬流水線。

蘇打也在類似的一個微信群里。

前不久,她在招聘平臺看到國內某個大廠發(fā)布的數(shù)據(jù)標注兼職崗位。專業(yè)不限、經(jīng)驗不限,唯一的門檻是學歷——必須是985/211碩士及以上。

這份兼職是為大模型思考過程和輸出結果進行打分。輸出結果的正確與否、是否照顧到了用戶的情緒、感受,以及思考過程是否符合邏輯且高效等等都需要納入考量。

蘇打通過篩選后,也被拉到了一個微信群。同樣的,在正式接單之前,需要先進行培訓和測試。

蘇打收到了一份長達幾十頁的文件,詳細介紹了各個打分維度和評判標準。根據(jù)這個打分體系,她需要先進行兩到三輪的試標,達標后才可進行接單。通過測試后,在正式的標注過程中,也需保證正確率。如果正確率低于平均水平,便會失去標注資格,需要重新測試。

據(jù)蘇打觀察,她所在群里測試的通過率并不高。

“這份工作的難點是記憶、理解的成本特別高。在標注之前,你得先理解、記住他們的評價體系和打分標準?!备屘K打難受的是,這些標準并不是固定不變的。有時候,面對相似的問題和回答,她用相同的思考方式去打分,結果卻截然相反。

就像是寫沒有標準答案的一張張試卷,無法通過自我努力或學習提升正確率,只能原地不停得打轉、消耗自己的腦力和體力,最后獲得的報酬微乎其微。蘇打告訴「定焦One」,這份兼職也是按計件收費,標注一件的費用只有3-7元。

比蘇打幸運一些,廖仔沒有這些嚴苛的KPI和考核標準。

廖仔參與標注的是國內另外一家互聯(lián)網(wǎng)大廠的外包項目。他領導著一個由10名標注師組成的小組。項目里,有好幾個這樣的組別,對該大廠的大模型進行評估、鑒定、指定標注規(guī)則。廖仔會對每天需要標注的任務進行分配,再告訴組員具體的規(guī)則和評判標準確??陀^性。除數(shù)據(jù)標注之外,他還需跟算法團隊、產(chǎn)品研發(fā)團隊溝通,根據(jù)上下游反饋調整模型的評估和鑒定。

廖仔還是以咖啡機器人舉例,如果要AI制作咖啡,那么就需告訴它整個鏈路,包括咖啡樹如何種植、咖啡豆有哪些品類、分子結構如何、怎么研磨等等。通過每一步的數(shù)據(jù)標注,對它進行調校,然后再回歸到模型,讓它自主訓練。

三種數(shù)據(jù)標注工作可以大致勾勒出這個職業(yè)背后的隱形分層:自動售貨機標注,考驗“體力+注意力”,靠重復和熟練提升效率;為大模型的思考過程和輸出結果打分,要求較強的理解力和記憶力,像在答一道道沒有標準答案的試卷;大模型評估,則在標注之外承擔流程管理和溝通工作,具備一定自主性。

常有人將數(shù)據(jù)標注比做AI流水線上的“螺絲釘”。在廖仔看來,即便是擰螺絲釘,到他這一步,最起碼清楚了用什么工具擰、怎么擰效率會更高。

尷尬的崗位:重要,但是廉價

站在產(chǎn)業(yè)鏈更上游的Jackson,能從更為完整的流水線上審視數(shù)據(jù)標注的意義。

Jackson是海外一所名校研究生畢業(yè),現(xiàn)在在上海一家科技企業(yè)從事基礎模型訓練工作。他告訴「定焦One」,模型訓練主要包含三個部分:預訓練、監(jiān)督微調和強化學習。

預訓練所需的數(shù)據(jù)量動輒十幾TB,主要來源于公開爬蟲數(shù)據(jù)、模型合成數(shù)據(jù)、第三方采購數(shù)據(jù)或企業(yè)自有數(shù)據(jù)。這一階段對人工標注的依賴較少。

數(shù)據(jù)標注師主要介入的,是后兩個階段。

微調階段(Supervised Fine-Tuning,簡稱SFT)目標是讓預訓練后的通用語言模型適應特定任務或對話場景,使其輸出更符合人類期望。簡而言之,就是輸入特定數(shù)據(jù)后,教會模型“如何回答”。

強化階段(Reinforcement Learning from Human Feedback,簡稱RLHF)的核心是利用人類偏好數(shù)據(jù)優(yōu)化模型輸出質量。

用再通俗一點的話解釋,SFT是要寫出一個答案讓AI學習、模仿;而RLHF則是在AI給出幾個答案后,幫助AI選擇一個更符合人類偏好的答案。

廖仔大部分的工作都屬于前者,很難量化;蘇打的工作則是后者,可以計件考核。而像前文提到的自動售貨機標注這類較為簡單的數(shù)據(jù)收集工作,將很快被AI替代。

Jackson介紹,在微調和強化階段都可以使用一些自動化手段,或是使用其他模型生成的數(shù)據(jù),但其內容的多元性、正確性以及專業(yè)性可能不如人工標注的數(shù)據(jù)。就像DeepSeek生成的內容一眼就能看出來。

“最好的效果肯定是全部由人工標注,但(AI公司)老板們比起做個完美的模型,更在意成本。能用模型合成一個次優(yōu)版本,也是可以接受的?!?/p>

據(jù)Jackson估算,一次完整的微調和強化訓練多則需要幾十萬條數(shù)據(jù),而且模型還會更新迭代,數(shù)據(jù)的需求也會成倍累積。據(jù)他觀察,目前國內的大模型團隊有財力做人工數(shù)據(jù)標注的只有幾家頂級大廠,其他團隊大部分都是用別人的模型生成數(shù)據(jù)。

根據(jù)公開資料,字節(jié)跳動在AI上的投入僅2024年就達到了800億,2025年這一數(shù)字還要翻番到1600億。今年2月,阿里巴巴集團CEO吳泳銘宣布,未來三年,阿里將投入超3800億元用于建設云和AI硬件基礎設施。

但即便是這些頭部玩家,也必須在各環(huán)節(jié)精打細算。數(shù)據(jù)標注作為成本可控的一環(huán),被大廠選擇以外包、眾包的形式進行,成為常態(tài)。

蘇打每天兼職的工作量大概在3-4個小時,她計算了一下時薪,也就30-60塊之間。蘇打說,這三四個小時必須全神貫注,一點水分也擠不出。這樣的一個付出和回報,如果不是對這個行業(yè)感興趣真的很難堅持下來。

但蘇打所在的微信群每天還在不斷進人?!澳悴桓?,有的是人肯干,價格自然上不去?!?/p>

問題的本質不在于數(shù)據(jù)標注不重要,而在于這類工作缺乏技術壁壘。大模型的生成、優(yōu)化是一個非常精細化的過程。每一條數(shù)據(jù)就好像是布玩偶身上的一個針腳、斑馬身上的一根毛發(fā),很難辨析出其對于整體的意義。在這條流水線上,標注師很難積累出個人能力上的“獨占優(yōu)勢”,非常容易被替代。

沒有壁壘,就難有議價能力。

從招聘網(wǎng)站公開信息來看,兼職數(shù)據(jù)標注師日薪多在120-500元之間,外包崗位月薪大部分在9-17K之間。幾家大廠的正式崗位,月薪則在15-25K之間。相對技術崗和算法崗,這樣的薪資水平并不算高。

被自己訓練的AI替代:誰能突破金字塔?

因為沒有成長性,蘇打最終放棄了兼職,也不打算再投任何數(shù)據(jù)標注相關的崗位。為此,她還專門咨詢了一位從事AI數(shù)據(jù)標注多年的朋友。

這位朋友在大模型爆火之前,便加入了國內的一家大模型團隊,后來又跳槽去了另外一家大廠。朝陽行業(yè)、高薪崗位,很多人羨慕她踩中了風口,但她勸蘇打慎重投遞這個崗位。因為數(shù)據(jù)標注師職業(yè)發(fā)展空間有限,很難跳進AI產(chǎn)業(yè)真正的核心環(huán)節(jié)。

Jackson也持類似的觀點。

他用金字塔形容當前AI從業(yè)者的階梯式分布:塔底是標注,腰部是應用,再往上是做微調和后訓練,塔尖才是基礎模型設計和預訓練?!艾F(xiàn)在基本上是背景決定一切,很難從塔底一層層向上突破?!?/p>

所謂的背景是指學歷和學術背景。譬如,很多崗位,學歷就是一個硬性門檻。Jackson分析,應用層面需要本科學歷,微調和后訓練階段碩士起步,基礎模型基本上都是博士。

就拿他所在的算法崗來說,找工作要看學歷、實習、比賽、論文若干個維度。AI圈尤其重視學術背景。如果沒有過硬的論文,即便是排名還不錯的學校畢業(yè),也很難進入大廠的AI團隊。

“站在金子塔尖的,大部分是頂級學校的博士,還需要發(fā)很多論文的那種。”他總結。

與此同時,標注師們訓練出來的模型本身,在悄然和標注師展開競爭。會不會被AI取代,成為懸在標注師們頭上的達摩克利斯之劍。

Jackson指出,在一些成熟的文本模型中,模型合成的數(shù)據(jù)已經(jīng)替代了80%的人工標注。這背后的邏輯是,模型不強時,對標注的需求就大;標注多了模型能力變強了,AI就會在這個任務或者這個領域把標注師替代了。

在海外的一些高科技企業(yè),這樣的情況已經(jīng)發(fā)生。

據(jù)彭博社報道,蘋果公司于2024年1月關閉了一個與Siri人工智能業(yè)務相關的團隊。他們原本負責對用戶與Siri交互時產(chǎn)生的數(shù)據(jù)進行監(jiān)聽分析、標注和理解用戶需求。同樣因為自動標注能力大幅改善,2022年6月,特斯拉裁撤了200名為其標注視頻以改進輔助系統(tǒng)的美國員工。

另一方面,大廠戰(zhàn)略的變化,也影響著數(shù)據(jù)標注師的職業(yè)前景。

2023年初,基礎大模型是所有科技巨頭競相投入的戰(zhàn)場,百度、字節(jié)、阿里、騰訊等大廠商高調押注自研大模型,數(shù)據(jù)標注一度成為不可或缺的基礎崗位。

但進入2024年,這場競賽明顯降溫。多家大廠陸續(xù)調整重心,開始從“造更大參數(shù)的模型”,轉向“讓模型真正落地”。

這一轉向,也直接影響到數(shù)據(jù)標注這一基礎工種的崗位供給與預算安排。于是,用于支持基礎大模型訓練的數(shù)據(jù)標注需求可能被壓縮。未來企業(yè)需要的將不再是成千上萬“能標數(shù)據(jù)的人”,而是“懂業(yè)務、懂模型的人”。

當然,需求并未完全消失。一方面,Jackson解釋,隨著AI技術的發(fā)展、大模型進一步落地將會產(chǎn)生大量的應用場景。每當有新的場景出現(xiàn),就需要找人標注數(shù)據(jù)。數(shù)據(jù)標注的需求仍將長期、大量存在。另一方面,根據(jù)清華大學發(fā)布的《智能數(shù)據(jù)產(chǎn)業(yè)發(fā)展觀察報告》,2024年數(shù)據(jù)標注產(chǎn)業(yè)有用工需求的企業(yè)從2023年的457家升至1195家。另據(jù)IDC數(shù)據(jù)測算,2025年中國人工智能基礎數(shù)據(jù)服務市場規(guī)模將突破120億元,2019-2025年年均復合增長率(CAGR)約為47%。

只不過,這些增長更多屬于“橫向增量”——也就是新場景帶來的數(shù)據(jù)標注需求擴容,而非“標注師”作為工種本身的上升通道被打開。對絕大多數(shù)從業(yè)者而言,他們所做的,依然是為流水線打工。

已經(jīng)被AI“搶”過一次飯碗的廖仔對自己的職業(yè)未來充滿信心。

在來北京之前,廖仔在上海的一家設計公司做了兩年設計師。那時候,AI對于設計行業(yè)的沖擊已經(jīng)開始,廖仔所在的公司也不得不向AI轉型,決定做一個客服類大模型。他主動請纓參與其中,這個AI項目為他打開了新世界大門。

后來,他從公司離職,對AI進行了更為系統(tǒng)的學習。今年春節(jié)后,他入職了現(xiàn)在的公司。每天下班不管多晚,廖仔都會學習兩個小時AI相關的內容,他還開了一個小紅書賬號“炸毛瘋兔”,記錄AI心得。

“凡事發(fā)生,皆有利于我?!痹诮涣鲿r,廖仔一再引用這句古語。

咖啡店的工作人員時不時會送來一些新品試吃,服務細致妥帖。而引人注目的咖啡機器人一下午并沒有沖調一杯咖啡。最起碼現(xiàn)階段,機器人對這家咖啡館而言,更多是一個裝飾品。盡管未來不可控,但人的主動性始終是關鍵。

(文中廖仔、蘇打、Jackson皆為化名)

本文為轉載內容,授權事宜請聯(lián)系原著作權人。