掃一掃下載界面新聞APP

給AI打工的人，迷失在數(shù)據(jù)標(biāo)注里

AI數(shù)據(jù)標(biāo)注師的圍城內(nèi)外。

定焦One ·

數(shù)據(jù)標(biāo)注,AI,大模型,互聯(lián)網(wǎng)大廠,

圖片來源：界面圖庫

文 | 定焦One 陳丹

編輯 | 魏佳

北京798附近的一家咖啡館內(nèi)，AI數(shù)據(jù)標(biāo)注師廖仔在交談中一再提到店里的咖啡機(jī)器人。

在這家占地近3000平米的咖啡館內(nèi)，不少咖啡師圍繞著中央圓形島臺(tái)工作，但其中最引人矚目的是一臺(tái)人型機(jī)械臂的咖啡機(jī)器人。據(jù)說，該機(jī)器人的臉還是依據(jù)咖啡店主理人建模而成。

如果時(shí)間回到三四年前，廖仔想不到機(jī)器人可以沖咖啡，也想不到自己會(huì)進(jìn)入AI賽道。

99年出生的他，?？茖W(xué)歷，曾在深圳一家體制內(nèi)單位工作，因?yàn)椴幌胱约旱娜松瓦@樣一輩子看到頭，廖仔離職讀了一個(gè)建筑設(shè)計(jì)相關(guān)的課程。后來，他又由設(shè)計(jì)師切入AI行業(yè)，最終成為了大廠的一名外包數(shù)據(jù)標(biāo)注師。職業(yè)變化背后，廖仔的收入也水漲船高，月薪從一開始3K一路漲到了現(xiàn)在13K。

處在Gap期的蘇打也曾試圖進(jìn)入這個(gè)行業(yè)。

985碩士畢業(yè)的她此前工作一直順風(fēng)順?biāo)?，但去年因?yàn)楦纤景l(fā)生矛盾離職后，進(jìn)入了漫長的職業(yè)空窗期。近半年來，蘇打也想過轉(zhuǎn)換賽道。當(dāng)下火熱的AI行業(yè)讓她心動(dòng)，數(shù)據(jù)標(biāo)注師曾被她視為職業(yè)轉(zhuǎn)型的方向之一。

但經(jīng)過一次兼職后，蘇打打消了這個(gè)念頭。“這就是一個(gè)純燒腦的體力勞動(dòng)，看不到任何上升的空間?！彼龑Α付ń筄ne」說道。

作為人工智能訓(xùn)練師的一個(gè)工種，數(shù)據(jù)標(biāo)注師2020年被正式納入國家職業(yè)分類目錄，但圍繞這個(gè)職業(yè)前景的討論卻是冰火兩重天。

一邊是基礎(chǔ)大模型高速擴(kuò)張時(shí)期，大廠高薪與“AI紅利”吸引而來的數(shù)以萬計(jì)的求職者，全國各地甚至涌現(xiàn)了不少打著AI訓(xùn)練師旗號(hào)的培訓(xùn)班；另一邊則是彌漫在從業(yè)者之中的不安和焦慮，很多人覺得自己是在為AI打零工，或者只是成為了大模型優(yōu)化的一個(gè)耗材，既難以形成技術(shù)積累，也隨時(shí)可能被AI所取代。

如今，隨著大模型開發(fā)從“拼底層參數(shù)”轉(zhuǎn)向“爭場景落地”，這一工種的需求也在發(fā)生變化。標(biāo)注崗位不再像過去那樣“批量放量”，取而代之的是更垂直化的需求和更強(qiáng)的專業(yè)門檻。轉(zhuǎn)型成功的廖仔，和抽身離開的蘇打，正是這股AI浪潮下的兩個(gè)典型注腳。

“擰螺絲”的三種姿勢：數(shù)據(jù)標(biāo)注師的隱秘分層

如果想要進(jìn)入AI行業(yè)，數(shù)據(jù)標(biāo)注或許是最沒有門檻的一個(gè)崗位——在網(wǎng)絡(luò)上隨手就能找到一份兼職。

「定焦One」體驗(yàn)了一個(gè)眾包平臺(tái)的視頻審核兼職項(xiàng)目，任務(wù)是為自動(dòng)售貨機(jī)做數(shù)據(jù)標(biāo)注。正式上崗前，求職者先得進(jìn)群進(jìn)行一輪訓(xùn)練——為500條視頻進(jìn)行標(biāo)注，且正確率在90%以上才算通過考核。正式接單后，以計(jì)件形式收費(fèi)，每單費(fèi)用在0.04元到0.1元浮動(dòng)，標(biāo)錯(cuò)還會(huì)扣錢。

每個(gè)計(jì)件視頻長度大概十來秒，需要辨別出顧客從自動(dòng)售貨機(jī)中拿走的商品種類以及數(shù)量。任務(wù)看似簡單，做起來卻并不容易。很多飲品、零食的包裝非常接近，加上夜晚光線干擾，極易誤判?！付ń筄ne」嘗試標(biāo)注了20條視頻，用時(shí)25分鐘，完全正確的只有14條。

群里負(fù)責(zé)培訓(xùn)的老師一再鼓勵(lì)大家：一開始錯(cuò)誤率高是正常的，后面會(huì)越來越熟練、正確率越來越高，熟練后每天最多可做3000條視頻。

但做過類似兼職的人在社交媒體抱怨：真的做不了太久，眼睛受不了。在那個(gè)標(biāo)記為11群的近200人大群內(nèi)，不斷地有人退出、加入，就像一條永不停歇的虛擬流水線。

蘇打也在類似的一個(gè)微信群里。

前不久，她在招聘平臺(tái)看到國內(nèi)某個(gè)大廠發(fā)布的數(shù)據(jù)標(biāo)注兼職崗位。專業(yè)不限、經(jīng)驗(yàn)不限，唯一的門檻是學(xué)歷——必須是985/211碩士及以上。

這份兼職是為大模型思考過程和輸出結(jié)果進(jìn)行打分。輸出結(jié)果的正確與否、是否照顧到了用戶的情緒、感受，以及思考過程是否符合邏輯且高效等等都需要納入考量。

蘇打通過篩選后，也被拉到了一個(gè)微信群。同樣的，在正式接單之前，需要先進(jìn)行培訓(xùn)和測試。

蘇打收到了一份長達(dá)幾十頁的文件，詳細(xì)介紹了各個(gè)打分維度和評判標(biāo)準(zhǔn)。根據(jù)這個(gè)打分體系，她需要先進(jìn)行兩到三輪的試標(biāo)，達(dá)標(biāo)后才可進(jìn)行接單。通過測試后，在正式的標(biāo)注過程中，也需保證正確率。如果正確率低于平均水平，便會(huì)失去標(biāo)注資格，需要重新測試。

據(jù)蘇打觀察，她所在群里測試的通過率并不高。

“這份工作的難點(diǎn)是記憶、理解的成本特別高。在標(biāo)注之前，你得先理解、記住他們的評價(jià)體系和打分標(biāo)準(zhǔn)。”更讓蘇打難受的是，這些標(biāo)準(zhǔn)并不是固定不變的。有時(shí)候，面對相似的問題和回答，她用相同的思考方式去打分，結(jié)果卻截然相反。

就像是寫沒有標(biāo)準(zhǔn)答案的一張張?jiān)嚲?，無法通過自我努力或?qū)W習(xí)提升正確率，只能原地不停得打轉(zhuǎn)、消耗自己的腦力和體力，最后獲得的報(bào)酬微乎其微。蘇打告訴「定焦One」，這份兼職也是按計(jì)件收費(fèi)，標(biāo)注一件的費(fèi)用只有3-7元。

比蘇打幸運(yùn)一些，廖仔沒有這些嚴(yán)苛的KPI和考核標(biāo)準(zhǔn)。

廖仔參與標(biāo)注的是國內(nèi)另外一家互聯(lián)網(wǎng)大廠的外包項(xiàng)目。他領(lǐng)導(dǎo)著一個(gè)由10名標(biāo)注師組成的小組。項(xiàng)目里，有好幾個(gè)這樣的組別，對該大廠的大模型進(jìn)行評估、鑒定、指定標(biāo)注規(guī)則。廖仔會(huì)對每天需要標(biāo)注的任務(wù)進(jìn)行分配，再告訴組員具體的規(guī)則和評判標(biāo)準(zhǔn)確?？陀^性。除數(shù)據(jù)標(biāo)注之外，他還需跟算法團(tuán)隊(duì)、產(chǎn)品研發(fā)團(tuán)隊(duì)溝通，根據(jù)上下游反饋調(diào)整模型的評估和鑒定。

廖仔還是以咖啡機(jī)器人舉例，如果要AI制作咖啡，那么就需告訴它整個(gè)鏈路，包括咖啡樹如何種植、咖啡豆有哪些品類、分子結(jié)構(gòu)如何、怎么研磨等等。通過每一步的數(shù)據(jù)標(biāo)注，對它進(jìn)行調(diào)校，然后再回歸到模型，讓它自主訓(xùn)練。

三種數(shù)據(jù)標(biāo)注工作可以大致勾勒出這個(gè)職業(yè)背后的隱形分層：自動(dòng)售貨機(jī)標(biāo)注，考驗(yàn)“體力+注意力”，靠重復(fù)和熟練提升效率；為大模型的思考過程和輸出結(jié)果打分，要求較強(qiáng)的理解力和記憶力，像在答一道道沒有標(biāo)準(zhǔn)答案的試卷；大模型評估，則在標(biāo)注之外承擔(dān)流程管理和溝通工作，具備一定自主性。

常有人將數(shù)據(jù)標(biāo)注比做AI流水線上的“螺絲釘”。在廖仔看來，即便是擰螺絲釘，到他這一步，最起碼清楚了用什么工具擰、怎么擰效率會(huì)更高。

尷尬的崗位：重要，但是廉價(jià)

站在產(chǎn)業(yè)鏈更上游的Jackson，能從更為完整的流水線上審視數(shù)據(jù)標(biāo)注的意義。

Jackson是海外一所名校研究生畢業(yè)，現(xiàn)在在上海一家科技企業(yè)從事基礎(chǔ)模型訓(xùn)練工作。他告訴「定焦One」，模型訓(xùn)練主要包含三個(gè)部分：預(yù)訓(xùn)練、監(jiān)督微調(diào)和強(qiáng)化學(xué)習(xí)。

預(yù)訓(xùn)練所需的數(shù)據(jù)量動(dòng)輒十幾TB，主要來源于公開爬蟲數(shù)據(jù)、模型合成數(shù)據(jù)、第三方采購數(shù)據(jù)或企業(yè)自有數(shù)據(jù)。這一階段對人工標(biāo)注的依賴較少。

數(shù)據(jù)標(biāo)注師主要介入的，是后兩個(gè)階段。

微調(diào)階段（Supervised Fine-Tuning，簡稱SFT）目標(biāo)是讓預(yù)訓(xùn)練后的通用語言模型適應(yīng)特定任務(wù)或?qū)υ拡鼍?，使其輸出更符合人類期望。簡而言之，就是輸入特定?shù)據(jù)后，教會(huì)模型“如何回答”。

強(qiáng)化階段（Reinforcement Learning from Human Feedback，簡稱RLHF）的核心是利用人類偏好數(shù)據(jù)優(yōu)化模型輸出質(zhì)量。

用再通俗一點(diǎn)的話解釋，SFT是要寫出一個(gè)答案讓AI學(xué)習(xí)、模仿；而RLHF則是在AI給出幾個(gè)答案后，幫助AI選擇一個(gè)更符合人類偏好的答案。

廖仔大部分的工作都屬于前者，很難量化；蘇打的工作則是后者，可以計(jì)件考核。而像前文提到的自動(dòng)售貨機(jī)標(biāo)注這類較為簡單的數(shù)據(jù)收集工作，將很快被AI替代。

Jackson介紹，在微調(diào)和強(qiáng)化階段都可以使用一些自動(dòng)化手段，或是使用其他模型生成的數(shù)據(jù)，但其內(nèi)容的多元性、正確性以及專業(yè)性可能不如人工標(biāo)注的數(shù)據(jù)。就像DeepSeek生成的內(nèi)容一眼就能看出來。

“最好的效果肯定是全部由人工標(biāo)注，但（AI公司）老板們比起做個(gè)完美的模型，更在意成本。能用模型合成一個(gè)次優(yōu)版本，也是可以接受的?！?/p>

據(jù)Jackson估算，一次完整的微調(diào)和強(qiáng)化訓(xùn)練多則需要幾十萬條數(shù)據(jù)，而且模型還會(huì)更新迭代，數(shù)據(jù)的需求也會(huì)成倍累積。據(jù)他觀察，目前國內(nèi)的大模型團(tuán)隊(duì)有財(cái)力做人工數(shù)據(jù)標(biāo)注的只有幾家頂級大廠，其他團(tuán)隊(duì)大部分都是用別人的模型生成數(shù)據(jù)。

根據(jù)公開資料，字節(jié)跳動(dòng)在AI上的投入僅2024年就達(dá)到了800億，2025年這一數(shù)字還要翻番到1600億。今年2月，阿里巴巴集團(tuán)CEO吳泳銘宣布，未來三年，阿里將投入超3800億元用于建設(shè)云和AI硬件基礎(chǔ)設(shè)施。

但即便是這些頭部玩家，也必須在各環(huán)節(jié)精打細(xì)算。數(shù)據(jù)標(biāo)注作為成本可控的一環(huán)，被大廠選擇以外包、眾包的形式進(jìn)行，成為常態(tài)。

蘇打每天兼職的工作量大概在3-4個(gè)小時(shí)，她計(jì)算了一下時(shí)薪，也就30-60塊之間。蘇打說，這三四個(gè)小時(shí)必須全神貫注，一點(diǎn)水分也擠不出。這樣的一個(gè)付出和回報(bào)，如果不是對這個(gè)行業(yè)感興趣真的很難堅(jiān)持下來。

但蘇打所在的微信群每天還在不斷進(jìn)人?！澳悴桓?，有的是人肯干，價(jià)格自然上不去。”

問題的本質(zhì)不在于數(shù)據(jù)標(biāo)注不重要，而在于這類工作缺乏技術(shù)壁壘。大模型的生成、優(yōu)化是一個(gè)非常精細(xì)化的過程。每一條數(shù)據(jù)就好像是布玩偶身上的一個(gè)針腳、斑馬身上的一根毛發(fā)，很難辨析出其對于整體的意義。在這條流水線上，標(biāo)注師很難積累出個(gè)人能力上的“獨(dú)占優(yōu)勢”，非常容易被替代。

沒有壁壘，就難有議價(jià)能力。

從招聘網(wǎng)站公開信息來看，兼職數(shù)據(jù)標(biāo)注師日薪多在120-500元之間，外包崗位月薪大部分在9-17K之間。幾家大廠的正式崗位，月薪則在15-25K之間。相對技術(shù)崗和算法崗，這樣的薪資水平并不算高。

被自己訓(xùn)練的AI替代：誰能突破金字塔？

因?yàn)闆]有成長性，蘇打最終放棄了兼職，也不打算再投任何數(shù)據(jù)標(biāo)注相關(guān)的崗位。為此，她還專門咨詢了一位從事AI數(shù)據(jù)標(biāo)注多年的朋友。

這位朋友在大模型爆火之前，便加入了國內(nèi)的一家大模型團(tuán)隊(duì)，后來又跳槽去了另外一家大廠。朝陽行業(yè)、高薪崗位，很多人羨慕她踩中了風(fēng)口，但她勸蘇打慎重投遞這個(gè)崗位。因?yàn)閿?shù)據(jù)標(biāo)注師職業(yè)發(fā)展空間有限，很難跳進(jìn)AI產(chǎn)業(yè)真正的核心環(huán)節(jié)。

Jackson也持類似的觀點(diǎn)。

他用金字塔形容當(dāng)前AI從業(yè)者的階梯式分布：塔底是標(biāo)注，腰部是應(yīng)用，再往上是做微調(diào)和后訓(xùn)練，塔尖才是基礎(chǔ)模型設(shè)計(jì)和預(yù)訓(xùn)練。“現(xiàn)在基本上是背景決定一切，很難從塔底一層層向上突破?！?/p>

所謂的背景是指學(xué)歷和學(xué)術(shù)背景。譬如，很多崗位，學(xué)歷就是一個(gè)硬性門檻。Jackson分析，應(yīng)用層面需要本科學(xué)歷，微調(diào)和后訓(xùn)練階段碩士起步，基礎(chǔ)模型基本上都是博士。

就拿他所在的算法崗來說，找工作要看學(xué)歷、實(shí)習(xí)、比賽、論文若干個(gè)維度。AI圈尤其重視學(xué)術(shù)背景。如果沒有過硬的論文，即便是排名還不錯(cuò)的學(xué)校畢業(yè)，也很難進(jìn)入大廠的AI團(tuán)隊(duì)。

“站在金子塔尖的，大部分是頂級學(xué)校的博士，還需要發(fā)很多論文的那種?！彼偨Y(jié)。

與此同時(shí)，標(biāo)注師們訓(xùn)練出來的模型本身，在悄然和標(biāo)注師展開競爭。會(huì)不會(huì)被AI取代，成為懸在標(biāo)注師們頭上的達(dá)摩克利斯之劍。

Jackson指出，在一些成熟的文本模型中，模型合成的數(shù)據(jù)已經(jīng)替代了80%的人工標(biāo)注。這背后的邏輯是，模型不強(qiáng)時(shí)，對標(biāo)注的需求就大；標(biāo)注多了模型能力變強(qiáng)了，AI就會(huì)在這個(gè)任務(wù)或者這個(gè)領(lǐng)域把標(biāo)注師替代了。

在海外的一些高科技企業(yè)，這樣的情況已經(jīng)發(fā)生。

據(jù)彭博社報(bào)道，蘋果公司于2024年1月關(guān)閉了一個(gè)與Siri人工智能業(yè)務(wù)相關(guān)的團(tuán)隊(duì)。他們原本負(fù)責(zé)對用戶與Siri交互時(shí)產(chǎn)生的數(shù)據(jù)進(jìn)行監(jiān)聽分析、標(biāo)注和理解用戶需求。同樣因?yàn)樽詣?dòng)標(biāo)注能力大幅改善，2022年6月，特斯拉裁撤了200名為其標(biāo)注視頻以改進(jìn)輔助系統(tǒng)的美國員工。

另一方面，大廠戰(zhàn)略的變化，也影響著數(shù)據(jù)標(biāo)注師的職業(yè)前景。

2023年初，基礎(chǔ)大模型是所有科技巨頭競相投入的戰(zhàn)場，百度、字節(jié)、阿里、騰訊等大廠商高調(diào)押注自研大模型，數(shù)據(jù)標(biāo)注一度成為不可或缺的基礎(chǔ)崗位。

但進(jìn)入2024年，這場競賽明顯降溫。多家大廠陸續(xù)調(diào)整重心，開始從“造更大參數(shù)的模型”，轉(zhuǎn)向“讓模型真正落地”。

這一轉(zhuǎn)向，也直接影響到數(shù)據(jù)標(biāo)注這一基礎(chǔ)工種的崗位供給與預(yù)算安排。于是，用于支持基礎(chǔ)大模型訓(xùn)練的數(shù)據(jù)標(biāo)注需求可能被壓縮。未來企業(yè)需要的將不再是成千上萬“能標(biāo)數(shù)據(jù)的人”，而是“懂業(yè)務(wù)、懂模型的人”。

當(dāng)然，需求并未完全消失。一方面，Jackson解釋，隨著AI技術(shù)的發(fā)展、大模型進(jìn)一步落地將會(huì)產(chǎn)生大量的應(yīng)用場景。每當(dāng)有新的場景出現(xiàn)，就需要找人標(biāo)注數(shù)據(jù)。數(shù)據(jù)標(biāo)注的需求仍將長期、大量存在。另一方面，根據(jù)清華大學(xué)發(fā)布的《智能數(shù)據(jù)產(chǎn)業(yè)發(fā)展觀察報(bào)告》，2024年數(shù)據(jù)標(biāo)注產(chǎn)業(yè)有用工需求的企業(yè)從2023年的457家升至1195家。另據(jù)IDC數(shù)據(jù)測算，2025年中國人工智能基礎(chǔ)數(shù)據(jù)服務(wù)市場規(guī)模將突破120億元，2019-2025年年均復(fù)合增長率（CAGR）約為47%。

只不過，這些增長更多屬于“橫向增量”——也就是新場景帶來的數(shù)據(jù)標(biāo)注需求擴(kuò)容，而非“標(biāo)注師”作為工種本身的上升通道被打開。對絕大多數(shù)從業(yè)者而言，他們所做的，依然是為流水線打工。

已經(jīng)被AI“搶”過一次飯碗的廖仔對自己的職業(yè)未來充滿信心。

在來北京之前，廖仔在上海的一家設(shè)計(jì)公司做了兩年設(shè)計(jì)師。那時(shí)候，AI對于設(shè)計(jì)行業(yè)的沖擊已經(jīng)開始，廖仔所在的公司也不得不向AI轉(zhuǎn)型，決定做一個(gè)客服類大模型。他主動(dòng)請纓參與其中，這個(gè)AI項(xiàng)目為他打開了新世界大門。

后來，他從公司離職，對AI進(jìn)行了更為系統(tǒng)的學(xué)習(xí)。今年春節(jié)后，他入職了現(xiàn)在的公司。每天下班不管多晚，廖仔都會(huì)學(xué)習(xí)兩個(gè)小時(shí)AI相關(guān)的內(nèi)容，他還開了一個(gè)小紅書賬號(hào)“炸毛瘋兔”，記錄AI心得。

“凡事發(fā)生，皆有利于我?！痹诮涣鲿r(shí)，廖仔一再引用這句古語。

咖啡店的工作人員時(shí)不時(shí)會(huì)送來一些新品試吃，服務(wù)細(xì)致妥帖。而引人注目的咖啡機(jī)器人一下午并沒有沖調(diào)一杯咖啡。最起碼現(xiàn)階段，機(jī)器人對這家咖啡館而言，更多是一個(gè)裝飾品。盡管未來不可控，但人的主動(dòng)性始終是關(guān)鍵。

（文中廖仔、蘇打、Jackson皆為化名）

本文為轉(zhuǎn)載內(nèi)容，授權(quán)事宜請聯(lián)系原著作權(quán)人。

人工智能打工人

給AI打工的人，迷失在數(shù)據(jù)標(biāo)注里

AI數(shù)據(jù)標(biāo)注師的圍城內(nèi)外。

定焦One · 2025/06/13 10:28

圖片來源：界面圖庫

文 | 定焦One 陳丹

編輯 | 魏佳

北京798附近的一家咖啡館內(nèi)，AI數(shù)據(jù)標(biāo)注師廖仔在交談中一再提到店里的咖啡機(jī)器人。

如果時(shí)間回到三四年前，廖仔想不到機(jī)器人可以沖咖啡，也想不到自己會(huì)進(jìn)入AI賽道。

處在Gap期的蘇打也曾試圖進(jìn)入這個(gè)行業(yè)。

985碩士畢業(yè)的她此前工作一直順風(fēng)順?biāo)ツ暌驗(yàn)楦纤景l(fā)生矛盾離職后，進(jìn)入了漫長的職業(yè)空窗期。近半年來，蘇打也想過轉(zhuǎn)換賽道。當(dāng)下火熱的AI行業(yè)讓她心動(dòng)，數(shù)據(jù)標(biāo)注師曾被她視為職業(yè)轉(zhuǎn)型的方向之一。

但經(jīng)過一次兼職后，蘇打打消了這個(gè)念頭?！斑@就是一個(gè)純燒腦的體力勞動(dòng)，看不到任何上升的空間?！彼龑Α付ń筄ne」說道。

“擰螺絲”的三種姿勢：數(shù)據(jù)標(biāo)注師的隱秘分層

如果想要進(jìn)入AI行業(yè)，數(shù)據(jù)標(biāo)注或許是最沒有門檻的一個(gè)崗位——在網(wǎng)絡(luò)上隨手就能找到一份兼職。

每個(gè)計(jì)件視頻長度大概十來秒，需要辨別出顧客從自動(dòng)售貨機(jī)中拿走的商品種類以及數(shù)量。任務(wù)看似簡單，做起來卻并不容易。很多飲品、零食的包裝非常接近，加上夜晚光線干擾，極易誤判。「定焦One」嘗試標(biāo)注了20條視頻，用時(shí)25分鐘，完全正確的只有14條。

蘇打也在類似的一個(gè)微信群里。

蘇打通過篩選后，也被拉到了一個(gè)微信群。同樣的，在正式接單之前，需要先進(jìn)行培訓(xùn)和測試。

據(jù)蘇打觀察，她所在群里測試的通過率并不高。

“這份工作的難點(diǎn)是記憶、理解的成本特別高。在標(biāo)注之前，你得先理解、記住他們的評價(jià)體系和打分標(biāo)準(zhǔn)?！备屘K打難受的是，這些標(biāo)準(zhǔn)并不是固定不變的。有時(shí)候，面對相似的問題和回答，她用相同的思考方式去打分，結(jié)果卻截然相反。

比蘇打幸運(yùn)一些，廖仔沒有這些嚴(yán)苛的KPI和考核標(biāo)準(zhǔn)。

尷尬的崗位：重要，但是廉價(jià)

站在產(chǎn)業(yè)鏈更上游的Jackson，能從更為完整的流水線上審視數(shù)據(jù)標(biāo)注的意義。

數(shù)據(jù)標(biāo)注師主要介入的，是后兩個(gè)階段。

強(qiáng)化階段（Reinforcement Learning from Human Feedback，簡稱RLHF）的核心是利用人類偏好數(shù)據(jù)優(yōu)化模型輸出質(zhì)量。

但蘇打所在的微信群每天還在不斷進(jìn)人?！澳悴桓?，有的是人肯干，價(jià)格自然上不去?！?/p>

沒有壁壘，就難有議價(jià)能力。

被自己訓(xùn)練的AI替代：誰能突破金字塔？

Jackson也持類似的觀點(diǎn)。

他用金字塔形容當(dāng)前AI從業(yè)者的階梯式分布：塔底是標(biāo)注，腰部是應(yīng)用，再往上是做微調(diào)和后訓(xùn)練，塔尖才是基礎(chǔ)模型設(shè)計(jì)和預(yù)訓(xùn)練?！艾F(xiàn)在基本上是背景決定一切，很難從塔底一層層向上突破?！?/p>

“站在金子塔尖的，大部分是頂級學(xué)校的博士，還需要發(fā)很多論文的那種?！彼偨Y(jié)。

在海外的一些高科技企業(yè)，這樣的情況已經(jīng)發(fā)生。

另一方面，大廠戰(zhàn)略的變化，也影響著數(shù)據(jù)標(biāo)注師的職業(yè)前景。

但進(jìn)入2024年，這場競賽明顯降溫。多家大廠陸續(xù)調(diào)整重心，開始從“造更大參數(shù)的模型”，轉(zhuǎn)向“讓模型真正落地”。

已經(jīng)被AI“搶”過一次飯碗的廖仔對自己的職業(yè)未來充滿信心。

“凡事發(fā)生，皆有利于我?！痹诮涣鲿r(shí)，廖仔一再引用這句古語。

（文中廖仔、蘇打、Jackson皆為化名）

本文為轉(zhuǎn)載內(nèi)容，授權(quán)事宜請聯(lián)系原著作權(quán)人。

歷史搜索全部刪除

熱門搜索

給AI打工的人，迷失在數(shù)據(jù)標(biāo)注里

“擰螺絲”的三種姿勢：數(shù)據(jù)標(biāo)注師的隱秘分層

尷尬的崗位：重要，但是廉價(jià)

被自己訓(xùn)練的AI替代：誰能突破金字塔？

評論

給AI打工的人，迷失在數(shù)據(jù)標(biāo)注里

“擰螺絲”的三種姿勢：數(shù)據(jù)標(biāo)注師的隱秘分層

尷尬的崗位：重要，但是廉價(jià)

被自己訓(xùn)練的AI替代：誰能突破金字塔？

給AI打工的人，迷失在數(shù)據(jù)標(biāo)注里

“擰螺絲”的三種姿勢：數(shù)據(jù)標(biāo)注師的隱秘分層

尷尬的崗位：重要，但是廉價(jià)

被自己訓(xùn)練的AI替代：誰能突破金字塔？

評論

給AI打工的人，迷失在數(shù)據(jù)標(biāo)注里

“擰螺絲”的三種姿勢：數(shù)據(jù)標(biāo)注師的隱秘分層

尷尬的崗位：重要，但是廉價(jià)

被自己訓(xùn)練的AI替代：誰能突破金字塔？

被自己訓(xùn)練的AI替代：誰能突破金字塔？

給AI打工的人，迷失在數(shù)據(jù)標(biāo)注里

尷尬的崗位：重要，但是廉價(jià)

被自己訓(xùn)練的AI替代：誰能突破金字塔？