近日,據(jù)外媒報(bào)道,蘋果公司計(jì)劃關(guān)閉位于圣地亞哥的一個與Siri人工智能(AI)業(yè)務(wù)相關(guān)的團(tuán)隊(duì)。
該團(tuán)隊(duì)的核心職能在于對用戶與Siri交互時(shí)產(chǎn)生的數(shù)據(jù)進(jìn)行監(jiān)聽分析,通過標(biāo)注和理解用戶需求來不斷優(yōu)化和完善Siri的功能表現(xiàn),根據(jù)知情人士透露,這次裁員可能會導(dǎo)致121人失業(yè)。
作為人工智能和機(jī)器學(xué)習(xí)領(lǐng)域的一個關(guān)鍵環(huán)節(jié),數(shù)據(jù)標(biāo)注是對原始的、未標(biāo)記的數(shù)據(jù)集進(jìn)行人工處理,使其轉(zhuǎn)化為可用于模型訓(xùn)練的有效輸入。
蘋果此次裁員受影響的員工可能包括數(shù)據(jù)標(biāo)注員,對于Siri這樣的智能語音助手而言,數(shù)據(jù)標(biāo)注員需要對大量的語音數(shù)據(jù)進(jìn)行人工審核、語音片段標(biāo)注以及語義理解標(biāo)注,以此來訓(xùn)練和提升Siri理解和回應(yīng)各種語言及方言的能力。
由于大規(guī)模的數(shù)據(jù)集需要進(jìn)行標(biāo)注工作,且技術(shù)門檻相對較低,這使得數(shù)據(jù)標(biāo)注是一個人力密集型行業(yè),目前數(shù)據(jù)標(biāo)注員主要分布在人力成本相對較低的地區(qū),比如非洲、東南亞、印度以及國內(nèi)的二、三線城市。
據(jù)國內(nèi)媒體報(bào)道,中國的數(shù)據(jù)標(biāo)注員隊(duì)伍龐大,全國從事這項(xiàng)工作的人大概超過千萬,很多頭部的互聯(lián)網(wǎng)技術(shù)企業(yè)都有自己的數(shù)據(jù)標(biāo)注團(tuán)隊(duì)或與第三方數(shù)據(jù)標(biāo)注公司合作。
ChatGPT技術(shù)
不過隨著深度學(xué)習(xí)和自動化技術(shù)在人工智能領(lǐng)域的快速發(fā)展,部分原本依賴于人工的數(shù)據(jù)標(biāo)注工作正逐步被AI自動化標(biāo)注取代。
例如,ChatGPT在技術(shù)上能夠?qū)崿F(xiàn)自動化標(biāo)注并且極大降低了單個標(biāo)注任務(wù)的成本,有數(shù)據(jù)顯示其平均每個標(biāo)注的成本低于0.003美元,比人工標(biāo)注平臺便宜約20倍。
去年9月,AI初創(chuàng)公司refuel就發(fā)布了一款名為Autolabel的開源工具,這款工具專注于數(shù)據(jù)標(biāo)注領(lǐng)域,采用GPT-4等主流模型,來高效處理和標(biāo)注各類數(shù)據(jù)集。
相較于傳統(tǒng)的人工標(biāo)注方式,AI自動化標(biāo)注在效率上實(shí)現(xiàn)了顯著提升,極大地減少人工時(shí)間消耗,并有助于降低人工智能項(xiàng)目開發(fā)過程中的成本,部分原本依賴人工的標(biāo)注任務(wù)也將逐步實(shí)現(xiàn)智能化和規(guī)模化處理,AI自動化標(biāo)注正在改變數(shù)據(jù)標(biāo)注行業(yè)的面貌。