打開(kāi)電腦,將采集的風(fēng)聲、雨聲、溪流聲等聲音數據輸入,“清洗”掉夾雜其間的噪音,對助聽(tīng)器數據模型進(jìn)行“訓練”,測試模型在真實(shí)場(chǎng)景的靈敏度……伴隨著(zhù)手指敲擊鍵盤(pán)的“啪嗒啪嗒”聲,騰訊天籟實(shí)驗室人工智能訓練師付聰一天的工作就此開(kāi)始。
近幾年,隨著(zhù)人工智能技術(shù)不斷發(fā)展,這個(gè)被稱(chēng)為人工智能訓練師的職業(yè)逐漸壯大。作為“數字職業(yè)”之一,人工智能訓練師的出現,加速了人工智能由技術(shù)研發(fā)走向行業(yè)應用的過(guò)程,將產(chǎn)生較高的經(jīng)濟價(jià)值和社會(huì )價(jià)值。
為模型不斷“喂”數據
每次出門(mén)時(shí),付聰總會(huì )在耳朵上戴一個(gè)大“耳環(huán)”。
這個(gè)“耳環(huán)”其實(shí)是一個(gè)測試版的助聽(tīng)器?!岸h(huán)”里的聲音各式各樣,有呼呼的噪聲,有尖銳刺耳的吵鬧聲……這些經(jīng)過(guò)助聽(tīng)器放大后產(chǎn)生的噪聲,是很多佩戴助聽(tīng)器的聽(tīng)障人士長(cháng)期面臨的困擾。
付聰和他的團隊正在嘗試利用算法設計、通過(guò)人工智能技術(shù)“訓練”數據模型,讓助聽(tīng)器更加“智慧”地降低噪聲,讓聽(tīng)障人群聽(tīng)得清、聽(tīng)得懂、聽(tīng)得舒服。
付聰解釋說(shuō),助聽(tīng)器數據模型很小,因此需要針對不同場(chǎng)景進(jìn)行優(yōu)化,很多場(chǎng)景充滿(mǎn)挑戰,“比如一個(gè)聽(tīng)障人士在餐廳吃飯,周?chē)泻芏嗳苏f(shuō)話(huà),他想跟對面的人聊天,四周聲音特別嘈雜,作為一個(gè)正常人都可能聽(tīng)不清楚,更何況一個(gè)有聽(tīng)力障礙的人?我們希望利用模型,把需要的聲音提取出來(lái),降低噪聲,幫助更多聽(tīng)障人群”。
理想很豐滿(mǎn),但是實(shí)際的模型算法研發(fā)過(guò)程卻像是一場(chǎng)反復進(jìn)行的“戰役”。
模型的研發(fā)過(guò)程大致分為以下幾步:數據采集、數據“清洗”、模型訓練、場(chǎng)景測試、調整算法,經(jīng)過(guò)幾次迭代之后再測試、調整,“如果測試結果不理想,需要把這個(gè)過(guò)程再走一遍,直到得到最優(yōu)效果”。付聰說(shuō)。
數據采集要有針對性。為了讓模型更“聰明”,需要針對不同場(chǎng)景采集各種特殊數據。付聰和團隊成員不僅需要到早晚高峰的地鐵、熱鬧喧天的餐廳、人來(lái)人往的馬路等場(chǎng)景,采集數百個(gè)小時(shí)的聲音數據,還要戴上助聽(tīng)器體驗這些聲音的差別,“比如風(fēng)聲,正常人聽(tīng)到是呼呼聲,但戴上助聽(tīng)器以后,是很吵的噗噗聲,像是去KTV唱歌,聲音使勁砸到麥克風(fēng)上”。道路騎行、海邊風(fēng)浪……為了采集各種風(fēng)噪數據,付聰錄制了多種場(chǎng)景的風(fēng)聲。
數據“清洗”是將不需要的數據“洗掉”。付聰舉了一個(gè)例子——風(fēng)聲,真實(shí)場(chǎng)景下會(huì )夾雜汽車(chē)鳴笛、人交談等聲音。在整理時(shí)要把這些數據剔除出來(lái),保留一個(gè)比較純粹的風(fēng)聲,這樣模型才會(huì )“認識”風(fēng)。
模型訓練是將“清洗”好的數據“喂”給模型。除了采集的特殊數據,付聰和他的同事們還會(huì )加入諸如世界各國的語(yǔ)言和一些非語(yǔ)音聲音等數據,“基本涵蓋了人們生活中遇到的所有噪聲和語(yǔ)音”。
和人類(lèi)不同,人工智能模型在訓練過(guò)程中,不會(huì )疲憊、煩躁、發(fā)脾氣,它們的“智慧”取決于模型參數、訓練策略、數據量等?!八鼈兙拖褚粋€(gè)‘孩子’,會(huì )越來(lái)越‘聰明’,識別到越來(lái)越多的聲音,我特別有成就感?!备堵斦f(shuō)。
考驗耐心、細致和忍受力
模型訓練完成后,并不意味立刻能應用到聽(tīng)障人群的助聽(tīng)器上,還要經(jīng)歷較長(cháng)時(shí)間的迭代、調整過(guò)程。
比如,為了讓聽(tīng)障人群適配到合適的助聽(tīng)器,傳統方式是患者反復到線(xiàn)下的驗配店去試戴,過(guò)程繁雜。付聰解釋說(shuō),一般情況下,根據發(fā)病原因不同可以將聽(tīng)力下降分為三類(lèi):感音神經(jīng)性、傳導性、混合性耳聾;根據聽(tīng)力下降的程度不同,分為輕度、中度、重度及極重度耳聾。針對不同的類(lèi)型,助聽(tīng)器的適配方式有所不同。
有沒(méi)有可能把適配過(guò)程搬到“線(xiàn)上”,利用人工智能算法和深度學(xué)習能力,讓聽(tīng)障人群在線(xiàn)上就能做準確的聽(tīng)力驗配?帶著(zhù)這個(gè)疑問(wèn),付聰開(kāi)始研發(fā)適配算法。他將這個(gè)過(guò)程比喻為做應用題,需要查詢(xún)國內外文獻、檢索現有方案,根據具體的使用環(huán)境,利用現有知識開(kāi)展合理想象、設計實(shí)驗、尋找答案。
這個(gè)過(guò)程考驗人工智能訓練師的耐心、細致。在測試助聽(tīng)器音質(zhì)時(shí),不同的佩戴方式,對應不同的測試結果。付聰和同事需要以“N×N”排列組合設計不同的佩戴方式,并且不斷重復試驗,來(lái)研究其對音質(zhì)產(chǎn)生的影響。
這個(gè)過(guò)程十分考驗人工智能訓練師的忍受力?!耙粋€(gè)人工智能訓練師的基本素養,就是強迫自己聽(tīng)很多次刺耳的聲音?!备堵敱硎?,這是因為訓練師需要定量衡量聽(tīng)障患者能正常聽(tīng)到的聲音極限點(diǎn),而這些聲音的分貝數是正常人耳難以忍受的,“很多時(shí)候恨不得把耳機摔掉。經(jīng)過(guò)一天測試,整個(gè)腦袋都感覺(jué)疼”。
經(jīng)過(guò)不斷迭代、調整,內置了算法的助聽(tīng)器終于完成了。最讓付聰難忘的是他們第一次到廣東韶關(guān)捐贈產(chǎn)品,他們把助聽(tīng)器挨個(gè)交到聽(tīng)障老人手上,開(kāi)機、戴設備、調整增益……“雖然我對模型很有信心,但當時(shí)還是感覺(jué)心提到了嗓子眼,因為在此之前,老人們是無(wú)法正常交流的?!备堵斦f(shuō)。
他小心地詢(xún)問(wèn)一個(gè)老人:“您能聽(tīng)到我在說(shuō)什么嗎?”
“可以了?!崩先司徛謭远ǖ貜目谥姓f(shuō)出3個(gè)字。
“那時(shí)候我覺(jué)得,我們做的這個(gè)事情挺有意義的?!备堵斦f(shuō)。
用技術(shù)解決人類(lèi)需求
人工智能訓練師是一個(gè)需要忍受孤獨的職業(yè),因為他們大量的時(shí)間是在設計方案、寫(xiě)代碼、采集數據、訓練模型中度過(guò)的。
“我戰勝孤獨的秘密是興趣?!备堵數膶?zhuān)業(yè)是通信,其中很多課程和信號處理相關(guān),他平時(shí)比較喜歡音樂(lè ),因此就將自己的興趣和專(zhuān)業(yè)、工作結合起來(lái),聚焦音頻領(lǐng)域,大學(xué)畢業(yè)后參與了很多有關(guān)音頻信號處理的工作,經(jīng)歷了音頻算法從傳統算法到人工智能算法,再到大規模深度學(xué)習的各個(gè)階段。
在付聰看來(lái),人工智能技術(shù)是一個(gè)很好的工具,目的是將人類(lèi)從很多腦力勞動(dòng)中解放出來(lái),用規?;姆绞饺ヌ娲壳俺杀据^高的個(gè)體勞動(dòng)。對整個(gè)社會(huì )而言,這是一種生產(chǎn)力的進(jìn)步,有著(zhù)巨大的社會(huì )價(jià)值和商業(yè)價(jià)值。
成熟的人工智能技術(shù)是什么樣?付聰認為需要經(jīng)過(guò)3個(gè)階段:一是感知智能,核心在于模擬人的視覺(jué)、聽(tīng)覺(jué)和觸覺(jué)等感知能力,比如人臉識別、語(yǔ)音識別等;二是認知智能,具有人類(lèi)思維理解、知識共享、行動(dòng)協(xié)同或博弈等特征,“能夠真正理解人在說(shuō)什么,根據一些提示,提供相對完整的回答”;三是行為智能,也就是像自動(dòng)駕駛一樣,真正可以在物理世界發(fā)揮作用。
達到這樣的目標,需要對人工智能模型不斷進(jìn)行訓練。付聰表示,首先需要針對問(wèn)題準備足夠多的數據,“多到盡量涵蓋解決這個(gè)問(wèn)題時(shí)所遇到的所有情形”;其次需要設計很好的算法,并根據用戶(hù)反饋不斷優(yōu)化。
“人工智能技術(shù)領(lǐng)域日新月異,要求人工智能訓練師有廣闊的視野、深厚的人文情懷和社會(huì )責任感,用業(yè)界最新想法、理念和正確的倫理觀(guān)來(lái)幫助人類(lèi)解決生產(chǎn)生活中遇到的問(wèn)題?!备堵斦f(shuō)。
本文標題: 人工智能訓練師是干什么的
本文地址: http://www.guizhouboda.com/brand/news-8a3gge9877.html
內容均來(lái)源于網(wǎng)絡(luò ),錯誤糾正或刪除請發(fā)郵件,收件郵箱kefu@huangye88.com
2009-2025 黃頁(yè)88版權所有 京ICP備2023012932號-1 │ 京公網(wǎng)安備 11010802023561號 京ICP證100626
內容均來(lái)源于網(wǎng)絡(luò ),錯誤糾正或刪除請發(fā)郵件,收件郵箱kefu@huangye88.com