今年初,智能對話(huà)機器人模型ChatGPT引發(fā)了全球范圍的人工智能熱潮。面對這波浪潮,國內的科技公司,尤其是搜索引擎領(lǐng)域的巨頭們紛紛加入,相繼發(fā)布自己的大模型。
作為國內第二大搜索引擎廠(chǎng)商,360近期就官宣發(fā)布了360GPT產(chǎn)品矩陣“智腦”,成為針對搜索場(chǎng)景,國內較先推出的應用GPT技術(shù)的新一代智能搜索。
據了解,該產(chǎn)品已正式開(kāi)放產(chǎn)品內測。隨著(zhù)越來(lái)越多的場(chǎng)景應用,人工智能將帶來(lái)哪些新的生產(chǎn)力變革?但可以確定的是,人工智能真正走進(jìn)我們工作生活的時(shí)代已經(jīng)正式開(kāi)啟。
1.生產(chǎn)力迎來(lái)大變革時(shí)代,360落地新搜索應用
隨著(zhù)微軟將ChatGPT與Bing的融合,讓搜索引擎成為生產(chǎn)力改造的前沿陣地。
這種結合讓搜索引擎迎來(lái)了全新的發(fā)展方向,而ChatGPT正改變著(zhù)信息生產(chǎn)、組織和獲取的方式。對此,我們與360相關(guān)業(yè)務(wù)的技術(shù)負責人張向征聊了聊,他表示,ChatGPT的出現證明了通過(guò)“大模型+搜索引擎”可以讓AI實(shí)現以往無(wú)法企及的 “智能”。這將對搜索行業(yè)產(chǎn)生深遠的影響,甚至引發(fā)生產(chǎn)力的變革。
在國內,有資格進(jìn)行相關(guān)探索的公司不多。
360作為國內第二大搜索引擎廠(chǎng)商,憑借多年的數據、算力和工程能力,以及在人工智能領(lǐng)域的深厚積淀,前不久推出了自研的360GPT產(chǎn)品矩陣“智腦”,同時(shí)也是頭一批落地到搜索應用產(chǎn)品中,引起了業(yè)界的普遍關(guān)注。
傳統的搜索一般是以網(wǎng)頁(yè)鏈接形式為結果,用戶(hù)需要自己一個(gè)個(gè)翻找鏈接,進(jìn)入網(wǎng)頁(yè)尋找答案。而結合了360GPT能力的360新搜索可以通過(guò)問(wèn)答的形式,根據用戶(hù)提出的問(wèn)題直接生產(chǎn)內容。
針對“為什么淄博燒烤突然火了?”這個(gè)當下的熱點(diǎn)話(huà)題,很快就給出了答案。列出了淄博燒烤最新的社會(huì )事件,還提煉分析直接給出了結論。不僅如此,回答中還顯示了援引來(lái)源,可以供用戶(hù)溯源確認??梢钥吹降氖?,360新搜索的問(wèn)答更符合人的自然表達,生成的內容也遠比傳統搜索更直接、更豐富。
究其原因,張向征介紹說(shuō):“我們一直把理解用戶(hù)目的、便捷用戶(hù)使用當成了重要的產(chǎn)品研發(fā)方向,基于360GPT的新搜索擁有更強大的閱讀理解能力?!?/p>
另一方面,人工智能相關(guān)內容的生產(chǎn)離不開(kāi)真實(shí)可靠的信息。通過(guò)聯(lián)網(wǎng)搜索能力,實(shí)現了于全網(wǎng)信息的高效互聯(lián),及時(shí)獲得準確、有效的信息,再憑借生成式大語(yǔ)言模型對信息的提煉、總結和生成能力,快速給出兼具時(shí)效性和可讀性的答案。
“大模型+搜索引擎兩者融合的產(chǎn)品更像用戶(hù)的個(gè)人助手,交互模式會(huì )更多樣,能力邊界也會(huì )顯著(zhù)擴大”。張向征透露,以用戶(hù)需求為出發(fā)點(diǎn),360GPT還將與瀏覽器、數字助理、蘇打辦公、智能營(yíng)銷(xiāo)等場(chǎng)景應用深度結合,為用戶(hù)提供多元化的智能服務(wù)。
2、多年布局人工智能,技術(shù)場(chǎng)景“兩翼齊飛”
早在2015年深度學(xué)習技術(shù)風(fēng)靡時(shí),人工智能就已是搜索行業(yè)變革的重要推動(dòng)力。
2017年,NLP領(lǐng)域劃時(shí)代的Transformer算法誕生。沿著(zhù)Transformer的路徑,GPT、BERT等新技術(shù),將機器視覺(jué)領(lǐng)域的訓練方式用于自然語(yǔ)言領(lǐng)域,實(shí)現了“智能化”的進(jìn)一步升級。
對比GPT與BERT來(lái)看,GPT是一個(gè)單向模型,更擅長(cháng)“寫(xiě)作文”,而B(niǎo)ERT是雙向模型,可以聯(lián)系上下文進(jìn)行分析,更擅長(cháng)“完形填空”。因此,相比較于GPT,對于圍繞已存在內容展開(kāi)業(yè)務(wù)的搜索引擎行業(yè)來(lái)說(shuō),BERT是更常用的模型。
BERT和GPT模型結構對比(來(lái)源:BERT論文)
而ChatGPT的出現帶來(lái)了技術(shù)路線(xiàn)的大變動(dòng)。
張向征表示,人工智能技術(shù)一直是360搜索不斷進(jìn)化的關(guān)鍵,ChatGPT作為一種新形式的后端變革,將影響后續搜索引擎底層技術(shù)的調研和技術(shù)的應用方式。
他介紹道,2015年,360搜索就開(kāi)始用深度學(xué)習模型進(jìn)行搜索的召回、排序以及Query意圖識別等關(guān)鍵環(huán)節。之后,360搜索又開(kāi)始使用多模態(tài)檢索模型,來(lái)多元化搜索形態(tài),適應圖片搜索等新需求。
到2019年,360搜索完成了對BERT模型的初版應用,2020年完成BERT的全流量在線(xiàn)部署和應用。此時(shí),360搜索已經(jīng)開(kāi)始做“閱讀理解”。不同于僅提供鏈接,針對某些已經(jīng)有明確答案的問(wèn)題,360搜索可以抽取精準答案所對應的段落和句子,并直接展示在搜索頁(yè)。
“也正是這些探索打下的基礎,今天我們才有了自己的生成式大語(yǔ)言模型和產(chǎn)品矩陣‘智腦’”。張向征這樣說(shuō)。
眾所周知,搜索引擎的核心是底層的技術(shù)能力以及優(yōu)質(zhì)的內容和服務(wù)。因此,搜索引擎未來(lái)的產(chǎn)品形態(tài)、交互模式、展現方式等都將基于其核心能力,再根據用戶(hù)的習慣和偏好不斷變化。未來(lái)的搜索引擎將形成全新的入口,搜索能力會(huì )繼續存在,并承擔相應的后臺支持功能。
人類(lèi)獲取信息的方式的變革蘊含著(zhù)巨大的機會(huì )??梢韵胍?jiàn),基于360GPT的新一代的智能搜索引擎將承載更多的用戶(hù)使用場(chǎng)景,也將迎來(lái)更大的想象空間。
3.“未來(lái)搜索引擎”已至,360搜索的底氣從何而來(lái)?
據了解,從2012年成立之初,360搜索就以其獨特的產(chǎn)品和技術(shù)實(shí)力,構筑起了差異化的市場(chǎng)定位。
依托于360集團,360搜索在安全層面積累深厚。借助于旗下產(chǎn)品對于病毒、釣魚(yú)網(wǎng)站等的識別與攔截能力,360搜索可以及時(shí)過(guò)濾風(fēng)險,為用戶(hù)打造更安全、穩定的上網(wǎng)環(huán)境。
另一方面,隨著(zhù)各種垂直平臺的興起,互聯(lián)網(wǎng)內容開(kāi)始“孤島化”。作為全網(wǎng)搜索平臺,360搜索始終堅持開(kāi)放的發(fā)展策略。
360搜索一直以來(lái)都重視對內容生態(tài)的建設。目前,360已經(jīng)與多個(gè)內容平臺達成合作,所有內容提供方均參與收入分成,逐步形成了互惠共享的生態(tài)環(huán)境。
此外,360搜索還在搜索的數據、算法、工程化能力以及服務(wù)接口對內對外雙向賦能,更大范圍地觸達用戶(hù)群體。
對內,360推出的日歷等訂閱產(chǎn)品,就融合了360搜索的功能,用戶(hù)一鍵訂閱,就能實(shí)時(shí)收到最新的信息更新。對外,360搜索入局SaaS業(yè)務(wù),通過(guò)為某些垂直領(lǐng)域的搜索平臺提供SaaS化的接口,來(lái)輸出其全網(wǎng)搜索能力。
與此同時(shí),360搜索也在持續加筑自身護城河,緊隨GPT大語(yǔ)言模型,360搜索借助其人工智能技術(shù)的積累,利用360“智腦”探索產(chǎn)品邊界,推出新一代智能搜索。
業(yè)界有一個(gè)普遍的共識,那就是ChatGPT的性能卓越主要源于其預訓練模型參數量巨大,人工反饋為主的標注強化學(xué)習手段,以及先進(jìn)的思維模式訓練方法。從GPT-1到GPT-3,模型訓練的參數量呈千倍增長(cháng),已達到接近2000億的量級。在數據量達標,用大模型把知識容量、基礎通用能力做的足夠高之后,大模型研發(fā)就要面臨工程落地環(huán)節。這需要耗費巨大的訓練和推理成本,也是“英雄折戟”之地。
模型規模不等于符合實(shí)際需要,為了避免無(wú)意義回答,還要為人工智能加上“傾向性”,這就用到RLHF新技術(shù),即基于人類(lèi)反饋的強化學(xué)習,通過(guò)人工標注來(lái)加入方向性引導。最后,思維訓練也是人工智能的一部分,要使其具備推理能力,能進(jìn)行高度擬人化的多輪對話(huà)。
除了以上難點(diǎn),GPT大語(yǔ)言模型要真正落地,還要結合對實(shí)際業(yè)務(wù)的理解。這將是一個(gè)逐步改進(jìn),不斷摸索的過(guò)程。
在巨大的壁壘面前,360有著(zhù)“先天優(yōu)勢”,360搜索的內容涵蓋全網(wǎng)數據,抓取過(guò)的網(wǎng)頁(yè)數已達上萬(wàn)億,現存網(wǎng)頁(yè)數達數千億,索引的網(wǎng)頁(yè)達數百億,這能為技術(shù)開(kāi)發(fā)提供足夠多的語(yǔ)料。
從數據多樣性上來(lái)看,360搜索不局限于某一類(lèi)別的數據,而是對電商、新聞、小說(shuō)、問(wèn)答、百科等各類(lèi)數據均有覆蓋,保證了數據集的完整度。
360搜索基于圖像AI識別能力推出了“圖查查”平臺
文本數據之外,360搜索還利用多模態(tài)搜索技術(shù),通過(guò)識別文本和圖像間的映射關(guān)系,將語(yǔ)料信息延伸到更豐富的形態(tài)中。
據了解,360搜索已經(jīng)積累了數百億的圖片信息。2022年,360搜索還聯(lián)合360人工智能研究院與清華大學(xué),推出了中文圖文跨模態(tài)數據集Zero和圖文跨模態(tài)預訓練框架R2D2。
其中,Zero包括兩個(gè)預訓練數據集和五個(gè)下游任務(wù)數據集,預訓練數據集包括2300萬(wàn)和230萬(wàn)兩個(gè)版本,該數據集也是國內開(kāi)源的首個(gè)中文圖文跨模態(tài)領(lǐng)域數據集。
360搜索聯(lián)合360人工智能研究院、清華大學(xué)推出的中文圖文跨模態(tài)數據集Zero
當然,僅有大規模數據集還遠遠不夠。要形成有效的語(yǔ)料集,對各類(lèi)信息進(jìn)行篩選和清理同樣重要,這就需要扎實(shí)的人工智能工程能力。
張向征表示,任何人工智能技術(shù)的落地都離不開(kāi)工程能力,也就是讓人工智能技術(shù)以低成本、高效率的方式落地實(shí)施的能力。
基于多年深耕,360內部在模型訓練平臺、預訓練語(yǔ)言模型等方面,已經(jīng)積累了豐富的經(jīng)驗,能為GPT大語(yǔ)言模型的開(kāi)發(fā)提供良好的工程支持,有效降低訓練推理和業(yè)務(wù)落地的成本。
早在幾年前,360搜索就已經(jīng)把所有的底層文檔,以向量形式表達,能快速鎖定、提取內容,進(jìn)一步提高檢索和篩選的效率。同時(shí),結合用戶(hù)的搜索反饋,360搜索能有效判斷不同信息的重要性,進(jìn)一步提高語(yǔ)料集的質(zhì)量。
此外,人工智能的持續商業(yè)化落地,也離不開(kāi)充足算力的支持。360內部部署的數萬(wàn)臺服務(wù)器、數百臺GPU,已成為相關(guān)研究所需算力的有力支撐。
從數據到算力,再到工程能力,正是360集團一直以來(lái)對人工智能的重視,形成了今天360搜索探索未來(lái)搜索引擎的充足底氣。
4、從基礎研究到上層應用,360集團奔向人工智能的“星辰大?!?/strong>
平行于360搜索,360集團設立了360人工智能研究院。
據了解,360人工智能研究院專(zhuān)門(mén)進(jìn)行人工智能基礎模型和前瞻性技術(shù)的研究,現階段主要聚焦于研發(fā)業(yè)界領(lǐng)先的計算機視覺(jué)、深度自然語(yǔ)言理解,語(yǔ)音語(yǔ)義交互等人工智能技術(shù),再將研究成果應用于智慧物聯(lián)網(wǎng)(IOT)、智能安全大數據,互聯(lián)網(wǎng)信息分發(fā)等多種場(chǎng)景。
其研究范圍涵蓋人工智能各主要領(lǐng)域,申請專(zhuān)利數接近400件。團隊核心成員還曾于2017年在有“計算機視覺(jué)屆世界杯”之稱(chēng)的ImageNet比賽中獲得兩項冠軍,并刷新了谷歌、微軟保持的世界紀錄。在2019-2021年的中國人工智能大賽中,360人工智能研究院更是取得3連冠。
此外,團隊還參與了國家級重點(diǎn)大數據工程實(shí)驗室和國家新一代人工智能創(chuàng )新發(fā)展試驗區開(kāi)放實(shí)驗室的建設,其主導項目也已入選“科技部科技創(chuàng )新2030項目”和“吳文俊人工智能科技進(jìn)步獎”。
張向征表示,人工智能研究院主要提供底層研究支持,360搜索在內的各業(yè)務(wù)部門(mén),則負責將人工智能與業(yè)務(wù)場(chǎng)景相結合,同時(shí)將實(shí)踐結果反饋給研究院,形成了基礎研究到上層應用的生態(tài)閉環(huán)。
目前,360已經(jīng)搭建起了數百人的人工智能研發(fā)團隊,并廣招人工智能人才,每年的研發(fā)投入也均以?xún)|級計算。
接下來(lái),360搜索將與360人工智能研究院緊密合作,不斷強化新一代搜索引擎的能力邊界,不斷探索人工智能技術(shù)在瀏覽器、數字助理、蘇打辦公、智能營(yíng)銷(xiāo)等多場(chǎng)景的應用結合,奔向GPT大語(yǔ)言模型的“星辰大?!?。
本文標題: 360搜索在人工智能時(shí)代何去何從
本文地址: http://www.guizhouboda.com/brand/news-38330b793b.html
內容均來(lái)源于網(wǎng)絡(luò ),錯誤糾正或刪除請發(fā)郵件,收件郵箱kefu@huangye88.com
2009-2025 黃頁(yè)88版權所有 京ICP備2023012932號-1 │ 京公網(wǎng)安備 11010802023561號 京ICP證100626
內容均來(lái)源于網(wǎng)絡(luò ),錯誤糾正或刪除請發(fā)郵件,收件郵箱kefu@huangye88.com