Hi,歡迎來到黃頁88網(wǎng)!
當前位置:首頁 > 搜索引擎 > 360搜索在人工智能時代何去何從

360搜索在人工智能時代何去何從

互聯(lián)網(wǎng)時間: 2023-07-11 15:19:58

今年初,智能對話機器人模型ChatGPT引發(fā)了全球范圍的人工智能熱潮。面對這波浪潮,國內的科技公司,尤其是搜索引擎領域的巨頭們紛紛加入,相繼發(fā)布自己的大模型。

作為國內第二大搜索引擎廠商,360近期就官宣發(fā)布了360GPT產品矩陣“智腦”,成為針對搜索場景,國內較先推出的應用GPT技術的新一代智能搜索。

據(jù)了解,該產品已正式開放產品內測。隨著越來越多的場景應用,人工智能將帶來哪些新的生產力變革?但可以確定的是,人工智能真正走進我們工作生活的時代已經正式開啟。 

1.生產力迎來大變革時代,360落地新搜索應用

隨著微軟將ChatGPT與Bing的融合,讓搜索引擎成為生產力改造的前沿陣地。

這種結合讓搜索引擎迎來了全新的發(fā)展方向,而ChatGPT正改變著信息生產、組織和獲取的方式。對此,我們與360相關業(yè)務的技術負責人張向征聊了聊,他表示,ChatGPT的出現(xiàn)證明了通過“大模型+搜索引擎”可以讓AI實現(xiàn)以往無法企及的 “智能”。這將對搜索行業(yè)產生深遠的影響,甚至引發(fā)生產力的變革。

在國內,有資格進行相關探索的公司不多。

360作為國內第二大搜索引擎廠商,憑借多年的數(shù)據(jù)、算力和工程能力,以及在人工智能領域的深厚積淀,前不久推出了自研的360GPT產品矩陣“智腦”,同時也是頭一批落地到搜索應用產品中,引起了業(yè)界的普遍關注。

傳統(tǒng)的搜索一般是以網(wǎng)頁鏈接形式為結果,用戶需要自己一個個翻找鏈接,進入網(wǎng)頁尋找答案。而結合了360GPT能力的360新搜索可以通過問答的形式,根據(jù)用戶提出的問題直接生產內容。

基于360GPT的新搜索生成式對話截圖

針對“為什么淄博燒烤突然火了?”這個當下的熱點話題,很快就給出了答案。列出了淄博燒烤最新的社會事件,還提煉分析直接給出了結論。不僅如此,回答中還顯示了援引來源,可以供用戶溯源確認??梢钥吹降氖牵?60新搜索的問答更符合人的自然表達,生成的內容也遠比傳統(tǒng)搜索更直接、更豐富。

究其原因,張向征介紹說:“我們一直把理解用戶目的、便捷用戶使用當成了重要的產品研發(fā)方向,基于360GPT的新搜索擁有更強大的閱讀理解能力?!?/p>

另一方面,人工智能相關內容的生產離不開真實可靠的信息。通過聯(lián)網(wǎng)搜索能力,實現(xiàn)了于全網(wǎng)信息的高效互聯(lián),及時獲得準確、有效的信息,再憑借生成式大語言模型對信息的提煉、總結和生成能力,快速給出兼具時效性和可讀性的答案。

“大模型+搜索引擎兩者融合的產品更像用戶的個人助手,交互模式會更多樣,能力邊界也會顯著擴大”。張向征透露,以用戶需求為出發(fā)點,360GPT還將與瀏覽器、數(shù)字助理、蘇打辦公、智能營銷等場景應用深度結合,為用戶提供多元化的智能服務。

2、多年布局人工智能,技術場景“兩翼齊飛”

早在2015年深度學習技術風靡時,人工智能就已是搜索行業(yè)變革的重要推動力。

2017年,NLP領域劃時代的Transformer算法誕生。沿著Transformer的路徑,GPT、BERT等新技術,將機器視覺領域的訓練方式用于自然語言領域,實現(xiàn)了“智能化”的進一步升級。

對比GPT與BERT來看,GPT是一個單向模型,更擅長“寫作文”,而BERT是雙向模型,可以聯(lián)系上下文進行分析,更擅長“完形填空”。因此,相比較于GPT,對于圍繞已存在內容展開業(yè)務的搜索引擎行業(yè)來說,BERT是更常用的模型。

BERT和GPT模型結構對比

BERT和GPT模型結構對比(來源:BERT論文)

而ChatGPT的出現(xiàn)帶來了技術路線的大變動。

張向征表示,人工智能技術一直是360搜索不斷進化的關鍵,ChatGPT作為一種新形式的后端變革,將影響后續(xù)搜索引擎底層技術的調研和技術的應用方式。

他介紹道,2015年,360搜索就開始用深度學習模型進行搜索的召回、排序以及Query意圖識別等關鍵環(huán)節(jié)。之后,360搜索又開始使用多模態(tài)檢索模型,來多元化搜索形態(tài),適應圖片搜索等新需求。

到2019年,360搜索完成了對BERT模型的初版應用,2020年完成BERT的全流量在線部署和應用。此時,360搜索已經開始做“閱讀理解”。不同于僅提供鏈接,針對某些已經有明確答案的問題,360搜索可以抽取精準答案所對應的段落和句子,并直接展示在搜索頁。

“也正是這些探索打下的基礎,今天我們才有了自己的生成式大語言模型和產品矩陣‘智腦’”。張向征這樣說。

眾所周知,搜索引擎的核心是底層的技術能力以及優(yōu)質的內容和服務。因此,搜索引擎未來的產品形態(tài)、交互模式、展現(xiàn)方式等都將基于其核心能力,再根據(jù)用戶的習慣和偏好不斷變化。未來的搜索引擎將形成全新的入口,搜索能力會繼續(xù)存在,并承擔相應的后臺支持功能。

人類獲取信息的方式的變革蘊含著巨大的機會??梢韵胍姡?60GPT的新一代的智能搜索引擎將承載更多的用戶使用場景,也將迎來更大的想象空間。

3.“未來搜索引擎”已至,360搜索的底氣從何而來?

據(jù)了解,從2012年成立之初,360搜索就以其獨特的產品和技術實力,構筑起了差異化的市場定位。

依托于360集團,360搜索在安全層面積累深厚。借助于旗下產品對于病毒、釣魚網(wǎng)站等的識別與攔截能力,360搜索可以及時過濾風險,為用戶打造更安全、穩(wěn)定的上網(wǎng)環(huán)境。

另一方面,隨著各種垂直平臺的興起,互聯(lián)網(wǎng)內容開始“孤島化”。作為全網(wǎng)搜索平臺,360搜索始終堅持開放的發(fā)展策略。

360搜索一直以來都重視對內容生態(tài)的建設。目前,360已經與多個內容平臺達成合作,所有內容提供方均參與收入分成,逐步形成了互惠共享的生態(tài)環(huán)境。

此外,360搜索還在搜索的數(shù)據(jù)、算法、工程化能力以及服務接口對內對外雙向賦能,更大范圍地觸達用戶群體。

對內,360推出的日歷等訂閱產品,就融合了360搜索的功能,用戶一鍵訂閱,就能實時收到最新的信息更新。對外,360搜索入局SaaS業(yè)務,通過為某些垂直領域的搜索平臺提供SaaS化的接口,來輸出其全網(wǎng)搜索能力。

與此同時,360搜索也在持續(xù)加筑自身護城河,緊隨GPT大語言模型,360搜索借助其人工智能技術的積累,利用360“智腦”探索產品邊界,推出新一代智能搜索。

業(yè)界有一個普遍的共識,那就是ChatGPT的性能卓越主要源于其預訓練模型參數(shù)量巨大,人工反饋為主的標注強化學習手段,以及先進的思維模式訓練方法。從GPT-1到GPT-3,模型訓練的參數(shù)量呈千倍增長,已達到接近2000億的量級。在數(shù)據(jù)量達標,用大模型把知識容量、基礎通用能力做的足夠高之后,大模型研發(fā)就要面臨工程落地環(huán)節(jié)。這需要耗費巨大的訓練和推理成本,也是“英雄折戟”之地。

模型規(guī)模不等于符合實際需要,為了避免無意義回答,還要為人工智能加上“傾向性”,這就用到RLHF新技術,即基于人類反饋的強化學習,通過人工標注來加入方向性引導。最后,思維訓練也是人工智能的一部分,要使其具備推理能力,能進行高度擬人化的多輪對話。

除了以上難點,GPT大語言模型要真正落地,還要結合對實際業(yè)務的理解。這將是一個逐步改進,不斷摸索的過程。

在巨大的壁壘面前,360有著“先天優(yōu)勢”,360搜索的內容涵蓋全網(wǎng)數(shù)據(jù),抓取過的網(wǎng)頁數(shù)已達上萬億,現(xiàn)存網(wǎng)頁數(shù)達數(shù)千億,索引的網(wǎng)頁達數(shù)百億,這能為技術開發(fā)提供足夠多的語料。

從數(shù)據(jù)多樣性上來看,360搜索不局限于某一類別的數(shù)據(jù),而是對電商、新聞、小說、問答、百科等各類數(shù)據(jù)均有覆蓋,保證了數(shù)據(jù)集的完整度。

BERT和GPT模型結構對比

360搜索基于圖像AI識別能力推出了“圖查查”平臺

文本數(shù)據(jù)之外,360搜索還利用多模態(tài)搜索技術,通過識別文本和圖像間的映射關系,將語料信息延伸到更豐富的形態(tài)中。

據(jù)了解,360搜索已經積累了數(shù)百億的圖片信息。2022年,360搜索還聯(lián)合360人工智能研究院與清華大學,推出了中文圖文跨模態(tài)數(shù)據(jù)集Zero和圖文跨模態(tài)預訓練框架R2D2。

其中,Zero包括兩個預訓練數(shù)據(jù)集和五個下游任務數(shù)據(jù)集,預訓練數(shù)據(jù)集包括2300萬和230萬兩個版本,該數(shù)據(jù)集也是國內開源的首個中文圖文跨模態(tài)領域數(shù)據(jù)集。

360搜索聯(lián)合360人工智能研究院、清華大學推出的中文圖文跨模態(tài)數(shù)據(jù)集Zero

當然,僅有大規(guī)模數(shù)據(jù)集還遠遠不夠。要形成有效的語料集,對各類信息進行篩選和清理同樣重要,這就需要扎實的人工智能工程能力。

張向征表示,任何人工智能技術的落地都離不開工程能力,也就是讓人工智能技術以低成本、高效率的方式落地實施的能力。

基于多年深耕,360內部在模型訓練平臺、預訓練語言模型等方面,已經積累了豐富的經驗,能為GPT大語言模型的開發(fā)提供良好的工程支持,有效降低訓練推理和業(yè)務落地的成本。

早在幾年前,360搜索就已經把所有的底層文檔,以向量形式表達,能快速鎖定、提取內容,進一步提高檢索和篩選的效率。同時,結合用戶的搜索反饋,360搜索能有效判斷不同信息的重要性,進一步提高語料集的質量。

此外,人工智能的持續(xù)商業(yè)化落地,也離不開充足算力的支持。360內部部署的數(shù)萬臺服務器、數(shù)百臺GPU,已成為相關研究所需算力的有力支撐。

從數(shù)據(jù)到算力,再到工程能力,正是360集團一直以來對人工智能的重視,形成了今天360搜索探索未來搜索引擎的充足底氣。

4、從基礎研究到上層應用,360集團奔向人工智能的“星辰大海”

平行于360搜索,360集團設立了360人工智能研究院。

據(jù)了解,360人工智能研究院專門進行人工智能基礎模型和前瞻性技術的研究,現(xiàn)階段主要聚焦于研發(fā)業(yè)界領先的計算機視覺、深度自然語言理解,語音語義交互等人工智能技術,再將研究成果應用于智慧物聯(lián)網(wǎng)(IOT)、智能安全大數(shù)據(jù),互聯(lián)網(wǎng)信息分發(fā)等多種場景。

其研究范圍涵蓋人工智能各主要領域,申請專利數(shù)接近400件。團隊核心成員還曾于2017年在有“計算機視覺屆世界杯”之稱的ImageNet比賽中獲得兩項冠軍,并刷新了谷歌、微軟保持的世界紀錄。在2019-2021年的中國人工智能大賽中,360人工智能研究院更是取得3連冠。

此外,團隊還參與了國家級重點大數(shù)據(jù)工程實驗室和國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)開放實驗室的建設,其主導項目也已入選“科技部科技創(chuàng)新2030項目”和“吳文俊人工智能科技進步獎”。

張向征表示,人工智能研究院主要提供底層研究支持,360搜索在內的各業(yè)務部門,則負責將人工智能與業(yè)務場景相結合,同時將實踐結果反饋給研究院,形成了基礎研究到上層應用的生態(tài)閉環(huán)。

目前,360已經搭建起了數(shù)百人的人工智能研發(fā)團隊,并廣招人工智能人才,每年的研發(fā)投入也均以億級計算。

接下來,360搜索將與360人工智能研究院緊密合作,不斷強化新一代搜索引擎的能力邊界,不斷探索人工智能技術在瀏覽器、數(shù)字助理、蘇打辦公、智能營銷等多場景的應用結合,奔向GPT大語言模型的“星辰大?!?。

本文標題: 360搜索在人工智能時代何去何從

本文地址: http://hzmpf.cn/brand/news-38330b793b.html

內容均來源于網(wǎng)絡,錯誤糾正或刪除請發(fā)郵件,收件郵箱kefu@huangye88.com

熱門推薦企業(yè)

2009-2024 黃頁88版權所有 京ICP備2023012932號-1京公網(wǎng)安備 11010802023561號 京ICP證100626

內容均來源于網(wǎng)絡,錯誤糾正或刪除請發(fā)郵件,收件郵箱kefu@huangye88.com