九九视频在线播放,九九热在线视频观看,**毛片网站,日本播放一区二区,久久久久99啪啪免费,99久久精品免费看国产四区,久久成人av电影,日韩一区二区黄色片
我的位置:首頁>文章詳情

知乎上線“AI搜索”功能 中文語料資源短缺有待破解

3月20日,知乎正式發(fā)布了全新AI功能“發(fā)現(xiàn)·AI搜索”。這也是繼去年發(fā)布“知海圖AI”大模型后,知乎在人工智能方面的又一重要進(jìn)展。

據(jù)知乎創(chuàng)始人、董事長兼CEO周源介紹,知乎的AI搜索集搜索、實時問答和追問功能于一體,而且與其他大模型提供的內(nèi)容不同,知乎AI搜索的內(nèi)容均來自社區(qū)專業(yè)創(chuàng)作者的可信賴內(nèi)容。

上圖為記者測試知乎AI搜索

記者測試發(fā)現(xiàn),在知乎AI搜索中提問“如何使用大模型”,除了其他語言大模型都有的文字回答外,知乎AI搜索還在結(jié)果上面列入了內(nèi)容來源,比如記者測試的問題答案,就有6位答主參與了貢獻(xiàn),并且可以通過點擊直接跳轉(zhuǎn)至這些回答頁面。

知乎COO、高級副總裁、社區(qū)業(yè)務(wù)負(fù)責(zé)人張寧在接受21世紀(jì)經(jīng)濟(jì)報道記者采訪時表示,知乎的AI產(chǎn)品一定是建立在社區(qū)生態(tài)上面的。“我們一直在思考的是,AI搜索搜出的結(jié)果,如何再反哺給創(chuàng)作者,讓創(chuàng)作者感覺到內(nèi)容是被更多人看到的”。

所以在內(nèi)容呈現(xiàn)上,知乎有別于其他模型,會在回答內(nèi)容中標(biāo)注內(nèi)容來源,這樣既提升了內(nèi)容的可溯源性,加大了對創(chuàng)作者的曝光,同時也大大增強(qiáng)了用戶對內(nèi)容的信任度。

記者了解到,知乎的AI搜索功能是以AI創(chuàng)業(yè)公司面壁智能的大模型產(chǎn)品為基礎(chǔ)。面壁智能成立于2022年8月,創(chuàng)始成員全部來自清華大學(xué)NLP實驗室。2023年3月,知乎作為領(lǐng)投方參與了面壁智能的天使輪融資,同年4月,知乎聯(lián)合面壁智能發(fā)布了“知海圖AI”中文大模型。

周源此前曾向21世紀(jì)經(jīng)濟(jì)報道記者表示,在AI時代,生產(chǎn)力的三要素分別是應(yīng)用場景、專有數(shù)據(jù)和基礎(chǔ)模型。其中,知乎在應(yīng)用場景和專有數(shù)據(jù)方面,占據(jù)獨(dú)特優(yōu)勢。而在基礎(chǔ)模型方面,投資面壁智能并與其進(jìn)行模型共建,是知乎構(gòu)建基礎(chǔ)模型層能力時,選擇的一條捷徑。

而這次“AI搜索”功能上線,算是知乎在大模型技術(shù)應(yīng)用上的一個階段性成果。張寧告訴21世紀(jì)經(jīng)濟(jì)報道,知乎針對AIGC的布局,在ToC產(chǎn)品上會聚焦于“AI搜索”。

“因為AI搜索跟知乎用戶的心智是高度對齊的,用戶希望在知乎解決問題,希望獲得專業(yè)可信賴的優(yōu)質(zhì)解答,而正是AI搜索所提供的能力”。張寧說。

所以接下來,知乎也會在AI搜索方面投入更多精力,包括在特定的專業(yè)領(lǐng)域上進(jìn)行更多的數(shù)據(jù)標(biāo)注,以提高生成內(nèi)容的可信度。

目前,市面上做AI搜索的公司已經(jīng)不少,對知乎而言,其擁有的一大優(yōu)勢就是高質(zhì)量的中文語料。公開數(shù)據(jù)顯示,截至2022年底,知乎累計擁有6310萬名內(nèi)容創(chuàng)作者,他們貢獻(xiàn)了約5.06億條問答內(nèi)容,覆蓋超過1000個垂直領(lǐng)域。

在大模型訓(xùn)練過程中,訓(xùn)練預(yù)料質(zhì)量將直接影響大模型輸出內(nèi)容質(zhì)量。各個廠商為了提升模型質(zhì)量,往往會投入大量資源對數(shù)據(jù)進(jìn)行標(biāo)注。但張寧向記者表示,知乎在數(shù)據(jù)標(biāo)注上的投入,遠(yuǎn)低于其他廠商。

張寧進(jìn)一步表示,知乎AI搜索的第一個版本在春節(jié)前一周就已經(jīng)上線,后面經(jīng)過一個多月的灰度測試,“我們收到的整體反饋是,回答質(zhì)量要高于預(yù)期”。

在張寧看來,這個結(jié)果也印證了知乎中文語料的優(yōu)質(zhì)?!罢f實話,這么短的時間內(nèi)我們不太可能做特別大規(guī)模的數(shù)據(jù)標(biāo)注,但取得這樣的結(jié)果,說明我們的數(shù)據(jù)底子好。過去大家一直說知乎的內(nèi)容質(zhì)量高,這次也通過AI訓(xùn)練的方式進(jìn)行了驗證”。

不過,按照大模型的發(fā)展速度,知乎儲備的中文語料數(shù)據(jù)未來或也將捉襟見肘。今年年初,周源在接受記者采訪時也曾提到中文語料短缺的問題。他說,中文優(yōu)質(zhì)數(shù)據(jù)的稀缺,導(dǎo)致國內(nèi)許多從事大模型開發(fā)的研究機(jī)構(gòu)和企業(yè)在進(jìn)行模型訓(xùn)練時,不得不依賴于外文標(biāo)注數(shù)據(jù)集、開源數(shù)據(jù)集,或是爬取網(wǎng)絡(luò)數(shù)據(jù)。

在他看來,解決中文語料資源短缺的問題,實際上應(yīng)該是先構(gòu)建“水庫”,然后再去合理使用的過程。但是現(xiàn)在,行業(yè)對構(gòu)建“水庫”的工作重視不夠,反而都比較看重怎么去“打水”,所以未來幾年,中文語料資源短缺都將是一個特別嚴(yán)重的問題。(記者 白楊)

來源:21世紀(jì)經(jīng)濟(jì)報道

責(zé)任編輯:王海山

評論一下
評論 0人參與,0條評論
還沒有評論,快來搶沙發(fā)吧!
最熱評論
最新評論
已有0人參與,點擊查看更多精彩評論

請輸入驗證碼

主站蜘蛛池模板: 国产全肉乱妇杂乱视频在线观看| 日本精品一二区| 午夜诱惑影院| 国产精品一区在线播放| 国产精品亚州| 国产精品国产一区二区三区四区| 91黄色免费看| 久久久中精品2020中文| 亚洲综合日韩精品欧美综合区| 日本二区在线观看| 欧美日韩激情在线| 国产精品久久久久久久久久不蜜月| 欧美激情视频一区二区三区| 久久国产精品欧美| av素人在线| 日本精品一区二区三区视频| 国产白嫩美女在线观看| 久久国产精品精品国产| 国产精品一区二区毛茸茸| 激情久久综合网| 日韩精品一区二区不卡| 一色桃子av| 国产精品白浆一区二区| 窝窝午夜精品一区二区| 国产69精品久久久久999小说| 日本一区中文字幕| 欧美日韩国产三区| 国产高清在线精品一区二区三区| 久久中文一区二区| 久久激情网站| 91国产在线看| 亚洲va久久久噜噜噜久久0| 久久国产精品首页| 热久久一区二区| 久久99精品国产麻豆宅宅| 日本一区二区在线电影| 日本一区二区高清| 色综合久久久| 日韩电影在线一区二区三区| 92久久精品| 狠狠躁夜夜av| 国产第一区在线观看| 国产视频精品一区二区三区| 99国产精品久久久久99打野战| 91av中文字幕| 国产精品高潮呻吟三区四区| 亚洲国产日韩综合久久精品| 中文字幕av一区二区三区四区| 久久久精品欧美一区二区| 人人玩人人添人人澡97| 日韩a一级欧美一级在线播放| 91看片app| 日韩国产精品久久| 色综合欧美亚洲国产| 91精品国产高清一二三四区| 久久网站精品| 日韩av在线网址| 国产一区二区日韩| 夜色av网站| 国产日韩一区二区三免费| 99热久久精品免费精品| 国产一区二区国产| 日韩午夜电影院| 久久精品国产一区二区三区| 午夜av影视| 狠狠色成色综合网| 亚洲va欧美va国产综合先锋| 欧美一级不卡| 狠狠色狠狠色综合久久第一次| 久久久久久国产一区二区三区| 日韩精品久久久久久久酒店| 中文字幕一区二区三区不卡| 亚洲欧美一区二区精品久久久| 国产精品二十区| 国产精品一区二区三| 99国精视频一区一区一三| 性欧美精品动漫| 国产1区在线观看| 91精品久久久久久| 欧美日韩一区二区三区在线观看视频| 欧美国产三区| 日韩精品一区二区不卡|