色综合视频网_亚洲91网_一及毛片视频_久久精品网_国产一区二区在线免费_18欧美性xxxx极品hd

咨詢熱線:021-80392549

 QQ在線  企業(yè)微信
 資訊 > 人工智能 > 正文

26 億參數(shù)量,水平接近人類,Google 的開放領域聊天機器人意義何在?

2020/02/04雷鋒網(wǎng)424

科技巨頭們時不時就聲明在 AI 領域取得了突破性進展,對此我們已經(jīng)見慣不驚了。

當?shù)貢r間 2020 年 1 月 28 日,Google 在一篇博客中介紹了一款開放領域聊天機器人 Meena,號稱“史上最強”,那么這一新突破會讓人眼前一亮嗎?

26 億參數(shù)量,水平接近人類,Google 的開放領域聊天機器人意義何在?

【 圖片來源:Google Blog  所有者:Google Blog 】

開放領域聊天機器人開發(fā)難度大

實際上,設計智能聊天機器人是為了應對信息爆炸時代存在的信息過載問題。最初,人們把聊天機器人當作搜索引擎的終極形態(tài)進行設計和開發(fā)。不同于現(xiàn)有的搜索引擎,聊天機器人可針對用戶的問題自然又通順地給出精準的答案,節(jié)約了很多時間,從而帶來更好的用戶體驗。

根據(jù)使用場景劃分,聊天機器人(chatbot)主要有開放域型(Open-Domain)和任務導向型(Task-Oriented)兩種。

其中,任務導向型主要有問答系統(tǒng)、對話系統(tǒng)聊天機器人,分別指基于用戶的問題給出一個回答(常用于智能搜索、智能家居中的家電控制等場景)和與用戶進行多輪對話的聊天機器人(如客服機器人,銷售機器人等)。

而開放領域聊天機器人(也稱閑聊式機器人)顧名思義針對開放域的對話場景,主題、內(nèi)容不限,比如微軟小冰和蘋果 Siri。Google 在上述博客中表示:

開放領域聊天機器人的研究不僅具有學術價值,還可激發(fā)很多有趣的應用,如更深層次的人機交互、提升外語訓練效果,以及制作交互式電影和游戲角色。

值得一提的是,開放領域聊天機器人更符合人們心中對「人工智能」的定位,開發(fā)難度自然也很大——當前開放領域聊天機器人面臨的一個嚴峻問題在于它們表達的內(nèi)容往往沒有意義,無法與用戶的問題連貫起來,而且由于缺乏基本的常識和認知,不能給出針對性的回復。

而 Google 開發(fā)的 Meena 正是一款開放領域聊天機器人,那么相比現(xiàn)有的聊天機器人,究竟有何突破?

26 億參數(shù)量,水平接近人類,Google 的開放領域聊天機器人意義何在?

【 Meena 和人類的對話內(nèi)容 圖片來源:Google Blog 】

26 億參數(shù)的端到端神經(jīng)對話模型

Google 在博客中介紹稱,Meena 是個 26 億參數(shù)的端到端訓練的神經(jīng)會話模型,是 GPT-2 模型最大版本(15 億參數(shù))的 1.7 倍。據(jù)稱,Google 利用 400 億字的數(shù)據(jù)集,通過 2048 個張量處理單元(即 Tensor Processing Unit,Google 專用 AI 芯片)訓練了 30 天,得到了最佳版本。實驗表明,比起聊天機器人 SOTA,Meena 能更好地完成對話,內(nèi)容也更具體、清楚。

據(jù)悉,Meena 由 1 個 Evolved Transformer 編碼器和 13 個 Evolved Transformer 解碼器組成:編碼器用于處理對話語境,有助于 Meena 理解對方的話;而解碼器則會利用信息生成回復。而在這一過程中,Google 表示:

研究人員發(fā)現(xiàn),超參數(shù)調(diào)整后,實現(xiàn)高質(zhì)量對話的關鍵在于性能更強的解碼器。

【 圖片來源:Google Blog  所有者:Google Blog 】

雷鋒網(wǎng)了解到,Google 從公共領域社交媒體對話上過濾得到了 341GB 的文本,并以樹狀脈絡形式組織文本進行「多輪對話」訓練。研究者將每輪對話作為訓練樣本,同時每輪之前的 7 輪對話為語境信息,共同構成一組數(shù)據(jù)。據(jù)悉,選擇 7 輪對話作為語境,既能保證訓練過程獲得足夠長的語境信息,同時模型也能不超過內(nèi)存限制。畢竟文本越長,占用的內(nèi)存也越多。

新提出的人類評價指標 SSA

根據(jù)博客,上述這些表現(xiàn)是由 Google 根據(jù)新提出的人類評價指標「Sensibleness and Specificity Average (SSA)」得出的,而此次提出新的指標是因為,目前聊天機器人的人類評價指標頗為復雜,而且也很難形成一致的評價指標。Google 表示,SSA 能捕獲基本的、但對人類對話來說很重要的屬性。

為計算這一指標,研究者測試了 Meena、Mitsuku、Cleverbot、DialoGPT 及小冰等常見的聊天機器人。在測試中,對于每一款聊天機器人,研究者都在 100 個對話中收集了 1600 到 2400 輪,各聊天機器人的回復都由人類評價者評分(主要依據(jù)對話的流暢性和回答的準確性),其各自性能表現(xiàn)如下圖。

26 億參數(shù)量,水平接近人類,Google 的開放領域聊天機器人意義何在?

【 圖片來源:Google Blog  所有者:Google Blog 】

不難看出,Meena 相比于現(xiàn)有的 SOTA 聊天機器人,有著更高的 SSA 分數(shù),甚至接近于人類的表現(xiàn)。

困惑度與 SSA 強相關

毫無疑問,人類評價或多或少存在一些問題,因此很多研究者都希望找到一個能夠自動計算的評價指標,而且這個指標要能和人類評價準確對應。

雷鋒網(wǎng)了解到,困惑度(perplexity,指一種任何神經(jīng)會話模型都能輕易獲得的計算指標)是 seq2seq 模型(雷鋒網(wǎng)注:一種循環(huán)神經(jīng)網(wǎng)絡的變種,包括編碼器和解碼器兩部分,是自然語言處理中的一種重要模型,可用于機器翻譯、對話系統(tǒng)、自動文摘)中的一個常見指標,用于評價語言模型的不確定性。

而值得一提的是,Google 證明了困惑度與 SSA 高度相關。

實際上,訓練 Meena 正是為了最大程度地減少困惑度,以及預測下一個標記(雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))注:指對話中的下一個單詞)的不確定性——據(jù)博客稱,這是因為 Meena 的核心為 Evolved Transformer seq2seq 架構,即一種通過進化神經(jīng)架構搜索發(fā)現(xiàn)的 Transformer 體系結(jié)構,能夠改善困惑度。

在博客中 Google 表示,研究者依據(jù)層數(shù)、注意力數(shù)量、訓練步數(shù)、編碼器、訓練方式等因素,共測試了 8 種不同的模型,發(fā)現(xiàn)困惑度越低,SSA 分數(shù)越高,同時兩者的相關系數(shù)很高(R^2 = 0.93)。

26 億參數(shù)量,水平接近人類,Google 的開放領域聊天機器人意義何在?

【 圖片來源:Google Blog  所有者:Google Blog 】

同時 Google 表示:

研究者將繼續(xù)通過改進算法、架構、數(shù)據(jù)和計算量等,降低這一神經(jīng)會話模型的困惑度。

Meena 意義大嗎?

根據(jù)博客中展示的數(shù)據(jù),我們相信 Meena 的確性能出眾,不過 Meena 究竟什么時候能推出、真正推出后表現(xiàn)如何,可能都要打問號。博客中提到,目前研究團隊正在就這一研究的風險及益處做進一步的評估,并可能在未來幾個月內(nèi)推出 Meena,旨在推動該領域的發(fā)展。

對此,VentureBeat 記者 Ronald Ashri 在其報道中表示:

首先我們要意識到,即便 Google 開源所有代碼,也很少有人能培訓類似 Meena 的模型。Meena 應該還在實驗室里,操作起來也非常復雜,還不能將其整合到一個工具中,而且 Google 也不可能很快就將其作為一項服務向用戶提供。因此,恐怕短期內(nèi) Meena 難以推出。

另外,在實用性方面,誠然 Meena 作為一款開放領域聊天機器人,能夠?qū)崿F(xiàn)多輪對話。不過 Meena 并不能協(xié)助用戶完成某項任務、學習某項新技能,或為身處困境的用戶給予情感或心理支持,和用戶的聊天沒有明確的目的。而耗費時間進行無意義的交談,在我們所處的時代大背景下似乎并非理想產(chǎn)品。

與此同時,記者 Ronald Ashri 也對 Meena 提出了進一步質(zhì)疑。正如上文所述,Google 從公共領域社交媒體對話上過濾得到了 341GB 的文本,以此進行進一步的訓練。那么,數(shù)百萬的公共領域社交媒體對話會是這一所謂的「史上最強聊天機器人」的正確數(shù)據(jù)集嗎?Meena 是否會講出不恰當?shù)脑挘赡芤彩且粋€我們要關注的點。

近年來,隨著越來越多的 AI 聊天解決方案進入生活,我們需要關注最有價值的東西——定義類似人類的對話,并探究這類對話在聊天機器人領域中的角色。

正如 Ronald Ashri 所說:

Meena 讓我們更接近目標,但尚未讓我們達到目標。

關鍵詞:




AI人工智能網(wǎng)聲明:

凡資訊來源注明為其他媒體來源的信息,均為轉(zhuǎn)載自其他媒體,并不代表本網(wǎng)站贊同其觀點,也不代表本網(wǎng)站對其真實性負責。您若對該文章內(nèi)容有任何疑問或質(zhì)疑,請立即與網(wǎng)站(www.fennz.com)聯(lián)系,本網(wǎng)站將迅速給您回應并做處理。


聯(lián)系電話:021-31666777   新聞、技術文章投稿QQ:3267146135   投稿郵箱:syy@gongboshi.com

工博士人工智能網(wǎng)
商城
服務機器人
智能設備
協(xié)作機器人
智慧場景
AI資訊
人工智能
智能機器人
智慧城市
智慧農(nóng)業(yè)
視頻
工業(yè)機器人
教育機器人
清潔機器人
迎賓機器人
資料下載
服務機器人
工博士方案
品牌匯
引導接待機器人
配送機器人
酒店服務機器人
教育教學機器人
產(chǎn)品/服務
服務機器人
工業(yè)機器人
機器人零部件
智能解決方案
掃描二維碼關注微信
?掃碼反饋

掃一掃,反饋當前頁面

咨詢反饋
掃碼關注

微信公眾號

返回頂部
主站蜘蛛池模板: 国产综合久久 | 日本久久一区 | 久久精品综合 | 成人片免费看 | 午夜日韩 | 亚洲免费三区 | 四季av一区二区三区免费观看 | 免费网站黄 | 视频在线中文字幕 | 国产一区二区av | 视频一区在线观看 | 欧美va天堂在线电影 | 久久久久久久国产 | 玖玖在线播放 | 欧美黄色一级 | 韩国福利一区 | 美女黄18| 国产精品久久久久久久9999 | 在线精品一区二区 | 免费一级淫片 | 欧美嫩草 | 91精品国产欧美一区二区 | 国产精品久久久久久久久久久免费看 | 国产在线观看免费 | 6699嫩草久久久精品影院 | 久久思思视频 | 国产一区精品在线 | 亚洲第一在线 | 久久久毛片| 免费性色| 欧美成人一区二区三区片免费 | 成人免费淫片aa视频免费 | 三级精品视频 | 看免费黄色一级片 | 国产精品久久久一区二区 | 日韩欧美小视频 | 亚洲视频在线观看网址 | 成人精品视频m3u8 | 交视频在线观看国产 | 99re视频在线观看 | 国产黄色三级毛片 |