色综合视频网_亚洲91网_一及毛片视频_久久精品网_国产一区二区在线免费_18欧美性xxxx极品hd

咨詢熱線:021-80392549

 QQ在線  企業微信
 資訊 > 人工智能 > 正文

自然語言處理:人工智能領域的重要研究課題

2021/07/29投稿732

自然語言處理(英文Natural Language Processing,簡稱NLP)是人工智能(英文Artificial Intelligence,簡稱AI)領域的重要研究課題,被譽為人工智能技術的一個掌上明珠;它研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法,涉及面極為廣泛。國際知名學者周海中先生曾經指出:“自然語言處理是極有吸引力的研究領域,它具有重大的理論意義和實用價值。”目前,NLP已成為推動科技發展的強大動力,并成為世界各國綜合國力競爭的焦點。

自然語言處理:人工智能領域的重要研究課題


NLP主要研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法。而用自然語言與計算機進行通信,有著十分重要的實際應用意義,也有著革命性的理論意義。實現人機間自然語言通信意味著要使計算機既能理解自然語言文本的意義,也能以自然語言文本來表達給定的意圖、思想等;前者稱為自然語言理解(英文Natural Language Understanding,簡稱NLU),后者稱為自然語言生成(英文Natural Language Generation,簡稱NLG)。因此,NLP大體包括了NLU和NLG兩個部分;因為處理自然語言的關鍵是要讓計算機“理解”自然語言,所以通常把NLU視為NLP,也稱為計算語言學。


NLP是一門融語言學、計算機科學、數學于一體的科學。因此,這一領域的研究將涉及自然語言,即人們日常使用的語言,所以它與語言學的研究有著密切的聯系,但又有重要的區別。NLP并不是一般地研究自然語言,而是研制能有效地實現自然語言通信的計算機系統,特別是其中的軟件系統。因而它是計算機科學的一部分。可以說,NLP是計算機科學、語言學、AI等關注計算機和人類語言之間的相互作用的領域。目前,人們對AI的需求也從計算智能、感知智能到了以NLP為代表的認知智能的層面。沒有成功的NLP,就不會有真正的認知智能。


由于AI包括感知智能(比如圖像識別、語言識別和手勢識別等)和認知智能(主要是語言理解知識和推理),而語言在認知智能起到最核心的作用。如果能把語言問題解決了,AI最難的部分也就基本解決了。美國微軟公司創始人比爾·蓋茨先生曾經表示,“語言理解是人工智能領域皇冠上的明珠”。前微軟公司全球執行副總裁沈向洋先生也在公開演講時說:“懂語言者得天下……下一個十年,人工智能的突破在自然語言的理解……人工智能對人類影響最為深刻的就是自然語言方面”。由于理解自然語言需要關于外在世界的廣泛知識以及運用操作這些知識的能力,所以NLP也被視為解決AI完備(AI-complete)的核心問題之一。可以說,NLP目前是AI領域的重要研究課題,對它的研究也是充滿魅力和挑戰的。


當前AI技術在認知智能層面仍面臨諸多挑戰。如果我們有所推進的話,我們的認知智能就會進一步提升,包括語言的理解水平、推理水平、回答問題能力、分析能力、解決問題的能力、寫作能力、對話能力等。然后再加上感知智能的進步,聲音、圖象、文字的識別和生成的能力,以及多模態文、圖交叉的能力,通過文字可以生成圖象,根據圖象可以生成描述的文字等等,我們就可以推進很多人類的應用,包括搜索引擎、智能客服,包括教育、財政、電子商務等各個方面的應用;也可以把AI技術用在我們的產業上,幫助產業實現數字化轉型。


最早的NLP研究工作是機器翻譯。1949年,美國知名科學家沃倫·韋弗先生首先提出了機器翻譯設計方案。20世紀60年代,許多科學家對機器翻譯曾有大規模的研究工作,耗費了巨額費用;但他們顯然是低估了自然語言的復雜性,語言處理的理論和技術均不成熟,所以進展不大。當時的主要做法是存儲兩種語言的單詞、短語對應譯法的大辭典,翻譯時一一對應,技術上只是調整語言的同條順序。但日常生活中語言的翻譯遠不是如此簡單,很多時候還要參考某句話前后的意思,需要上下文聯系起來才能正確翻譯——這就是機譯技術難度高之所在。


大約20世紀90年代開始,NLP領域發生了巨大的變化。這種變化有兩個明顯的特征:(1)對系統的輸入,要求研制的NLP系統能處理大規模的真實文本,而不是如以前的研究性系統那樣,只能處理很少的詞條和典型句子。只有這樣,研制的系統才有真正的實用價值。(2)對系統的輸出,鑒于真實地理解自然語言是十分困難的,對系統并不要求能對自然語言文本進行深層的理解,但要能從中抽取有用的信息。同時,由于強調了“大規模”和“真實文本”,所以下面兩方面的基礎性工作也得到了重視和加強:(1)大規模真實語料庫的研制。大規模的經過不同深度加工的真實文本的語料庫,是研究自然語言統計性質的基礎;如果沒有這樣的語料庫,統計方法只能是無源之水。(2)大規模、信息豐富的詞典的編制工作。因此規模為幾萬,十幾萬,甚至幾十萬詞,含有豐富的信息(如包含詞的搭配信息)的計算機可用詞典對NLP的重要性是很明顯的。


系統的輸入與輸出這兩個特征在NLP的諸多領域都有所體現,其發展直接促進了計算機自動檢索技術的出現和興起。實際上,隨著計算機技術的不斷發展,以海量計算為基礎的機器學習、數據挖掘、數據建模等技術的表現也愈發優異。NLP之所以能夠度過“寒冬”,再次發展,也是因為計算機科學與統計科學的不斷結合,才讓人類甚至機器能夠不斷從大量數據中發現“特征”并加以學習。不過要實現對自然語言真正意義上的理解,僅僅從原始文本中進行學習是不夠的,我們還需要新的方法和模型。


目前存在的問題主要有兩個方面:一方面,迄今為止的語法都限于分析一個孤立的句子,上下文關系和談話環境對本句的約束和影響還缺乏系統的研究,因此分析歧義、詞語省略、代詞所指、同一句話在不同場合或由不同的人說出來所具有的不同含義等問題,尚無明確規律可循,需要加強語義學和語用學的研究才能逐步解決。另一方面,人理解一個句子不是單憑語法,還運用了大量的有關知識,包括生活知識和專門知識,這些知識無法全部貯存在計算機里。因此一個書面理解系統只能建立在有限的詞匯、句型和特定的主題范圍內;計算機的貯存量和運轉速度大大提高之后,才有可能適當擴大范圍。


由于語言工程、認知科學等主要局限于實驗室,目前來看數據處理可能是NLP應用場景最多的一個發展方向。實際上,自從進入大數據時代,各大平臺就沒有停止過對用戶數據的深度挖掘。要想提取出有用的信息,僅提取關鍵詞、統計詞頻等是遠遠不夠的,必須對用戶數據(尤其是發言、評論等)進行語義上的理解。另外,利用離線大數據統計分析的方法進行NLP任務的研究是目前非常有潛力的一種研究范式,尤其是谷歌、推特、百度等大公司在這類應用上的成功經驗,引領了目前大數據研究的浪潮。


NLP是為各類企業及開發者提供的用于文本分析及挖掘的核心工具,已經廣泛應用在電商、金融、物流、醫療、文化娛樂等行業客戶的多項業務中。它可幫助用戶搭建內容搜索、內容推薦、輿情識別及分析、文本結構化、對話機器人等智能產品,也能夠通過合作,定制個性化的解決方案。由于理解自然語言,需要關于外在世界的廣泛知識以及運用操作這些知識的能力,所以NLP也被視為解決強AI的核心問題之一,其未來一般也因此密切結合AI發展,尤其是設計一個模仿人腦的神經網絡。


訓練NLP文本解析AI系統需要采集大量多源頭數據集,對科學家來說是一項持續的挑戰:需要使用最新的深度學習模型,模仿人類大腦中神經元的行為,在數百萬甚至數十億的注釋示例中進行訓練來持續改進。當下一種流行的NLP解決方案是預訓練,它改進了對未標記文本進行訓練的通用語言模型,以執行特定任務;它的思想就是,該模型的參數不再是隨機初始化,而是先有一個任務進行訓練得到一套模型參數,然后用這套參數對模型進行初始化,再進行訓練,以獲得更好的預測性見解。


目前我們已經進入了以互聯網為主要標志的海量信息時代,這些信息大部分是以自然語言表示的。一方面,海量信息也為計算機學習人類語言提供了更多的“素材”;另一方面,這也為NLP提供了更加寬廣的應用舞臺。例如,作為NLP的重要應用,搜索引擎逐漸成為人們獲取信息的重要工具,出現了以谷歌、百度等為代表的搜索引擎巨頭;機器翻譯也從實驗室走入尋常百姓家;基于自然語言處理的中文輸入法(如搜狗、微軟、谷歌等輸入法)成為計算機用戶的必備工具;帶有語音識別的計算機和手機也正大行其道,協助用戶更有效地生活、工作和學習。


現在,NLP領域已經有了大量的人工標注知識,而深度學習可以通過有監督學習得到相關的語義知識,這種知識和人類總結的知識應該存在某種對應關系,尤其是在一些淺層語義方面。因為人工標注,本質上已經給深度學習提供了學習的目標;只是深度學習可以不眠不休地學習,這種逐步靠攏學習目標的過程,可能遠比人類總結過程來得更快更好。這一點,從谷歌公司旗下DeepMind研究團隊開發的圍棋軟件AlphaGo短時間內連勝兩位人類圍棋高手的事實,似乎能夠得到驗證。


深度學習在NLP中的應用非常廣泛,可以說橫掃NLP的各個應用,從底層的分詞、語言模型、句法分析、語音識別等到高層的語義理解、語用闡釋、對話管理、知識問答等方面都幾乎都有深度學習的模型,并且取得了不錯的效果。有關研究已從傳統的機器學習算法轉變成更有表現力的深度學習模型,如卷積神經網絡和回歸神經網絡。不過,目前的深度學習技術還不具備理解和使用自然語言所必需的概念抽象和邏輯推理能力,還有待今后進一步的研究。


互聯網搜索引擎已經有一段時間讓人們使用會話語言和術語來在線搜索事物。現在,谷歌公司的云端硬盤用戶已經可以使用這一功能。用戶可以搜索存儲在谷歌云端硬盤中的文件和內容,就像使用谷歌搜索提供的對云端硬盤內置NLP的新支持一樣。該功能使用戶可以使用通常用詞組表達的查詢以及在實際對話中將要使用的查詢來更輕松地找到所需的內容。谷歌公司在在線和移動搜索、移動應用程序以及GoogleTranslate等服務中廣泛使用NLP;該公司在這一領域的研究是為提高機器閱讀和理解人類語言能力所做的更廣泛努力的一部分。隨著谷歌調整其算法,NLP應該會隨著時間的推移變得更好。


前不久,英國劍橋量子計算公司(CQC)宣布,他們利用自然語言的“固有量子”結構,開辟了一個全新的可能應用領域。其通過將語法句子翻譯成量子線路,然后在量子計算機上實現生成的程序,并實際執行問答。這是第一次在量子計算機上執行NLP。通過使用CQC的一流的、平臺無關的可重定目標編譯器t|ket)?,這些程序在IBM量子計算機上成功執行并得到結果,整個突破朝著實現“意義感知”和“語法知悉”的NLP方向邁出了有意義的一大步——這是計算機時代早期以來計算機科學家及計算語言學家追尋的夢想。


美國哈佛大學醫學院的研究人員借助NLP技術最近開發出一種工具,可以評估新冠肺炎(COVID-19)患者的病例、社交媒體和健康衛生數據。他們率先努力通過使用機器學習技術查看來自各種來源的數據和信息(包括患者記錄、社交媒體和公共衛生數據)來尋找新冠肺炎病毒的解決方案。借助NLP工具,他們還可以搜索有關新冠肺炎病毒的在線信息,并了解爆發的當前位置。另外,研究人員還利用NLP技術對新冠肺炎、藥物和疫苗等密集展開研究,同時包括臨床診斷與治療以及流行病學研究等。


中國阿里達摩院的NLP研究團隊提出了優化模型Struct BERT,能讓機器更好地掌握人類語法,加深對自然語言的理解。使用該模型好比給機器內置一個“語法識別器”,使機器在面對語序錯亂或不符合語法習慣的詞句時,仍能準確理解并給出正確的表達和回應,大大提高機器對詞語、句子以及語言整體的理解力。這一技術已廣泛使用于阿里旗下阿里小蜜、螞蟻金服、優酷等業務。阿里達摩院的語言模型和閱讀理解技術也被用于行業賦能,推進AI技術在醫療、電力、金融等行業的落地。據悉,StructBERT模型在2020年被評為全球性能最強的NLP系統。


知名市場分析機構Mordor Intelligence的一份報告指出,在過去的幾年中,深度學習架構和算法在市場格局中取得了令人矚目的進步,而語音分析解決方案正在主導著這一市場,因為傳統的基于文本的分析已不足以處理復雜的業務問題。據估計,2025年NLP市場規模將比2017年增長14倍,從30億美元左右增長到430億美元以上。


總之,隨著互聯網的普及和海量信息的涌現,作為AI領域的重要研究課題和掌上明珠,NLP正在人們的生活、工作、學習中扮演著越來越重要的角色,并將在科技進步與社會發展的過程中發揮越來越重要的作用。


文/林峰、李炎(作者單位分別為美國波士頓大學工學院、普渡大學科技學院)


關鍵詞:




AI人工智能網聲明:

凡資訊來源注明為其他媒體來源的信息,均為轉載自其他媒體,并不代表本網站贊同其觀點,也不代表本網站對其真實性負責。您若對該文章內容有任何疑問或質疑,請立即與網站(www.fennz.com)聯系,本網站將迅速給您回應并做處理。


聯系電話:021-31666777   新聞、技術文章投稿QQ:3267146135   投稿郵箱:syy@gongboshi.com

工博士人工智能網
商城
服務機器人
智能設備
協作機器人
智慧場景
AI資訊
人工智能
智能機器人
智慧城市
智慧農業
視頻
工業機器人
教育機器人
清潔機器人
迎賓機器人
資料下載
服務機器人
工博士方案
品牌匯
引導接待機器人
配送機器人
酒店服務機器人
教育教學機器人
產品/服務
服務機器人
工業機器人
機器人零部件
智能解決方案
掃描二維碼關注微信
?掃碼反饋

掃一掃,反饋當前頁面

咨詢反饋
掃碼關注

微信公眾號

返回頂部
主站蜘蛛池模板: 国产v亚洲v天堂无码 | 久9re热视频这里只有精品 | 精品久久www | 欧产日产国产精品视频 | 亚洲视频精品在线 | 日韩精品极品视频在线观看免费 | 日韩av一卡二卡 | 综合久久亚洲 | 欧美在线免费 | 国产一区二区色 | 99精品免费视频 | 不卡中文一二三区 | 玖玖在线观看 | 欧美亚洲黄色 | 中文字幕高清av | 一级特黄aa大片欧美 | 岛国片在线观看 | 黄色日本片 | 日韩精品视频免费专区在线播放 | 夜夜嗨av色综合久久久综合网 | 国产一二区在线 | 日韩欧美国产一区二区三区 | 久久久久国产精品免费免费搜索 | 国产在线观看免费 | 欧美xxxx18| 国产精品一区二区三区免费看 | 99久久精品国产毛片 | 精品国产免费久久久久久尖叫 | 一区二区高清在线 | 久久久综合久久 | 一区三区视频在线观看 | 午夜黄色大片 | 国产农村妇女毛片精品久久麻豆 | 精品美女一区二区 | a级片在线免费观看视频 | 国产精品一区二区三区久久久 | 99精品小视频 | 久久久一区二区三区 | www精品美女久久久tv | 久久久国产一区二区三区 | 可以在线看的av |