在全球抗擊新冠肺炎(Covid-19)疫情方面,各種各樣的高新科技都有望“大顯身手”,其中最突出的是自然語言處理技術。無論是在抗疫一線,還是在社區管控、疫苗研發等大后方,自然語言處理技術發揮的作用都不可忽視。目前世界上有多個研究團隊使用該技術抗擊新冠疫情,并取得了可喜的成果。
在新冠疫情中,最早正式發出疫情警告的并不是世界衛生組織或美國疾控中心,而是加拿大一家名為“藍點”(BlueDot)的健康監測平臺;它早在2019年12月31日就向其客戶發出了提前疫情警告,避開危險區域。該平臺設計了疾病監測分析程序,使用自然語言處理技術來篩選65種語言的新聞報道,以及航空公司數據和動物疾病暴發的報道,在疫情暴發之初發揮了監測功能。
前不久,美國艾倫人工智能研究所發布了“新冠肺炎開放研究數據集”(CORD-19)的資源管理器以及全文本搜索引擎,并表示希望它可以幫助人們探索數據集并確定潛在的研究成果。該機構語言學家道格·雷蒙德博士說:“過去幾年,我們在自然語言處理方面取得了長足進步,CORD-19這類數據集的實用性可能會比幾年前更大,因為現在我們有了更多可用的工具。”
美國政府曾經宣布聯合艾倫人工智能研究所、微軟研究院、美國國立衛生研究院等機構共同發布有關新冠疫情的學術文獻的開放研究數據集CORD-19,并呼吁世界各地的人工智能專家采取行動,開發新的文本和數據挖掘技術,以幫助科學界回答與新冠疫情相關的高優先級科學問題。其目的是為醫學和自然語言處理研究人員發布疫情數據集,以獲得有助于對抗此次疫情的真知灼見。
美國哈佛大學醫學院的研究人員借助自然語言處理技術最近開發出了一種工具,可以評估新冠患者的病例、社交媒體和健康衛生數據。他們率先努力通過使用機器學習和大數據分析查看來自各種來源的數據和信息來尋找新冠病毒的解決方案。借助自然語言處理工具,他們還可以搜索有關新冠病毒的在線信息,并了解爆發的當前位置。
中國疾病預防控制中心的研究人員最近在使用科技巨頭阿里巴巴達摩院的自然語言處理技術開展病歷文本分析和流行病學調查工作,并取得了階段性成果。達摩院的研究團隊通過自然語言處理回顧性數據、使用卷積神經網絡訓練CT影像的識別系統,它可以快速鑒別新冠影像與普通病毒性肺炎影像的區別,最終識別準確率高達 96%。
智能問診系統能夠在線為病患提供問診服務,其使用應用語義理解、情感分析等自然語言處理技術,通過問題預判、意圖反問、分類識別、相似度匹配等方法,不僅能夠解答何種情況需要就醫,還能實現疫情防控動態進展、科學防護知識、謠言鑒別等問題精準解答,并支持人機協作、自主學習、會話引導等功能。
在疫情防控期間,中國百度靈醫智惠推出的“智能咨詢助手”,包含新冠問題解答、標準化預問診路徑、在線醫生咨詢輔助三大模塊;它通過自然語言處理技術賦能在線健康咨詢平臺、政府疫情防控平臺、互聯網醫院等第三方平臺,助力其直接為公眾提供有關新冠的在線科普、在線咨詢,倍數級提升效率。
疫情發生至今,情況愈演愈烈,人們一邊要提防新冠肺炎的傳染,一邊又要不斷接受著海量的真假難辨的信息的轟炸。但對于后者,自然語言處理技術能夠幫助人們提取信息的主要觀點,識別文章情緒甚至分析文章的可信度;這在抗疫信息戰中將“謠言”粉碎,促進輿論生態良性循環,從而為抗疫工作提供一份助力。
自然語言處理技術在對抗新冠疫情中發揮了重大作用。雖然自然語言處理技術不是萬能神藥,但可以幫助研究人員更快地從醫療數據中提取更有用的信息,挖掘其中的規律,從而加快疫苗研發進程,也有助于進行更有效的治療。自然語言處理技術在本次疫情中的應用證明其在分析醫療和臨床數據中大有可為。
由上可知,自然語言處理可以在抗擊新冠疫情中大顯身手,為打贏這場疫情攻堅戰提供了極為有效的技術支撐。有了自然語言處理技術相助,抗疫工作將變得更安全、更高效。正如中國著名學者周海中教授曾經所言:“自然語言處理是極有吸引力的研究領域,它具有重大的理論意義和實用價值。”
文/李言(作者單位:德國人工智能研究中心[DFKI])