斯坦福教授

2022-12-13 07:45:02 字數 4149 閱讀 6984

2條評論

分享到:

騰訊微博qq空間qq好友新浪微博

未來十年,人工智慧系統可以從乙個良性迴圈中受益 :我們需要依靠知識,才能很好地理解語言。反過來,我們需要的知識也蘊藏在語言中,分散在世界各地的書本和網頁上。

如果計算機能利用好這個知識語言迴圈,那麼它的語言理解能力就能大幅提公升。

克里斯多福·曼寧(christopher d. manning),史丹福大學電腦科學和語言學教授

近年來,電腦和手機應用軟體在人際溝通中已經變得不可或缺:微博、微信、臉書(facebook)、skype,以及很多其他軟體。這是乙個巨大的轉變,但在這一潮流中電腦主要充當聯網裝置,用於在人與人之間傳送資訊。

很快,我們與電腦的對話將會更進一步,我們將使用電腦進行跨語言交流,不管是獲取資訊,還是休閒娛樂。而電腦則將像人類一樣,通過閱讀和聆聽來學習新的話題。

推進這些進步的技術就是「自然語言處理」(natural language processing,簡稱nlp)。nlp通過使用計算技術,來達到學習、理解,以及生**類語言的目的。隨著電腦計算能力增強和人類語言**資料的增多,nlp得以飛速發展。

我們將不必再耗費時間點選按鈕或試圖從下拉列表中做出選擇——這些操作在手機這樣的小型裝置上往往十分不便——未來十年裡,我們在與電腦互動時,會越來越多地採用人類自然而強大的溝通方式:語言。

對話**

過去四年中,計算機語音識別的精確度經歷了乙個轉折點。如果你最近沒有試過語音識別,現在就拿出手機試一下吧!儘管語音識別技術在穩步提高,但長期以來這項技術仍不足以激發普通使用者的興趣。

如今,一般的手機都能正常識別出人們說出的詞語了,而且人們為了方便,也在越來越多地使用語音互動。這一巨大進步主要源於一項叫做「深度學習」(deep learning)的技術。深度學習指的是大型、多層次人造神經網路的運用,這些人造神經網路可以經過自動訓練,學到有用的特徵表達。

首先,人們開發出了深度學習聲學模型(deep learning acoustic models),它更善於解碼人類語音,它學會的模式識別(pattern recognition)中的聲學模型,比以往機制中的人為設計的模型更為靈活。在此基礎上,包括谷歌(google)和百度在內的多家公司,都已經開始向完全基於深度學習的語音識別系統發展。

然而,單詞識別的成功並不意味著電腦現在就能理解人們在說什麼了。我們現在能向手機虛擬助手順利地提一些簡單的問題,例如:「**能看到最新上映的《星球大戰》電影?

」但是如果你的問題需要更多地依賴上下文關係來理解,例如:「我今晚的航班因為天氣原因取消了嗎?」那麼電腦的語言理解能力可能仍有欠缺。

準確的語言理解需要計算機具備人類的知識。例如,試比較下面這兩句話,出自計算機科學家歐內斯特·戴維斯(ernest d**is):

i used an old rag to clean the knife, and then i put it in the top drawer.

我用一塊舊抹布把小刀擦乾淨,然後我把它放在了最上層的抽屜裡。

i used an old rag to clean the knife, and then i put it in the trash.

我用一塊舊抹布把小刀擦乾淨,然後我把它放進了垃圾桶裡。

「它」(it)無疑既可以指小刀又可以指抹布。我們動用自己對理性人類行為的理解,來判斷「它」在這兩個句子中的所指。nlp研究人員正在研究如何更多地利用語言的含義(語義學),以及它在上下文中是如何被解讀的(語用學),來解決共同指代(coreference)的問題——例如上述的「它」指什麼——以及解讀句子的其他問題。

舉例來說,如果有人說「****」(stock markets shuddered),它的意思是股價大幅**,而不是物理性的顫抖。

人類語言的使用遠遠超出了陳述事實和提出問題的範疇。語言的使用很大程度上是社交性的:我們用語言來分享情感、消磨時光,以及與其他人聯絡。

nlp研究工作最近要解決的就是語言在這種社交層面上的問題。現代計算機的文字轉語音系統,比過去所用的機械人式語音改進了很多,因為它能表現出一些語調了。微軟亞洲研究院(microsoft research asia)在「小冰」(xiaoice)聊天機械人的研發上取得了很大成功,原因就在於它可以持續進行口語對話。

當被問到關於乙個南韓明星的問題時,小冰以非常喜人的方式回應道:「你看到她上週演唱會的**了嗎?簡直太棒了 \(@v@)/」。

小冰是基於文字的對話**的乙個例子。儘管語音在某些場合的確很方便,但在辦公室或在公共運輸設施等場合裡,文字訊息就更方便。對於使用文字而非app來建立對話式的互動介面而言,微信已經走在了世界前沿。

隨著此類系統的改進,很多人可能會選擇基於文字的對話來完成交易,而不是在一百個不同的手機app當中反覆翻找。

機器翻譯

在過去30年裡,技術進步不利於小語種,而是促成了英語統治地位的不斷鞏固。不過,未來30年,技術將消除語言壁壘,讓中等規模的語種和大語種的使用者,更輕鬆地與世界各地的人交流。機器翻譯的研究始於上個世紀五十年代末,是計算機最早的非數字應用之一。

不過,早期的系統只能理解很少幾條簡單的語法規則,並在詞典裡查詢單詞單一的解釋。人類語言可比這個複雜地多。根據上下文,乙個中文詞比如「上場」,可能需要翻譯成英文的「went on stage」、「took the field」,甚至「entered」。

新千年的到來也為我們帶來了包括多語言對照文字的大量線上文字,也出現了更強大的計算能力以及建立統計學機器翻譯系統的新設想。

短短幾年,這些想法已經在幾家大型網際網路公司轉化成了現實,發展成為了谷歌翻譯(google translate)和必應翻譯(bing translate)等服務。通過以小短語為單位進行翻譯,這些服務的質量得到了很大提公升,能支援幾十種語言之間免費和實時的互譯。不過目前提供的翻譯的準確程度,還只能讓使用者明白大概的意思。

但語言技術一直在飛速進步。過去兩年,基於深度學習的序列模型的使用,讓一種很有前景的機器翻譯新方法得到了發展。這些模型將詞語和句子的意思,體現為用實數構成的語義向量之後再被翻譯成不同語言對應的詞。

2023年12月,在越南舉行的口語翻譯大會上發布的成果表明,運用我在史丹福大學的團隊提出的這些構想的系統,錯誤率比第二名至少低25%。

機器閱讀

在人工智慧問世的頭幾十年,研究人員就已經知道,通往智慧型計算機的道路就是讓計算機能夠獲取大量知識。因此他們開始嘗試手工搭建結構化的大型知識庫。這一嘗試沒有成功:

知識庫在結構上太過死板,當時的計算能力還不足以有效地理解建立好的知識庫,而且在當時,想建立足夠全面的知識庫也是不可能的。

今天,我們已經成功地建起了規模巨大的知識庫,維基百科(wikipedia)就是乙個很好的例子,而且網上還有規模龐大的科學文獻。但這些知識都是用人類語言編碼的。研發機器閱讀的動機就源於這裡。

乙個初步的目標是提取基本事實,比如兩個實體之間的關係:配偶(碧昂斯,jay z)。在很多專業領域,類似這樣的關係體系已經建立完成了。

例如,有若干家公司在嘗試建立從簡歷中提取資訊的系統。同樣的技術已被用來生成科學資訊資料庫,如基於文字報告的藥品***資料。除了簡單明瞭的事實,如何提取觀點和態度更有意思。

於是,乙個以情感分析和社交**監測為核心的行業應運而生,利用計算機系統挖掘人們對特定企業、產品和人的想法。

目前的工作目標是盡量拓展語言理解的範圍,向真正的機器閱讀靠攏。這一目標實現後,計算機系統就可以圍繞基於某個文字描述的乙個主題,進行學習。例如,我的團隊已經開始著手研發乙個系統,該計算機系統通過閱讀教科書,嘗試學習如細胞**或光合作用等生物過程。

這是個激動人心的研究目標,但是目前,我們的技術能力仍然十分有限,無法完成這種真正的知識建構。

結語在地球不斷進化的歷史程序中,視覺已經存在了大約5億年,但人類發展出語言的時間相比之下卻短得多,有大約10萬到200萬年。溝通的力量讓我們超越了其他物種。更近些時,人類創造出讓知識交流跨越時空距離的文字。

在短短2023年時間裡,它就把我們從青銅器時代,帶到了今天的智慧型手機時代。對於人工智慧的探索,需要電腦具備運用語言溝通和學習的能力,其中所需的技術如今正逐步成為現實。未來十年,我們的人工智慧系統可以從乙個良性迴圈中受益:

我們需要依靠知識,才能很好地理解語言,反過來,我們需要的知識也蘊藏在語言中,分散在世界各地的書本和網頁上。如果計算機能利用好這個知識語言迴圈,那麼它的語言理解能力就能大幅提公升。

更多作者資訊

克里斯多福·曼寧著有:

《統計自然語言處理基礎》(foundations of

statistical natural language processing(1999) ,《資訊檢索導論》(introduction toinformation retrieval (2008)

全文由《博鰲觀察》2023年4月刊刊載

斯坦福 比奈智力量表總結

張學豔 20131332065 經濟管理學院人力資源管理2班 一 斯坦福 比奈智力量表發展狀況 斯坦福一比奈智力量表是1916年對 比奈一西孟智力量表 修訂而成的,其後又進行了三次修訂。1916年美國史丹福大學特曼對比奈 西蒙量表所作的修訂版。該修訂本不但對每個測題的實施程式及評分方法作出了詳細的說...

史丹福大學校長

史丹福大學校長 中國建成世界一流大學還需20年 2010年05月03日 03 31揚子晚報 中國高校距離世界一流大學到底還有多大的差距?在耶魯 牛津 劍橋 斯坦福這些國外頂尖大學校長的眼中,中國高校當前最需要變革的是什麼?怎麼才能解答 錢學森之問 讓高校培養出傑出人才?在昨天於南京舉行的中外大學校長...

賈伯斯史丹福大學演講

蘋果公司ceo賈伯斯在史丹福大學的演講 我很榮幸和大家一道參加這世界上最好的一座大學的畢業典禮,我大學沒畢業,說實話這是我第一次離大學的畢業典禮這麼近,今天我想給大家講三個有關我自己的故事,不講別的,也不講大道理,就講三個故事。第乙個故事講的是點與點之間的關係,我在里德學院唯讀樂六個月就退學了,此後...