亚洲,欧美,中文字幕,小婕子伦流澡到高潮视频,无码成人aaaaa毛片,性少妇japanesexxxx,山外人精品影院

為ChatGPT祛魅

  撰文/黃湘

  2022年11月,人工智能聊天程序ChatGPT問世,震驚世界。ChatGPT由于可以在許多知識領(lǐng)域給出詳細(xì)和清晰的回答而迅速獲得關(guān)注,而且可以對任何主題寫出仿佛出自真人筆下的文章。不到兩年時間,已經(jīng)有無數(shù)用戶使用ChatGPT寫作或輔助寫作各種文章。

  寫作一向被視為普通人需要花費(fèi)精力才能掌握的智力活動,因此ChatGPT的寫作給人類社會帶來了巨大的觀念沖擊。不少人質(zhì)疑這是否意味著機(jī)器具備了人類的智能,從而正式拉開了機(jī)器取代人類的序幕。不過,在曾經(jīng)當(dāng)過程序員的美國哥倫比亞大學(xué)文學(xué)教授特寧看來,這種想法實(shí)屬大驚小怪。事實(shí)上,幾百年來,機(jī)器一直在幫助我們寫作。在《機(jī)器人文學(xué)理論:電腦如何學(xué)習(xí)寫作》一書中,他梳理了機(jī)器輔助寫作的歷史,探討了應(yīng)當(dāng)如何看待ChatGPT的寫作。

  人類的社會存續(xù)和文明發(fā)展有賴于海量的日常寫作。以醫(yī)院為例,醫(yī)護(hù)人員不僅需要診治和照護(hù)病人,而且需要為每一位病人書寫病歷,將其編目、標(biāo)記、存檔,供以后使用。對于大多數(shù)人來說,寫作是不得不完成的繁重任務(wù)。很早以前,人類就夢想通過某種自動化裝置來分擔(dān)這一任務(wù)。

  17世紀(jì)的德國哲學(xué)家萊布尼茨以和牛頓共同發(fā)明微積分而著稱,但他更為雄心勃勃的夢想是發(fā)明一種語言微積分,建立類似于算術(shù)符號的通用語言符號,能夠在沒有任何字典的情況下被任何人閱讀,從而使語言被納入理性系統(tǒng)之中,并且可以被自動化。1843年,英國著名詩人拜倫的女兒洛夫萊斯為其好友、數(shù)學(xué)家巴貝奇設(shè)計(jì)的分析機(jī)模型撰寫了一份筆記。巴貝奇設(shè)計(jì)分析機(jī)的本意是用于數(shù)學(xué)計(jì)算,但是洛夫萊斯看到,數(shù)字可以表達(dá)其他事物,諸如字母、音符等,一臺操作數(shù)字的機(jī)器也可以依照規(guī)則,以數(shù)字來操作符號。洛夫萊斯首次設(shè)想了從操作數(shù)字到操作符號的轉(zhuǎn)型,她也因此被很多人認(rèn)為是史上第一位電腦程序設(shè)計(jì)師。

  另一條設(shè)計(jì)自動化寫作裝置的路徑來自作家和人文學(xué)者。1895年,法國作家波爾蒂(Georges Polti)出版了一本名為《三十六種戲劇情境》的書,將所有戲劇故事分解為36種基本情境,目的是讓作家在創(chuàng)作任何劇本時,都可以按圖索驥,通過組裝這本書羅列的基本情境而迅速定稿。

  在以后的幾十年里,出現(xiàn)了很多類似的著作,其中最著名的是美國作家希爾在1936年出版的《情節(jié)精靈》。這個精靈的魔力在于把所有曾講述過的故事分解為若干基本情節(jié),并編號列表,用戶只需旋轉(zhuǎn)單獨(dú)銷售的紙板“情節(jié)機(jī)器人”輪盤,就可以每五分鐘自動生成一個完整的故事情節(jié)框架。

  作家試圖提煉基本的戲劇情境和故事情節(jié)來方便創(chuàng)作,民俗學(xué)家則旨在發(fā)現(xiàn)各種不同的文化傳統(tǒng)之間的相似之處,從而揭示出普遍的文化原型。1928年,蘇聯(lián)民俗學(xué)家普羅普出版了《民間故事的形態(tài)學(xué)》,總結(jié)出了一套民間故事的普遍組成法則,包括7種“敘事角色”和31種“敘事行動功能”。普羅普的著作開創(chuàng)了民俗學(xué)的敘事結(jié)構(gòu)研究,與波爾蒂的《三十六種戲劇情境》遙相呼應(yīng)。

  1950年代,美國語言學(xué)家喬姆斯基在語言學(xué)界掀起了一場革命。他認(rèn)為,語言是人類特有的一種天生能力,語言學(xué)不僅應(yīng)該以經(jīng)驗(yàn)主義的方式研究語言行為,更應(yīng)該以理性主義的方式研究語言能力。喬姆斯基創(chuàng)立了“轉(zhuǎn)換-生成語法”理論,“轉(zhuǎn)換-生成語法”是存在于林林總總各種語言底層的普遍語法,一旦掌握了這種普遍語法,就相當(dāng)于構(gòu)建了一套公式,根據(jù)該公式對詞匯加以組合,即可生成具有正確語法的語言。

  在喬姆斯基發(fā)起的語言學(xué)革命的推動下,1961年,麻省理工學(xué)院的學(xué)者英格夫(Victor H. Yngve)首次發(fā)布了隨機(jī)英語句子生成器的研究成果,通過機(jī)器重新生成了一本兒童讀物《小火車》。這項(xiàng)研究由美國軍方資助。軍方之所以對此感興趣,是因?yàn)楫?dāng)時美國正在構(gòu)建自動化的軍事指揮系統(tǒng),由電腦程序快速應(yīng)對突發(fā)威脅,但是,“幕后”的指揮和控制可以使用電腦代碼,面向士兵的“前臺”必須使用自然語言發(fā)出指令,這就要求電腦能夠自動生成自然語言。

  隨機(jī)英語句子生成器無疑是一個重大成就,然而,它所生成的句子總是語法正確,但無意義,比如“無色的綠色想法猛烈地睡著”之類。畢竟,語法只是一個有限且封閉的系統(tǒng),與世界無關(guān);意義則存在于世界中,并且隨上下文而改變。語法控制著句子組成的規(guī)則,句子包含單一的思想。要組成更復(fù)雜的連貫單元,比如段落或故事,就需要更高階的規(guī)則。

  民俗學(xué)的研究成果在此大顯身手。普羅普的《民間故事形態(tài)學(xué)》在1968年被翻譯成英文,且正好趕上了人工智能項(xiàng)目的發(fā)展,即將生成隨機(jī)的英文句子升級為生成隨機(jī)的英文故事,該項(xiàng)目正需要了解故事的普遍組成法則。

  與故事的普遍組成法則相對應(yīng)的,是以皮亞杰為代表的結(jié)構(gòu)主義心理學(xué)派所主張的“圖式”概念。與一般的語言語法不同,圖式描述常見情境的骨架“腳本”,包含預(yù)期角色、地點(diǎn)、目標(biāo)和活動等。波爾蒂“三十六種戲劇情境”相當(dāng)于劇本的圖式,另一方面,兒童在成長過程中積累圖式,作為一種認(rèn)知速記,用于以后的識別。

  如果說語法描述了詞匯在句子中的排列,圖式則描述了事物在世界中的關(guān)系?;谡Z法的生成器能夠生成語法正確但無意義的句子,而在語法和圖式雙重控制下所生成的文本,有可能形成既語法正確又有意義的故事。1976年,米漢(James Meehan)在普羅普著作的啟發(fā)下發(fā)明的TALESPIN程序生成了如下故事:“約翰熊從洞穴入口步行到山谷中的灌木叢,再穿過草地。約翰熊摘下藍(lán)莓。約翰熊吃了藍(lán)莓。藍(lán)莓沒有了。約翰熊不太餓。”機(jī)器先通過數(shù)據(jù)生成了一個虛擬世界,再通過模擬約翰熊角色的推理和行為生成了這個故事,與人類講故事的方式相似。

  對于人類來說,圖式來源于感知現(xiàn)實(shí)世界中的情景,但是機(jī)器如何自己構(gòu)建圖式?答案是通過詞匯之間的相互聯(lián)系。例如,假設(shè)機(jī)器對現(xiàn)實(shí)世界中的燕麥粥一無所知,但它可能會通過輸入的信息學(xué)到這個詞經(jīng)常與碗、吃、桌子、早餐和勺子等詞相鄰,而很少和推土機(jī)或軍火等詞相鄰。根據(jù)這些事實(shí),它能夠合理推測燕麥粥與在桌子上用勺子吃早餐有關(guān),而不是與戰(zhàn)爭或建筑有關(guān)。機(jī)器讀到的關(guān)于燕麥粥的信息越多,它就對其常見的語言環(huán)境了解得越多。

  依照這一思路,可以構(gòu)建另一條生成語言的途徑,即根據(jù)統(tǒng)計(jì)規(guī)則而非普遍語法。這一途徑肇始于俄國數(shù)學(xué)家馬爾可夫在1913年的一項(xiàng)研究,他統(tǒng)計(jì)了普希金的名著《歐根·奧涅金》中的字母之間的關(guān)系,證明了這本書并非字母的隨機(jī)分布,而是存在可以建模的統(tǒng)計(jì)特性。

  信息論創(chuàng)始人香農(nóng)在1948年發(fā)表的經(jīng)典論文《通信的數(shù)學(xué)理論》中發(fā)展了馬爾可夫的思想。他不僅嘗試建立語言的統(tǒng)計(jì)模型,分析字母和單詞相互組合出現(xiàn)的相關(guān)概率,還嘗試使用模型生成文本。

  香農(nóng)先從字母表中隨機(jī)抽取字母以生成句子,得到的句子毫無意義,然后,他修改了抽取模式,比如從字母表中提取出E的概率比Q的概率高11%,由此生成的句子開始跟英語有點(diǎn)接近了。抽取所依據(jù)的統(tǒng)計(jì)模型越復(fù)雜,由此生成的語言與普通英語文本的相似性就越大。

  當(dāng)計(jì)算單詞組合的概率時,事情變得更加有趣。例如,“當(dāng)我長大了,我想要成為……”,從統(tǒng)計(jì)學(xué)來說,這個句子合理的延續(xù)可能是“一名宇航員”“一名醫(yī)生”等。理論上,在給定前一個單詞的情況下,出現(xiàn)另一個單詞的概率是可以統(tǒng)計(jì)出來的。這種依靠統(tǒng)計(jì)數(shù)據(jù)生成句子的方法沒有對于普遍語法的假設(shè),但是其輸出的句子可以與英格夫基于語法的英語句子生成器相媲美。然而,對英語文本中每兩個單詞的組合統(tǒng)計(jì)其出現(xiàn)概率,需要數(shù)十億的數(shù)據(jù)點(diǎn),在很長時間里都是無法在技術(shù)上實(shí)現(xiàn)的。直到進(jìn)入本世紀(jì)以后,隨著電腦計(jì)算能力的爆炸性增長,人類才具備了處理幾乎所有已發(fā)表英語文本內(nèi)容的能力?;诮y(tǒng)計(jì)的語言生成方法成為當(dāng)今大語言模型的主流。

  人類的大腦顯然不是通過輸入海量文本內(nèi)容來學(xué)習(xí)語言,這與大語言模型的學(xué)習(xí)機(jī)制是不同的。當(dāng)人類出于饑餓感說出“我餓了”的時候,會伴隨低血糖等生理反應(yīng),但大語言模型只是出于統(tǒng)計(jì)概率的推測生成了“我餓了”這個短語,而不會具有饑餓的感覺。那么,像ChatGPT這種人工智能模型是否具備真正的智能呢?這是一個在當(dāng)下備受關(guān)注而又眾說紛紜的問題。特寧指出,這個問題本身就是語義模糊的。對于如何看待智能,存在兩種涇渭分明的立場。一種是柏拉圖式的,將智能視為“思想和感覺與普遍真理的內(nèi)在對應(yīng)”;另一種是亞里士多德式的,將智能視為“達(dá)到特定結(jié)果的普遍能力”。

  從前一種立場看,智能具有私人特征,是在內(nèi)心世界發(fā)生的,也是難以言喻的。而從后一種立場看,智能如何在私人的內(nèi)心世界里發(fā)生并不重要;相反,智能好比一個集體共享的池子,除了人類之外,還有各種各樣的東西漂浮在這個池子里。當(dāng)一個人思考某件事的時候,通常會做筆記、和朋友交談、上網(wǎng)查找信息、閱讀書籍、參考教科書上的知識,乃至求助于人工智能程序,這些都是智能的一部分。

  亞里士多德式的立場也是一種外部視角和公共視角的立場,對于智能,我們不必關(guān)心“內(nèi)部或內(nèi)心到底發(fā)生了什么”,而是應(yīng)當(dāng)基于外部的評價標(biāo)準(zhǔn),正如那句著名格言所說的:“如果它看著像只鴨子,走路像只鴨子,叫聲像只鴨子,那它一定是只鴨子。”

  智能的上述兩種意義—柏拉圖式和亞里士多德式、內(nèi)部和外部、私人和公共—使用同一個詞匯,這造成了很大的混淆。如果有兩個不同的詞來分別表示柏拉圖式和亞里士多德式的智能,很多困惑都會得到澄清。

  按照亞里士多德式的立場,人工智能程序,尤其是ChatGPT,當(dāng)然是具備智能的。但這是一種集體協(xié)作的智能,ChatGPT的強(qiáng)大功能是建立在所有已發(fā)表的文本的基礎(chǔ)上,它只是賦予了這種集體協(xié)作一種擬人化的聲音,就好比一個會說話的圖書館。只是因?yàn)槿祟惲?xí)慣用擬人的方式去想象人工智能程序的運(yùn)作,才會誤以為ChatGPT的強(qiáng)大功能是來自一種具有私人特征的智能。

  在集體共享的智能池子里,任何一種智能的機(jī)制或工具,無論最初多么不同凡響,一旦廣泛普及,就會變成平均水平的一部分。比如,使汽車司機(jī)不必手動換擋的自動變速器在1960年代問世之時,曾被視為高度智能的,而如今它只是一個普通設(shè)備而已。同理,ChatGPT強(qiáng)大的寫作功能,也將隨著時間推移而逐漸變得平凡,成為人類的另一種工具。

關(guān)注讀覽天下微信, 100萬篇深度好文, 等你來看……