寫作這事,AI能幫什么忙?
- 來源:《第一財(cái)經(jīng)》YiMagazine smarty:if $article.tag?>
- 關(guān)鍵字:寫作,AI,語(yǔ)文 smarty:/if?>
- 發(fā)布時(shí)間:2024-05-10 16:55
每次寫稿,最痛苦的都是開頭。所謂下筆無神,坐在電腦前東摸西摸,百般拖延,就是沒有辦法開始敲第一行字。
如果面向全國(guó)中學(xué)生做一個(gè)問卷調(diào)查,問他們最痛苦的任務(wù)是什么,語(yǔ)文作文將可能成為第一名。據(jù)我觀察,許多人在中學(xué)語(yǔ)文課堂上留下的夢(mèng)魘足以伴隨一生,會(huì)在每次需要提筆寫作的時(shí)候突然被喚醒,讓人忘記如何說人話。
但寫作又是一件無法避免的事情。即使不用寫專欄,即使工作和寫作沒有直接關(guān)系,恐怕也要寫文檔、寫工作計(jì)劃、寫述職報(bào)告、寫會(huì)議記錄……還有婚禮的致辭、葬禮的悼詞等等,都需要寫。如今不管是控訴上司還是伴侶也流行往社交媒體發(fā)小作文,而作文寫得好不好,直接影響傳播效果。
我不是專業(yè)的寫作者,但高考語(yǔ)文也考了快140分,寫作文對(duì)我來說理論上不在話下。感謝我的舅媽和歷任語(yǔ)文老師,讓我知道寫作的本質(zhì)是表達(dá),最重要的還是要感受自己想要表達(dá)什么。即使如此,還是很難動(dòng)筆:不是沒有東西要寫,但面對(duì)千頭萬緒的混沌狀態(tài),似乎還是很難撕開一個(gè)口子,摧枯拉朽地讓腦子里面的東西一瀉而出。
每當(dāng)此時(shí),我又會(huì)開始想,AI能提供什么幫助。于是,在拖延寫作的這段時(shí)間里我又會(huì)將市面上的AI工具嘗試一圈,看看到底有沒有哪個(gè)能給寫作幫上點(diǎn)忙。
AI寫作,或者說AI生成文本,出現(xiàn)的時(shí)間早于ChatGPT。事實(shí)上,GPT一開始就是用來生成文本的,只是后來OpenAI發(fā)現(xiàn)也可以用來聊天(畢竟聊天本質(zhì)上就是兩個(gè)人根據(jù)之前的聊天記錄繼續(xù)生成文本),這才改造出了ChatGPT。
我最早試用的文本生成產(chǎn)品是Notion中的AI寫作功能,它從2022年11月中旬開始內(nèi)測(cè),比ChatGPT的推出還早半個(gè)月。同一時(shí)間,我使用的筆記產(chǎn)品Craft也推出了自己的同類功能。它們的背后都是GPT或者Claude,我記得我在那兩個(gè)月的專欄中就嘗試過使用AI寫作。
快進(jìn)到今天,幾乎所有國(guó)外的辦公軟件中都已經(jīng)集成了生成式AI功能,包括微軟和Google在內(nèi)的許多技術(shù)公司最喜歡在發(fā)布會(huì)的舞臺(tái)上演示的一個(gè)場(chǎng)景就是一鍵生成各種長(zhǎng)篇大論,比如郵件、文檔、營(yíng)銷計(jì)劃等。
效果如何呢?可以想象,如果你只是輸入“幫我寫一篇專欄吧”,AI會(huì)瞎編一篇多么廢話連篇的文章。這并不是由什么技術(shù)限制導(dǎo)致的,不是我們常說的“AI幻覺”。還是用我們經(jīng)常打的比方,如果把AI看成一個(gè)受過良好教育的實(shí)習(xí)生,它今天初來乍到,對(duì)你一無所知,一上來就要求人家“寫篇專欄”,它除了瞎編,還能做什么呢?
當(dāng)然,如果你提的要求不太需要對(duì)你有所了解,而是基于常識(shí),那生成效果相對(duì)是比較好的,比如我曾經(jīng)用AI來生成事故處理協(xié)議、給客服寫的投訴信、大眾點(diǎn)評(píng)上的評(píng)論、閑魚的商品文案……
至于各大公司畫的“一鍵生成”的餅,我覺得還是代表了人們的美好幻想,就和人們幻想長(zhǎng)生不老一樣。去年我剛開始了解大語(yǔ)言模型時(shí),讀的是王建碩老師的幾篇科普文章,它們從使用者的視角教你如何和AI打交道。其中有一句話我印象很深,“不要把ChatGPT當(dāng)作你肚子里的蛔蟲”。是呀,讓陌生人一鍵寫出來的東西,能用就怪了,但有趣的是,這就是我們對(duì)AI的期待。
也不能完全怪人類,誰讓今天的AI很少反問呢?如果是一個(gè)真的實(shí)習(xí)生,我大概會(huì)教他,一定要學(xué)會(huì)反問,而不是瞎編。向Perplexity提問時(shí),如果問題比較模糊,它會(huì)反問以確認(rèn)自己是否正確理解了你的問題,我們自己在做AI產(chǎn)品時(shí)也非常希望AI不要添油加醋,并且能學(xué)會(huì)反問。有了反問,這就讓人放心很多。
如果對(duì)方不懂得問,那就要主動(dòng)告訴別人,就像我們也可以吩咐實(shí)習(xí)生,你先把這些資料讀一下。
讓AI讀資料還是有點(diǎn)兒麻煩的,這主要怪聊天界面。今天大多數(shù)的大語(yǔ)言模型標(biāo)配的都是聊天界面,尤其是剛剛推出的最新模型,一般都只能通過官方的聊天界面使用,還沒有開放給第三方應(yīng)用。在這點(diǎn)上,聊天框有點(diǎn)像是上個(gè)時(shí)代的搜索框,是一個(gè)萬能的基礎(chǔ)形態(tài),任何需求都能滿足,但也有很多需求用它來滿足并不順手。
例如我最近安利給很多朋友的Kimi,其特點(diǎn)是長(zhǎng)文本,但就官方舉例的使用場(chǎng)景來說,不管是往聊天框里面輸入200萬字,還是傳500份簡(jiǎn)歷,或者在別的地方看到一個(gè)網(wǎng)址再?gòu)?fù)制粘貼過來,都不算順手。
另外一個(gè)障礙,則是市面上所有的產(chǎn)品都照搬了ChatGPT的設(shè)計(jì),用戶可以和AI開啟多個(gè)對(duì)話記錄,然而這些對(duì)話是不會(huì)共享記憶的。當(dāng)然,這么設(shè)計(jì),本來就是因?yàn)榇饲暗拇笳Z(yǔ)言模型上下文窗口很小。這可以粗略理解成AI只有短期記憶,很容易出現(xiàn)聊著聊著AI就忘了剛剛說過的話的情況,所以才需要這樣的設(shè)計(jì),保持每個(gè)對(duì)話較短。
但這帶來一個(gè)問題,就是我每次想讓AI完成一個(gè)新的任務(wù),都得重新給它背景資料。這有點(diǎn)像你每次見到你的實(shí)習(xí)生,他不認(rèn)識(shí)你。由于經(jīng)常需要請(qǐng)AI重新閱讀資料,之前我花時(shí)間把往期專欄整理成了不同格式、大小的文件,放在桌面上,方便隨時(shí)上傳。普通人是不會(huì)有耐心來做這個(gè)事情的,相比“提示詞工程”的難度,這一點(diǎn)更容易阻礙普通人使用AI。
其實(shí),AI能順暢閱讀背景資料也就是最近才能實(shí)現(xiàn)的事情。本專欄已經(jīng)寫了25期,共約10萬字,超過了市場(chǎng)上大部分模型的上下文窗口,也就是說,沒有辦法直接放在AI的短期記憶里面。一般的產(chǎn)品會(huì)用一個(gè)叫RAG的方式去解決這個(gè)問題,這是一個(gè)外掛的“大腦”,打個(gè)比方,有點(diǎn)像腦子里裝不下的東西先抄在小抄上,等考試要用的時(shí)候再去翻。不在腦子里的東西,運(yùn)用起來效果還是會(huì)大打折扣的。
據(jù)我所知,市面上普通人能接觸到的支持10萬中文字的產(chǎn)品只有Kimi。Google的Gemini Pro 1.5也能支持,不過目前只通過API提供給開發(fā)者,還沒有被整合到Google的產(chǎn)品中。Kimi最近開始內(nèi)測(cè)200萬字的上下文窗口,更是大幅提升了這個(gè)門檻。有些產(chǎn)品宣稱支持1000萬字,據(jù)說是使用RAG的方式實(shí)現(xiàn)的—通過這種方式,想裝多少字其實(shí)都可以。
實(shí)際上,200萬字和最初的ChatGPT相比,已經(jīng)提升了1000倍。產(chǎn)品形態(tài)可以有一些變化了。
說回用AI輔助寫作。大家知道,正常情況下你是不會(huì)在一個(gè)聊天窗口中寫作的,而是會(huì)用類似Word這樣的文檔編輯工具。那如果你同時(shí)需要和AI“聊天”,那就麻煩了,得幾個(gè)窗口切來切去,來回不斷地復(fù)制粘貼才可以。如果對(duì)AI生成的內(nèi)容大體滿意,但只是想精準(zhǔn)地調(diào)整一大段文本中的一句話呢?要用語(yǔ)言描述這種要求非常困難。我之前嘗試過請(qǐng)AI修改文風(fēng)、校對(duì)、編輯、簡(jiǎn)化語(yǔ)言……都非常麻煩。
最近我倒是發(fā)現(xiàn)了一個(gè)挺好用的工具。你可能猜不到,這篇專欄是在VS Code中寫的。這是微軟面向程序員推出的一個(gè)用來編程的編輯器,購(gòu)買了GitHub Copilot后,可以隨時(shí)在里面召喚AI來撰寫、修改代碼。反正代碼和專欄都是語(yǔ)言嘛,效果還是不錯(cuò)的。
針對(duì)不同的場(chǎng)景去做“順手”的界面并不難。比如總結(jié)鏈接就不如做一個(gè)瀏覽器插件,一個(gè)實(shí)習(xí)生花一個(gè)周末就能寫出來。為什么不做呢?我猜測(cè)有一些特別的考慮。當(dāng)然,也有可能是我想多了。去年這個(gè)時(shí)候我曾經(jīng)在直播中和其他CEO討論過為什么ChatGPT不推出App,對(duì)方列舉了一些理由,而我說可能只是還沒有做出來罷了。果然,過了不久,ChatGPT就推出了自己的App。
也可能是我把這事兒想簡(jiǎn)單了。多年的工作經(jīng)驗(yàn)告訴我,工程師們總會(huì)高估解決一個(gè)問題的難度,而低估其工作量。
那聊天適合做什么事情呢?回想現(xiàn)實(shí)中的寫作過程,和編輯、記者聊天,回答他們的問題,本身就是一個(gè)不錯(cuò)的獲得寫作靈感的方式。所以,和AI討論選題,請(qǐng)它扮演讀者告訴我想看什么,甚至把大綱給它看看,討論下能不能用有創(chuàng)造性的方式來梳理故事線……這些操作的使用感受都還不錯(cuò)。
今天的AI產(chǎn)品一是缺少關(guān)于我的個(gè)人數(shù)據(jù),二是缺少直接執(zhí)行操作的能力,這些都導(dǎo)致它們沒有辦法對(duì)普通人“開箱即用”。
王建碩老師的那句話我一直在想。一開始是從使用者的角度提醒自己,不要把AI當(dāng)成我肚子里的蛔蟲。但后來切換到做事情的角度,就會(huì)想,憑什么AI不能成為使用者肚子里的蛔蟲呢?我們?cè)趺礃硬拍茏孉I成為使用者肚子里的蛔蟲?在腦機(jī)接口被廣泛應(yīng)用之前,還是需要一些別的方式。
這也是為什么我之前很期待Google和微軟分別將AI整合到自己的辦公套件中,即Google Workspace和Microsoft 365(它的原名Office大家更熟悉一些)。我個(gè)人在Google中保存的數(shù)據(jù)更多,20年來的郵件記錄和工作文檔都在Google,理論上它應(yīng)該比蛔蟲更了解我。而它們的AI都可以直接在編輯器中使用,理論上可以省去了來回復(fù)制粘貼之苦。
Google的版本(Gemini for Google Workspace)我在3月初拿到了內(nèi)測(cè)權(quán)限,而微軟面向個(gè)人的Copilot Pro在1月發(fā)布,我也第一時(shí)間購(gòu)買了。但測(cè)試結(jié)果都讓我非常失望,它們?nèi)匀豢雌饋硪粏柸恢?,想?qǐng)它們幫忙修改的文檔,十個(gè)也有九個(gè)做不了,不知道到底實(shí)現(xiàn)難點(diǎn)在哪里。
這個(gè)領(lǐng)域還是有很多做新產(chǎn)品的機(jī)會(huì)的。有一些產(chǎn)品已經(jīng)擁有關(guān)于我們的大量數(shù)據(jù),自然做起來比較容易。有一些開發(fā)者另辟蹊徑,希望用不同的方式來獲得用戶的數(shù)據(jù)。我去年提到過的Rewind通過直接錄屏的粗暴方法采集數(shù)據(jù),我堅(jiān)持使用了一年多,電腦中存下了108GB的錄屏,應(yīng)該有接近3000小時(shí)。但這些數(shù)據(jù)怎么用,似乎也還沒有好的方法,噪音過多,AI無法區(qū)分哪些重要哪些不重要。另外有幾個(gè)新的硬件產(chǎn)品,如Humane Ai Pin、Rabbit R1等,通過隨身錄音的方式采集數(shù)據(jù),不知道會(huì)不會(huì)遇到類似問題。
是不是其實(shí)沒有必要收集用戶所有的所見所聞,努力降低用戶輸入的門檻,也能捕捉到更多有一點(diǎn)點(diǎn)價(jià)值的火花?這是我正在嘗試的?,F(xiàn)在我自己大部分的碎片想法都放在原型產(chǎn)品中,寫稿的時(shí)候拿出來,也是靈感的來源。
