世界上最多產的寫手:中國算法

也許有一天,所有網頁上的競價廣告全都由機器自動生成。

圖像來源,Getty Images

圖像加註文字,也許有一天,所有網頁上的競價廣告全都由機器自動生成。
    • Author, 道格拉斯·希文
    • Role, Douglas Heaven

阿里巴巴是中國一個類似eBay的批發採購平台,如今已經是電子商務巨頭。無論你想買什麼,小到廚房水槽,大到豪華遊艇,都能在這個網站上找到相應的商品圖片和具體描述。每樣商品都有一個簡短的標題,大多由幾個關鍵詞組成:不論是USB手機充電器還是防火工裝褲,商家為了讓自己的商品在從成千上萬個同類產品之間脫穎而出、出現在搜索結果的前列,這幾個關鍵詞大多經過精心篩選。

這種文案聽上去並不難做,但實際上是一門很講究的藝術。阿里巴巴最近透露,他們正在開發一款能夠自動生成產品描述的人工智能(AI)。在過去的幾十年裏,人們已經用AI寫過音樂,畫過畫,甚至還寫過(糟糕的)詩。而如今阿里的這款AI,每秒能自動生成20000條商品文案。

倫敦大學學院的汪軍(Jun Wang)教授說,「生成型機器人是新一代的聊天機器人,而生成文案副本只是功能之一。」

這款智能文案AI由阿里巴巴旗下數字營銷部門「阿里媽媽」研發,它在深度學習淘寶、天貓上的海量產品描述後,採用自然語言算法的技術,自動生成新文案。

阿里巴巴發言人表示,「以前為了找靈感,通常要花上好幾個小時去研究競爭者的商品目錄和廠家網頁,AI工具解決了這方面的不便。現在只要點幾下鼠標,理想的文案就生成了。」

阿里巴巴最近宣佈,公司正在使用AI生成產品目錄。

圖像來源,Getty Images

圖像加註文字,阿里巴巴最近宣佈,公司正在使用AI生成產品目錄。

儘管他們已在藝術界初做嘗試,但就短期而言,這種系統能發揮的最大作用,還是生成單調乏味的文本,比如廣告文案。軟件每天都能生成數以百萬計的文字和圖片,讓成千上萬的人都能看到,並受其影響。假如系統做的足夠好,我們可能都覺察不到其中差別。

在互聯網上,人與機器代理之間的界限早已模糊。推特(Twitter)機器人經常傳播假消息,垃圾郵件機器人推送的偉哥(Viagra)廣告甚至帶有稀奇古怪的詩意,新聞整合器搜索到在線新聞後能快速洗稿,快到幾乎分不清原創作者是誰,文章又是在什麼時候發表的。

就拿阿里巴巴撰稿器這條新聞來說。英國、美國和印度等國家的幾個新聞媒體追蹤了阿里的英文公關稿。在最早的報道中,有一個相關視頻發佈在「突發新聞」(Breaking News),一個不太出名的YouTube頻道上。視頻裏的配音由一個合成聲音完成,畫面上是一系列阿里和其他電商的資料圖,還配有字幕。視頻描述中藏有出處文本的鏈接,打開後發現,是一篇一小時左右前發佈的文章,發表在印度一個網站——國際商業時報(International Business Times)上。

從洗稿速度之快和製作之草率中不難看出,這個視頻是自動生成的,而且新聞的副標題複製過來後都和正文融為了一體。除了這個阿里巴巴視頻之外,這個頻道的其他視頻都是經過洗稿的國際足球新聞。

雖然不排除新聞題材需要人為篩選的可能,但無論從頻道本身還是其關聯的推特賬號上,都看不出明顯的人工操作痕跡。也因此有新聞報道說有AI能大量創造出AI。總而言之,歡迎來到未來世界:從前怪誕不已的事情,如今早已稀鬆平常。

「這不是科幻小說,」汪教授說。商品推廣的目的性很強,他也因此認為生成型AI能夠勝任這類工作。他表示,「(推廣商品)看重的是點擊率和購買率。我們不是在談藝術創作。」

阿里巴巴稱該AI每秒可生成20000條文案副本。

圖像來源,Getty Images

圖像加註文字,阿里巴巴稱該AI每秒可生成20000條文案副本。

阿里巴巴表示,這款AI操作起來並不複雜。只要提供商品鏈接,點一下鼠標就可以生成產品描述了。阿里巴巴發言人說,「生成的待選文案有很多。用戶可以自己選擇,從文案的長度到風格都可以調整,直到滿意為止。」

當然,這款AI工具還很多產。阿里巴巴稱,它每秒可以生產2萬條文案,每天有近百萬的使用量(用戶包括美國服裝品牌Dickies)。出於不同的頁面大小需要,有些公司需要的廣告文案不只一條,而他們希望這一系列的文案都能夠吸引消費者的眼球。

阿里不是唯一一家使用AI的企業。京東是阿里巴巴的主要競爭對手之一,他們表示也在使用一種稱之為「AI編寫機器人」的軟件生成商品描述。技術網站ZDNet的報道稱,京東的AI系統每天可以生成超過1000條文案,語言華美,能把婚戒描述成是佳偶天成的象徵。

然而,佐治亞理工學院的里德爾(Mark Riedl)卻懷疑這類AI工具有沒有公關口中那麼出色的能力。阿里巴巴在其新聞稿中聲稱,他們的AI編寫器已經通過了圖靈測試(即已經擁有了人類智慧),暫且拋開結論不談,其中的過程也疑點重重。有一點是,我們不知道AI系統對流量轉化率——也就是顧客的點擊率和購買率,有多少助益。

里德爾說,生成類系統無疑十分擅長學習撰寫描述事物的文本,「只要一張圖片或幾個關鍵詞就能寫出一段商品描述。」AI能夠識別照片,換句話說,AI只要調用對這張照片所有的理解,就可以串聯出一小段商品描述,看起來和人類寫的別無二致。

阿里巴巴的競爭對手京東表示,它也在使用人工智能來生成商品描述。

圖像來源,Getty Images

圖像加註文字,阿里巴巴的競爭對手京東表示,它也在使用人工智能來生成商品描述。

生成文案只是完成了一半工作。「文案寫作還是要考慮到長尾理論,」里德爾說。尤其是在互聯網熱點競爭如此激烈的今天,要將點擊量轉化成銷量,就一定要找凖群體和市場定位,了解他們的喜好,解決他們的訴求。

「這是一款相機,有一堆七七八八的功能,這麼寫文案肯定不夠。文案上肯定需要展現為什麼這款相機值得買,有什麼獨一無二的功能。」里德爾說。「要寫出這樣的文案則需要更多的信息,這就要求寫手更了解這款產品,以及產品所針對的消費群體。」

阿里和京東的機器學習技術有一個共同的問題,那就是AI學習到的話術很難出彩。里德爾說,「對於一般的文體而言,AI一定會掌握得很好,但如果想要追求專業、追求獨到,那就十分棘手了。我們的科技水平還沒有到達那個高度。」

事實可能確實如此,但這正是我們前進的方向。

想要了解為什麼難以出彩,首先需要了解廣告如何做到了解用戶,然後精凖投放。例如王旭與人聯合創辦的伽馬傳媒公司(MediaGamma),主要利用強化學習的算法為廠商提供廣告服務——強化學習是機器學習的一種,深度思考(DeepMind)旗下著名的圍棋聖手阿爾法狗就是採用這種算法。一個有廣告的網頁,每個人打開看到的廣告可能都不一樣,因為這些廣告是基於用戶喜好而精凖投放的。

網頁一旦開始加載,英特網上的廣告代理商就能知道是誰打開了這個頁面,隨即便開始了一場快速的競價戰,最後得以展示的廣告通常是近100個廠商之中的競價最高者。整個過程不過100毫秒,比眨眼還快。

在這場自動化競價戰中,伽馬傳媒的AI扮演了一個智能開價的角色。這個人的注意力值多少錢? 「我們不知道你是誰,但我們知道你的上網記錄,」王旭說。

谷歌掌握著三個最大的廣告網絡公司——廣告聯盟(Adsense)、移動廣告(AdMob)和雙擊公司(DoubleClick)。而谷歌的追蹤器幾乎覆蓋了百萬個最受歡迎網站的75%,它幾乎能追蹤到互聯網上的每一寸土地。即使逃出了谷歌的手掌心,大概也難逃臉書(Facebook)追蹤器對剩下25%網站的追蹤。

追蹤器會記錄下搜索條目、訪問頁面以及停留時長。假如有個人愛好收集鞋子,追蹤器就會記錄下他從哪個網店買了哪雙鞋子。伽馬傳媒的AI能夠根據手頭上的信息對互聯網用戶進行歸類。假如有人的上網記錄恰好與那位剛好買過鞋子的人類似,AI就會讓鞋商開始投標競價。

王旭說,「收到廣告的人可能馬上就會萌生要買鞋的想法。對於某個市場中的某一用戶群體,我們還需要估算中標的金額。」

新華社稱,其機構已經開始使用人工智能來生成新聞簡報。

圖像來源,Getty Images

圖像加註文字,新華社稱,其機構已經開始使用人工智能來生成新聞簡報。

這僅僅只是個開始。上個月,伽馬傳媒獲得了英國政府的「創新機構」撥款,用於開發更先進的AI,為定向廣告生成文本和圖像。這款AI將高度融合阿里廣告撰稿器和當前伽馬傳媒的用戶分析技術。很快,人們就可以利用這個技術來快速生成定向廣告,不用再通過上網記錄來分析要投放哪些廣告了。「我們可以根據個人喜好來製作橫幅廣告,」王旭說。

如果這項技術被阿里掌握,那麼就能生成定制的商品描述,即根據個人的購買習慣和購物偏好來生成商品描述,也就完美地符合了里德爾所設想的長尾效應模型。

AI系統確實是越來越智能,但它們是否愈發富有創造力?海明威寫過一個著名的故事,僅由三個詞組成:「出售:嬰兒鞋,全新。」可以說類似於阿里巴巴的AI撰寫的文案。在海明威筆下,這三個詞能讓人產生情感共鳴。這種能力來自於他對人類生活的深刻理解,這是機器永遠所不能具備的。即便AI生成了同樣的詞,人類也難以有所共情。

至少到目前來講,人們還沒突破這一技術壁壘。里德爾致力於培養AI的敘述能力,讓它像人類一樣,能夠構建故事、理解情節。謝扎雷德(Shezarade)是里德爾開發的一個實驗系統,能夠基於人類日常活動(例如看電影)生成簡單的敘述文字。以下是其中一個故事的摘錄:

約翰(John)開車去莎莉(Sally)家,他的掌心全都是汗,心臟狂跳不止。這是他倆的第一次約會。莎莉那漂亮的白色連衣裙隨風飄動,她小心翼翼地坐進約翰的車。約翰和莎莉開車去了電影院。約翰和莎莉把車停在了停車場。為了給自己打氣,約翰提前買好了電影票。檢票員是一個臉色蒼白的人,約翰出示了電影票,兩個人就入場了。莎莉口渴了,約翰急忙在電影開始前買了飲料。

約翰和莎莉在影院後方的兩個好位置上坐了下來。約翰坐下之後抬起了扶手,這樣他和莎莉就可以依偎在一起了。電影播放時,約翰緊張地喝著他的飲料,同時更加關注莎莉。最後他鼓起勇氣伸出手抱住了莎莉。他感覺到莎莉在回應他,既是寬慰又是狂喜。中途莎莉站起來去洗手間,在出口前羞怯地對著約翰微笑。

雖然確實沒有海明威的故事動情,但AI生成敘事文本的能力正在逐漸提升。里德爾認為,敘事能力能夠幫助AI貼近人類看待世界的方式——編故事通常能幫我們明白一些事。如果能掌握人類理解事物的能力,與AI溝通(像Siri那樣)也會更人性化一些。

除了能編故事、做銷售,創意型AI還能為選舉服務,針對不同人群生成各種競選運動的電子郵件和社交推文。第一台能夠生成新聞簡報的AI編寫器已經誕生:新華社近期宣佈將使用軟件生成部分新聞報道。許多人認為新華社是中國政府的宣傳機器,因此此舉引起了不小的關注。數百個AI同時寫一個版本的故事,其影響一定難以制衡,產生的新聞偏見也一定對社會影響巨大。

但科技的行進方向就是這樣。如今越來越多的企業、政治活動家以及諮詢公司都開始使用人工智能來輔助交流。即使知易行難,我們也應該盡力去分辨哪些東西是AI撰稿,趁現在還能有所區分。也許有一天,所有網頁上的競價廣告全都由機器自動生成。王旭說:「沒有人會察覺。」

請訪問 BBC Future 閲讀 英文原文