德國《世界報》2024年12月31日文章,原題:圖書市場的人工智能革命從現(xiàn)在開始 在編輯的辦公桌上,通常堆滿了大量投稿和報告,其中絕大多數(shù)未經(jīng)細(xì)讀就被扔進(jìn)了廢紙簍。而那些被錯過的稿件中,可能也隱藏著未來的暢銷書。這樣的遺憾對于出版社來說無疑是巨大的損失。例如,喬治奧威爾的小說《動物農(nóng)場》就曾被多家出版社拒絕。阿加莎克里斯蒂和J.K.羅琳等作家的作品,在成名之前也都經(jīng)歷過類似的拒絕。
為降低出版行業(yè)的經(jīng)濟(jì)風(fēng)險,負(fù)責(zé)追蹤書籍銷售數(shù)據(jù)的市場研究公司Media Control與咨詢及軟件公司Bearing Point合作,推出了這款人工智能預(yù)測工具“Demandsens”,并且德國出版商從2025年1月起被允許使用該工具。據(jù)稱,該工具可以通過分析銷售數(shù)據(jù)、消費(fèi)者行為和季節(jié)性趨勢等信息,以平均85%的準(zhǔn)確率預(yù)測書籍的銷量。
斯坦福大學(xué)的喬迪阿徹和馬修L喬克斯曾分析2萬多本《紐約時報》暢銷書,試圖通過算法解剖暢銷書的成功密碼。他們發(fā)現(xiàn),暢銷書往往具備某些特征:故事發(fā)生在城市;女主角28歲;更強(qiáng)調(diào)親密關(guān)系而非性;以及角色喜歡狗勝過貓。人工智能是否能依據(jù)這些特征創(chuàng)造出一本暢銷書?然而,“暢銷書”在文學(xué)史上其實(shí)是一個相對年輕的概念。自1891年《書商》文學(xué)雜志開始發(fā)布書籍銷量數(shù)據(jù)以來,暢銷書排行榜逐漸演變?yōu)橐环N“自我實(shí)現(xiàn)的預(yù)言”:一旦上榜,更多曝光會推動銷量進(jìn)一步提升。
每年,書市都會被大量新書淹沒。僅在德國,2023年就有約6萬種新書問世。在這個競爭激烈的環(huán)境中,出版社已將書籍及其作者的銷售潛力作為出版評估的關(guān)鍵標(biāo)準(zhǔn)。他們關(guān)注哪些主題和封面、哪個書名更吸引讀者,甚至連作者的社交媒體粉絲數(shù)量也成為考量因素。
然而,這種量化趨勢可能并非完全有益。亞馬遜Kindle的閱讀數(shù)據(jù)顯示,大多數(shù)讀者未能讀完托馬斯皮凱蒂那本800頁的《21世紀(jì)資本論》。因此,在精裝紙質(zhì)版的出版中本可以節(jié)省不少紙張。除了經(jīng)濟(jì)考量外,人們更關(guān)心預(yù)測技術(shù)將如何改變文化生態(tài)。哪些書還能被創(chuàng)作?那些被預(yù)測成功率僅為2%的書是否還有出版機(jī)會?出版計劃中是否還能容納不合常規(guī)的作品?
一方面,機(jī)器的文學(xué)判斷會比挑剔的評論家更加公平,人工智能會掃描每一篇投稿,為新人提供機(jī)會,讓更多作者被看到。但另一方面,這也存在風(fēng)險,文學(xué)作品可能因此變得更加模式化、缺乏創(chuàng)意、變成流水線上的商品。
目前,這款工具完全依賴銷售數(shù)據(jù)等定量指標(biāo),而非敘事技巧、風(fēng)格或語言的趣味性等質(zhì)量指標(biāo)。玄幻小說或瑞典犯罪小說在今天流行,并不意味著它們明天還會受歡迎。因此,基于歷史數(shù)據(jù)生成的“暢銷模版”可能無法滿足讀者對新鮮感和驚喜的渴望。最近,匹茲堡大學(xué)的一項(xiàng)研究發(fā)現(xiàn),調(diào)查參與者更青睞人工智能生成的詩歌,而非莎士比亞的作品。如果以這種評分為標(biāo)準(zhǔn)訓(xùn)練算法,那么它可能會低估莎士比亞的“成功率”,甚至否決其出版可能。(作者阿德里安洛布,雨山譯)