數據牢籠與批評突圍
摘要:數據邏輯在整個網絡文學實踐中已經底層化和結構化,在此基礎之上的批評前置了數據思維,暗含了數據的蠻力。網絡文學數據批評所能獲得的數據十分有限。在平臺的數據壟斷下,身處數據牢籠的批評者借助軟件進行的研究,變成了既沒有全數據支撐,又需要借助有偏差的軟件模型,然后根據自身的統計素養來輔助操作的數據批評。數據批評在實際運用中經常表現為簡單的量化分析和解讀。它存在明顯的遮蔽性,需要依賴于一定的理念和闡釋,提升人文思辨的力度,使文學批評在定性分析與定量分析的無縫銜接中不斷前進。
關鍵詞:網絡文學 數據 數字人文 定量 文學研究實驗
迅疾蔓延的數智技術更新了諸多行業和領域,在文學研究中“數字人文”的呼聲也十分強烈。從歐美到中國,研究者面對批量增長的文學文本,困于文本細讀所涉對象的局隘和對文本價值的主觀區分,也希望通過建立數據庫、引入以計算機技術為基礎的數據化方法來解決這些難題,并進行了一些初見成效的嘗試。其中最常見的方式,就是進行文學研究實驗:先確定一些假設,然后劃出一些文學文本,選用一定的數據分析工具在設定的條件下進行操作,進而對結果進行分析,從而發現某些文學規律。這些實驗采用的都是基于計算機科學的數據化方法,效率高,結果能以圖表、詞云等直觀的形式呈現,也偶有一些假定之外的洞見,為文學研究帶來了一縷新鮮氣息。但數據化方法中揀選的對象經常是平臺數據淘汰機制過濾之后的文本,而且研究者無法獲得完全數據。數據分析模式的偏見和數據操縱的可能存在都使得這種文學研究實驗的可重復性不高,再次實驗的價值不大,于是實驗經常淪落為一次性的。況且,數據化方法背后的數據主義哲學傾向會遮蔽文學文本的豐富價值,因而我們需要找出一條規避之道。
一、數據的蠻力:網文實踐與數據思維的內在聯姻
作品的數據不好就心虛,幾乎是新媒介文藝批評中研究者常出現的情況,這是不是意味著數據已經在潛意識中對我們的研究對象進行了過濾?答案是肯定的。數據以一種意識形態的方式在整個網絡文學實踐中發揮作用,悄無聲息而又無所不在。
數據的好處是一切都可以拿來比較,直接武斷。現代社會的一種趨向就是用數據量化的方式對世界和人進行簡化處理,由此構成了“量化”的、如解析幾何一樣的“解析社會”。“解析社會”的觀照世界方式已經內化到網絡文學故事世界的想象中。
為數眾多的網絡小說開頭就介紹世界設定和規則體系的做法,貌似是受游戲的直接影響,究其根源是數據邏輯的底層化和結構化。許多作者不再用力去塑造虛構世界中的人物,而是將人物孤立出來,拋入到需要完成各種任務的數據系統。人物與世界沒有互生關系,只是強制性的偶遇。刻畫人物變成了展示人物的數據畫像,顯示人物在各個屬性上的數值或等級。
不僅如此,諸多作品中主要人物的稟性氣質也表現出與數據計算邏輯的一致性。網絡小說中主角對周圍世界進行功利性的計算,依據自己的現實利益對他人價值進行判斷,從《凡人修仙傳》就開始了,且比較普遍化。當然這個邏輯也不能說僅存在于虛構的小說世界里,它本身也是現實世界的一個輾轉映射。而近些年網絡文學中充斥的那種果敢狠絕、不糾結,同時缺乏自省的人物形象,與簡單粗暴的數據邏輯不無關系。打不死的主角一言不合就開殺,主角“爽”了,對主角無用的人物,其生命如同草芥,只是工具性存在。這在網絡小說中已經是一種比較普遍的倫理淡漠現象。
數據邏輯也深度植入到網絡閱讀中,從內容推薦到閱讀習慣分析,都貫穿著數據計算,是被微目標定位了的。讀者在電子閱讀平臺中經常會看到一些“推薦”作品和作品的各種數據,它們告訴你讀過這本書的人又讀了哪些書、這些書被多少人閱讀過、評分和評價如何等。甚至隨著數智技術的運用,閱讀平臺還提供了更高效的閱讀方式,比如讀者可以只看AI生成的內容提綱。“爽文”的快樂符碼是根據讀者的閱讀習慣和喜好,通過故事情節、人物設定等方式在小說文本中安排的情緒點。我們閱讀文學時產生的莫名喜好,在網頁上停留時間的長短,以數字的方式被捕捉,進而觸及我們潛意識中的喜好層面。這是連我們自己也不知道為何產生的類似于弗洛伊德所說的“本我”的層面,但數據特別是大數據打開了通往其中的通道。“數據挖掘作為數字化透鏡會放大人的行為,并且在由意識編織的行為空間背后開辟一個潛意識編織的行為空間。”數據計算深入到了人們的潛意識層面。
進入批評視野的網絡文學作品,也需要有一定的數據。批評者在對作品進行評價之前,先介紹作品在排行榜上的位置和獲得的各種榮譽,這幾乎成了一個慣例。批評者對作品的直覺判斷是排在數據判斷之后的,即網絡文學批評所涉的對象是先經過了平臺淘汰機制篩選的。
平臺淘汰機制本身就是一個數據篩選機制,帶有一定程度的暴力性和排他性,“網絡平臺及其人工智能允許或青睞的內容可能會迅速走紅;而它們貶低的,有時甚至是完全禁止的內容則可能被降為冷門并因此默默無聞。”但這里講到的數據,有其特殊性。周冰將網絡文學的數據特性分成四層,分別是材料層的0和1、地基層的數據源、應用層的平臺數據和界面層的數據顯示,并且認為我們現在所涉及的數據分析主要是界面層的。這種劃分非常詳細,而網絡文學的數據淘汰機制指的是地基層、應用層和界面層的數據淘汰機制,更具體一些,指的是作品附帶的點擊率、收藏率,所在的排行榜和推薦位置等數據。網絡文學的淘汰過程明確地依賴于數據指標,未能展示出足夠人氣的作品往往會逐漸被隱藏或淘汰出局。
現有的網絡文學格局與平臺通過數據進行的計算是分不開的。網絡文學產業是按照平臺的數字經濟來組織文學生產的。平臺對用戶文學消費的理解和把握,比以往任何時代都要透徹。經濟價值低的文類被視為“廢品”,市場價值高的文類則被奉為“明星產品”。進入寫作平臺,就有各種秘籍來告訴寫手如何寫才能抓住讀者,讓自己的作品成為明星產品。帶有數據屬性的網絡文學最歧視的就是“無用文學”,因為這種文學是互聯網平臺系統中的累贅,無法帶來任何利益,還得為之提供數據服務。網文平臺制造了大量的數據生產規則,用以搜集用戶數據,制作用戶畫像,然后再將這個包含了性別、年齡和地域的讀者畫像釋放給作者,讓他們精準化生產。這已經不是網絡文學產業的秘密,而幾乎成了互聯網文化產業減少失敗率的安全生產法則。
回顧中國網絡文學的發展歷程,我們可以清晰地看到,當下網絡文學的繁榮是與網絡文學平臺的數字經濟緊密相關的。平臺在網絡文學發展低潮(2002—2003年)時通過VIP收費閱讀雪中送炭。但網絡文學類型文主導的現狀,又何嘗不是這種支持帶來的文學等級分類?能盈利的小說被劃成上百種類型,而散文和詩歌被忽略,或者只被簡單歸為一種。這種情形是數據及其背后的市場和資本誘發的不平等后果。
可以說,數據邏輯在包括創作、閱讀、批評等在內的整個網絡文學實踐中已經底層化和結構化。在數據的規訓下,一切都顯得那么平庸,具有可比性。在平臺反復呈現的數據面前,我們幾乎無法保持對數據的鈍感,而總是會用數據來衡量我們的直覺判斷,以避免我們的主觀化。數據與客觀畫上了等號。批評要客觀中立,避免個人化,自然需要尊重數據。這與18世紀歐洲啟蒙運動中對統計學知識的推崇如出一轍。信息技術將萬物互聯,讓言行數字化,試圖將一切都轉換成數字的形式進行存儲。人工智能時代也是普遍數據化的時代。在信息技術的進步和普及中,我們都成了數據牢籠中的囚徒。網絡文學批評中的價值評價和文化闡釋已經受到了數據的強干擾。數據與算法勾連在一起,并不是完全客觀的。以內容推薦算法為例,文學網站的分類通常是基于大眾和專業知識建立的靜態系統,而標簽則是根據具體需求動態生成的臨時區分。這兩者都是通過對作品和用戶進行樹狀分類和標注得到的。
網絡文學體量龐大,需要產業經濟的支持,數據淘汰機制的存在是必需的,但我們需要警惕這一機制的局限性。文學作品經過數據淘汰機制,就意味著已經前置了數據思維。數據是一種可以用來比較的符號,符號就已經是片面化了,數據則將這種片面進一步放大。沒通過數據篩選的網絡文學作品,有可能是滄海遺珠,特別是網絡文學商業化后,被丟棄的優秀作品可能會更多。數據淘汰機制犧牲的不僅有個人的權利,而且還包括特立獨行的創造力。如果說文學是為了精神層面的良好生活的話,那么我們就不能將某種存在視作理所當然,而應對其有足夠的反思和批判能力。僅僅滿足于用數據對既有現象的解釋并不能使文學向有利于人的方向發展。這是因為解釋本身是一種判斷,而注腳式的解釋既闡明了現象存在的原因,也為其存在的合理性提供了理由。當解釋涉及人的現象時,它就會作為一種力量影響人類的發展。與不受預測影響的天氣不同,對網絡文學的解釋會直接影響其發展方向。
數字時代不僅是一個出現海量文學作品的時代,也是一個制造批評焦慮的時代。面對如此龐大的研究對象,很多學者希冀通過數字人文來彌補未能閱讀大量文本的缺憾,并從莫萊蒂(Franco Moretti)的“遠讀”中找到了一些靈感。這種愿望,我們可以理解為期望借助數據化分析來達到對文學的宏觀把握。因此,網絡文學數據批評的出場與網絡文學的評價焦慮關聯在一起。網絡文學批評的學院派意識到了網絡文學的重要性,但又很難像對待傳統文學那樣通過批評深度介入,既有的批評大部分限于自說自話的狀態。作家作品批評只限于少數個體和作品。批評與創作處于割裂的狀態。
在此情況下,既然網絡文學有數據屬性,不如干脆引入數據批評。考慮到網絡文學比傳統文學的體量大太多,引入數據批評確實是一個很省力的方式。但數據批評所需要的數據不僅量大,而且要豐富多樣。因為我們所需要的網絡文學數據并非材料層作為二進制機器語言的數據,而是諸多其他層面的數據。因此,網絡文學數據批評面臨的最大挑戰是:我們需要的數據能獲取到何種程度,以及如何將這些數據有效應用于文學批評。而要回答這些問題,則需要考察數據與互聯網平臺的關系。
二、數據的平臺控制與基于模型的批評
網絡文學的數據構成非常廣泛,涵蓋了從文本內容到用戶行為統計,再到作品的元數據等多個維度,形成了一個復雜多元的數據生態系統。我們可以把網絡文學寫作的最底層視作是數據錄入,將內容轉換成0與1進行存儲和表達。但網絡文學的數據除了錄入之外,還有按照平臺算法來生成的。關于網絡文學的大量數據中,只有作者和讀者輸入的那些才是錄入數據,且這種數據在屏幕上并不以數據的形式來呈現,而主要以文字來呈現。不僅網絡文學,任何進入網絡空間的信息都是以二進制數據的方式存儲的。但這些信息的外在表現并非二進制形式,而是以文字、圖像、聲音、影像等我們熟悉的樣式出現。一切皆可數據化,構成了數字化時代。這種數據化產生的數據被稱為“一般數據”,一般數據“保持了它自身的運轉,讓自己在云計算的裝置中生成和演化,變成了一種獨立于主體意識的存在”。一般數據是一切都被數字化后在抽象層面的數據,它是包括作者、讀者、編輯等每一個用戶在數字化環境中“勞動”創造出來的產品。寫作、發布、搜索、閱讀、點贊、打賞、充值等行為都是在生產基礎性的數據原材料。而后,這些原材料在各種數字機器下被轉換成一般數據。
于網絡文學平臺而言,一般數據囊括了作品、網頁圖片、點擊、評論等所有信息。信息和數據是一體兩面的關系。信息面是一般人可以辨別的,底層數據則是極少數的專業人士才可以識別的。考慮到在數字化時代,所有的信息都以數據的方式存儲,我們完全可以說網絡文學的底層就是數據,欣賞文學作品也是在欣賞以數據形式存儲的信息。但這種理解方式也適用于任何數字化的文學批評、網絡投票、視頻觀看、購物行為等差異巨大的活動。因此,網絡文學數據批評所需的并非這種通約化的二進制數據,而是服務于文學審美、鑒賞、批評等信息層面的、能夠被看懂的數據。簡言之,包括三個方面:作為數據源的作品、用戶點擊、評論;平臺公司后臺搭建的各種特性的數據庫;用戶可以直接看到的被顯示到界面的信息。而這三個方面具體數據背后都是一般數據。
網絡平臺有馬太效應,聚集的用戶越多其價值和吸引力愈大,這從經濟學上來講屬于“積極的網絡效應”。但由于平臺吸引力提高而聚集大量用戶的結果是,大量用戶的特定數據服務權壟斷在少數的供應商那里,從而形成了巨無霸的網絡平臺。“這些網絡平臺日益依賴于人工智能,并在一定程度上產生了人類和人工智能之間的交集,其規模之大,已具有文明意義。”人工智能的根本原理是深度學習加算法。為了更好地控制用戶,平臺會利用各種手段和規則來挖掘用戶數據的豐富性和多樣性。就文學的數字閱讀來看,平臺在挖掘用戶數據上用盡心思:有賬戶、票夾、付費會員卡等消費數據;書架、書單、閱讀時長、筆記等閱讀數據;書評、本章說、點贊、轉發等互動數據;經驗值等級、任務、徽章、VIP等資格數據。而制造作品數據上的招數之多,令人眼花繚亂:字數、總推薦、周推薦、月票、打賞、上架時間、共同閱讀的書友、短評數量等都是可見的數據信息,而且如起點中文網這樣的平臺還有各種誘導消費策略——月票排行榜非常醒目地標出作品提升一個名次還需要的票數,同時又列出當日又有多少人已經打賞了。平臺可見的數據之意非常露骨:你的支持和打賞贊助對作品至關重要,所以請消費。這是平臺資本的促銷手段。而平臺怎么使用這些數據勾畫出用戶畫像,怎么決定向作者展示用戶的哪些側面,其背后的數據模型和智能算法屬于行業機密之列。同樣,平臺如何根據數據來評估作品和作者的價值,除了作者自身可以看到的等級呈現之外,是否還有其他維度,也是一個黑箱。
互聯網平臺商業模式和生態中最核心的要素就是數據。數據于平臺而言,是一種資源。平臺生產占有數據的主要目標在于制造經濟價值。數據是被平臺占有的,雖然占有的合法性有待考量,但在制造和發掘用戶數據方面平臺的作用至關重要。
在數據生產上,永遠是小平臺比不過大平臺,大平臺的馬太效應、邊際效應都可以讓小平臺黯然失色。所以我們比較容易看到起點這種大平臺的數據,卻不太容易看到豆瓣讀書這樣的小平臺的數據。在數據所有權上,用戶的數據很少獨屬于用戶,而是被一個所謂的看不見的“后臺”所知悉。小用戶想與大平臺競爭,變得越來越難,平臺資本的力量變得無所不能,而其中的法寶就在于數據。生產數據、使用數據來盈利不只是免費閱讀的經濟支柱,而且成為平臺的權力。而這些大平臺在各個方面的優勢,又容易讓那些風格特征迥異的、小平臺上的網絡文學陷入無法出頭的境況。
網絡空間的一般數據是被平臺占有的,因為它們被占有并能從中獲利,所以成為數字資本。數字資本是繼產業資本、金融資本之后“第三種起支配性作用的資本樣態”,且在三種資本中居于塔尖位置,是數字資本家能夠呼風喚雨的底氣。這種資本屬于商業機密,是文學批評和任何文化活動都難以獲得的。數字資本意味著數據里面可能包含著一種權力關系和剝削關系,數據擁有點石成金的魔力。我們看到的只是平臺方愿意展示出來的數據,外顯為文學作品、點擊量、頁面、榜單等信息。平臺方所有的權力都源于其所擁有的數據資源。故而,批評家想以文學批評的名義擁有完全數據,于平臺而言就屬于搶占資本,必然會受到諸多阻撓和限制。
平臺壟斷和數據資本化導致網絡文學批評者只能獲得有限的數據。批評者雖然可以“扒”數據,但因為權限和能力的局限,數據完整性會在相當程度上受到限制。由此,批評者看到的數據本身就是“以偏概全”的。我們當然可以設想平臺出于社會責任的考慮將數據釋放給相關部門和研究者,但同樣需要考慮平臺出于各種原因并沒有儲存全樣本數據,或者出于各種考慮只釋放了部分數據。基于這種情形的普遍性,我們看到的網絡文學的數據必然是不完全數據。這點在實際的網絡文學數據批評實踐中已經表現得十分明顯,譬如采用“一葉故事薈”來看“升級文”的吉云飛,就坦誠因選取的14部小說不及“升級文”的萬分之一、實驗條件不足,“本次實驗注定仍只是一次操練”。以萬分之一來代表“升級文”,無論如何都談不上全面客觀,也并未解決網絡小說閱讀量大的難題。
不僅如此,批評者本身也處在數據牢籠中,其數據痕跡也是可以被跟蹤計算的。于是,網絡文學數據批評變成了身處數據牢籠中的批評者依據有限數據進行的批評,有非常大的局限性,也比較容易被平臺誘導。
但若我們不需要平臺的全數據,只需特定的網絡文學文本,以數據軟件系統的模型來分析,是否就可以得出更為客觀的結論?這可能是文學批評者的另一種美好愿望,因為“模型偏差”是一種前提偏差、框架偏差。軟件分析的結果與其目標設定是一致的,就是簡單化、規律化。從某種程度上來講,軟件模型的程序就已經決定了其可能分析出來的結果。軟件分析“是通過理解和解釋另一套比文本本身更復雜的‘工具’(如編碼系統、決策程序、推理原則、知識表示)來理解眼前的文本的”。軟件工具是機械的、不透明的,預設了一種知識表征作為闡釋的合法基礎。譬如,在《基于BP神經網絡的網絡小說排行預測》中,我們可以看到自然科學學者在構造用以預測網絡小說排行的BP人工神經網絡時,預設的前提是:“相對于傳統小說,內容質量對網絡小說流行度影響并不顯著”。其模型設計選取的九種特征中,與小說相關的有五種(類型、評分、榮譽、字數、評價人數),與作者相關的有四種(作品總數、等級、點擊推薦比率、日寫作效率)。這么一種模型框架已經從規則上排除了作品內容本身。
通過軟件模型進行的分析,數據一般來自批評者的選擇或者爬取,而在這個過程中不當的數據操縱很容易發生。數據重復、缺失、錯誤、不規范、不一致等情況都會發生,而分析者需要投入相當的時間和精力進行數據清洗,在清洗過程中軟件操作者很容易就可以通過“校準”得到自己想要的數據。不規范操作得到的數據是“臟數據”。“臟數據”可能是出自客觀原因,也完全有可能是為了達到自己想要的目標而進行人為干預造成的。樣本數量和過程在相當大程度上決定了結果。貌似客觀的分析工具,不僅已經預設了模型偏差、算法偏見,而且在使用過程中也隨處可見人為操控的痕跡。
在平臺的數據壟斷下,身處數據牢籠的批評者借助軟件進行的網絡文學研究,變成了一個既沒有全數據支撐,又需要借助有偏差的軟件模型,然后根據自身的統計素養來輔助操作的數據批評。這種到處都是漏洞的數據批評,其批評結果不僅缺乏客觀性,而且也缺乏可重復性,經常是一次性的文學研究實驗。不過,為什么還有這么多人迷戀數據化的批評?假使數據化批評中的人工操作規范,是否就意味著這種批評的正當性呢?這要求我們對數據批評進行哲學思考,辨清其盲區,并在此基礎上探索網絡文學批評采用數據化方法進行突圍的原則和可能路徑。
三、道術相合:數據批評的遮蔽與去蔽
大至世界文學體系,小至網絡類型文學體系,都是存在等級差異的不平等體系。中心與邊緣有差別,但其相互位置又變動不居,這是文學史演變中的常見現象。不能窮盡文本不僅是數字時代批評家的困難,也是歷代文學批評家都要面對的狀況。這一正常的狀況,只有在對透明社會的渴慕下才會成為一個需要解決并相信能夠解決的問題。因為我們有內在追求確定性的焦慮和對數據主義客觀透明的信仰。
數據主義是認為一切都可以通過數據來理解和表達的哲學世界觀。它依靠大數據、全數據來揭示事物和現象背后的模式和規律,減少我們的認知偏差。借助大數據,智能算法意圖制造一個“全息”的認知上的精準圖像,而以此形成數據主義的新信仰。數據主義對數據重要性的強調演變成了數據至上的思潮。但假使我們從事批評可以獲得所有數據,那么是否可以進行客觀公允的數據批評呢?從具有超強算力和大數據支持的AI閱讀來看,同樣不可能。AI閱讀將所有的作品都平等地視為數據,可是根據數據進行的學習,不是建立在對內容深度理解之上的,而是根據符號相關性而非因果性進行的淺學習。
數據主義有一些盲區,它容易忽視那些不易量化的人類經驗和社會現象。第一,數據揭示的是事物存在的相關的、隱秘的關系,回答“是這樣的”相關概率關系,而不是“為什么這樣”的因果關系,因果關系需要人來詮釋;第二,數據產生于具體的語境中,作為事物某種特色的量度,脫離語境來解讀就會產生誤讀,而如何保留其原生語境是個難題;第三,數據會排除情緒和情感的意向性,減少主觀偏差,但其權威性并非絕對,容易忽略偶然性的價值。
網絡文學研究中對數據分析模式的探索,對數據批評的呼喚,是為了減少我們對網絡文學的認識偏差,是數據主義的表現。與數據主義存在的盲區相一致,數據化的文學批評也存在明顯的遮蔽性,主要表現在以下幾個方面。
一是網絡文學單純依據數據的詮釋會相當貧乏。貧乏的本身源于數據認知的碎片化,僅僅展現原始的相關關系,而不能詮定概念。大數據、全數據引導的認知是一種疊加的產物,無法終結,也是一種無知。因此,我們也很容易發現,用軟件對文學作品進行數據分析得出來的結論,幾乎是一個沒有靈魂的常識,不如定性分析和理論分析來得深入。原因在于定性分析的推論和理論都有一種整合性,這與精神具有的整合性是一致的。所以,我們可以看到即便以某一年的749部網絡小說為考察對象,得出來的結論也比較簡單,有些內容就是在印證網絡文學方面的一些常識。
二是基于網絡文學作品的數據批評,經常是抽離了平臺語境、文化語境和讀者個人體驗的通約處理,會忽視文學作品的多義性和復雜性。這是因為借以處理文學數據的分析模型本身是通過平均化、概率化的方式來處理文學的獨特性的,而喪失獨特性的文學,是均質化的文學,對于文學發展不利。如果說第一次啟蒙運動中,統計學讓伏爾泰等人為之迷狂的話,那么目前大數據是以韓炳哲所說的第二次啟蒙運動的身份登場,而這是以放棄偶然性和獨特性為代價的。譬如,當以“遠讀”來把握“小說節奏和讀者情緒”時,是將“情緒”這種主觀感受作為“升級”(或者升級前的挫折)活動的必然搭檔來理解的。但情緒是短暫易逝和復雜多樣的,除了與“升級”同頻共振的情緒,還有很多其他情緒,越是內涵豐富的小說越是如此。機器的“遠讀”是以犧牲人文批評在“細讀”中對作品蘊藏的情感和態度的微妙捕捉為代價的。
每一時代有每一時代之文學,充分說明了文學語境的重要性。但將大量的文學文本放在一起進行數據分析的批評,放棄了文學作品之感受的語境脈絡。這種形式的網絡文學作品如同單個的、脫離了整個語言系統的語詞,而語詞符號表意的關鍵正是在于系統。在數據批評的通約中,作品的個性被抹殺,然后我們又據此來批評這些作品沒有個性,這是邏輯上的悖論。
三是網絡文學批評實踐中的對象常是經過平臺數據篩選機制的對象,但數據自攜的“客觀性”光環導致平臺數據評價偏差一旦出現,對網絡文學作品的傷害就很難得到糾正,且會形成一種惡性循環。專業批評者也很難在數據社會逃離數據牢籠,同樣面臨著平臺對我們閱讀潛意識的搜捕。而平臺上網絡文學的各種數據本身是與平臺經濟糾纏在一起的,批評很容易就落入為資本服務的陷阱。
指出網絡文學數據批評的遮蔽性并不是完全否定其存在意義,關鍵在于思考我們需要什么樣的數據批評。基于數字邏輯在網絡文學中作為基礎架構的存在,引入數據批評十分必要。數據批評的原理在于,網絡文學及其相關網絡活動作為一種數字化存在,能夠讓我們通過計算機對其底層數據的處理來獲得對作品及相關文化現象的理解和把握。嚴謹地說,數據批評方法不是距離意義上的“遠讀”,而是借助機器和數智技術的“另一種”閱讀。它是一個強大的工具,可以幫助我們理解數字時代的文學現象和價值。那么,我們應該如何去除遮蔽性,借助數據批評來更新升級網絡文學批評?這涉及批評之道與術的關系。
傳統人文批評擅長處理文學的精神文化方面的價值,進行定性分析。而數據批評擅長借助計算機技術進行量化分析,因此數據批評可以視為一種新質生產力,作為人文批評的有力補充,共同致力于提升人文之道。因為數據無法敘事,也無法產生意義,所以數據批評作為一種批評術,它要依賴于一定的理念和闡釋,所以數據化分析之前和之后都是需要人文思辨的,需要批評者對其理論前提和批評目的進行細致地辨析。
首先,網絡文學數據批評需要劃定目標,將那些傳統人文批評無法把握的現象或作品作為研究對象,在合理的理念前提下進行,以數據研究促進文學批評。這就需要排除那些僅僅用來印證網絡文學常識的數據批評。數據研究是有限度的,需要以假說為指導,在理論概念的引導下進行,這種研究并非簡化而是需要嘗試非常復雜嚴謹的研究模式。在這方面,李強的《作為數字人文思維的“網文算法”——以“明穿”小說為例》對數字人文的思考很有參考價值。他始終在一個具體的時代語境中去考量,從文化思潮脈絡中去理解“明穿”小說的變化,定性分析與定量分析交織進行。但即便如此,他借助軟件對兩部群穿小說角色占比的分析,也稍有遺憾。穿越者的多寡只有比較意義,而這通過簡單閱讀就可以得出。
其次,數據批評方法的豐富多樣性需要進一步拓展,數據操作需要規范。在人工智能高度發展的今天,數據化方法是非常多樣的:利用或建設可供公開檢索的作品數據庫進行統計分析;借助不同模型的分析軟件;利用不同類別的神經網絡技術;數據挖掘和機器學習;數據可視化和大數據分析等。每種數據化方法背后都是有模型的,模型依賴于數據的性質、分析的目標以及可用的技術資源。有效的數據批評不僅需要對數據本身有深入的理解,還需要對使用的模型有充分的認識,包括它們的假設、局限性和適用性。假如數據化背后的模型存在偏差,那么數據分析就很容易出現根本性錯誤,而在此之上的數據批評也會謬以千里。故而,在使用數據化方法之前,我們應該對模型本身進行批評性思考,并深入理解其具體運用的條件。任何數據化方法在使用中都需要人對數據進行操作,包括尋找數據、清洗數據、校準數據等。這個過程涉及廣泛的人為操作,因此對操作者的數據素養提出了較高要求,這對人文學者而言可能是一個挑戰。然而,這一挑戰可以通過跨學科合作來克服。
最后,任何數據批評或者人文批評的主體都是人,培養復合型的網絡文學批評者至關重要。網絡文學數據批評的目的在于借助數據達到對網絡文學的精確把握,但無論是網絡文學還是整體意義上的文學,本身就是含混、矛盾、偶然性和多樣性的匯聚。文學的內涵和思想是由包括批評者在內的讀者閱讀解釋出來的,是人在與文學作品的碰撞中產生的,沒有這種碰撞,而只是通過模型對作品進行數據分析解讀,文學的審美價值和文化內涵很難被捕捉到。因此,數據批評需要批評者有閱讀網絡文學的直接經驗,具有一定的思辨能力。雖然專業的網絡文學批評者具備扎實的文學基礎和豐富的評論經驗,但他們有時可能因閱讀量不足而在理解網絡文學的獨有特質上有所欠缺。相比之下,網絡文學的廣大讀者群擁有豐厚的閱讀經驗,但他們往往缺乏一個更開闊的文學視野和正規的批評訓練,這限制了他們進行深入批評的能力。從事網絡文學的數據批評不僅要求對網絡文學本身具備直觀的體驗和理解,還要求批評者擁有較強的數字人文背景——這包括對數字化文本的分析能力和對相關技術工具的熟練運用。正如網絡文學創作中出現了很多非文科背景的作者,網絡文學讀者中也可以出現既有媒介技術素養,又有較高文學辨識力的批評者。培養年輕人,使他們在具備豐富的閱讀體驗和較高的新媒介素養的基礎上,經過專業的訓練,能夠將數據批評與人文批評融合于文學探討之中,并賦予他們必要的話語權和文學批評的使命感,這才是確保網絡文學持續發展的正確途徑。
結語
目前,數字人文迅猛發展但爭議不斷。跨學科尋求網絡文學批評的新思路與對數據世界客觀透明的想象纏繞在一起。網絡文學的數據批評在實際操作中成了一種裝飾性存在,表現為以表格、數據、圖表等方式來豐富文章形式的淺顯分析。這種批評雖然看起來是跨學科的,但將之聚攏在一起去看,很容易發現其重復性和模式化。
數字邏輯在整個網絡文學實踐中的底層化和結構化,使數據批評的出場成為必需。但身處數據牢籠的批評者進行的網絡文學數據批評,面臨著數據的平臺控制、模型分析的偏差、數據操縱等諸多實踐上的難題。從哲學基礎上看,數據批評的數據主義傾向會遮蔽文學的獨特性,“數據透鏡”很容易就過濾掉了文學的審美價值和多重含義。數據批評方法的合理使用需要有理論的引導,數據分析應該放在人文思辨的脈絡中來推進。單純為了引入數據方法而進行數據批評,多半會淪為驗證已有結論的一次性文學研究實驗。數據批評要成為網絡文學批評的有力助推器,需要以數據批評之術來提升人文之道,實現道術相合,提升人文思辨的力度,使文學批評在定性分析與定量分析的無縫銜接中不斷前進。
〔本文注釋內容略〕