數字人文的人文之維
數字人文是數字技術通過對人文研究領域的滲透和介入,帶來的方法論革新。目前,數字人文的發展還處于初級階段,主要表現在信息管理、圖書情報檔案、歷史學領域對各種數字技術的引入,以及人文經典文獻的信息化、數字化處理等方面。此外,數字技術也逐漸觸及人文研究領域的某些領域,如主題、意義、情感、價值等。當前數字人文面臨的主要問題是“技術化”和“文獻化”比重偏移比較明顯,很多研究還處于“學習技術”的階段,只能做一些基礎性工作,這與數字人文研究尚處于初級階段密不可分。數字人文要真正成為重構人文研究的方法,則必須要在“人文化”方面有所推進和發展。
基于可視化文本展開意義闡釋
一般情況下,數字人文都被理解為以數字技術為方法、研究人文領域的相關問題。“數字”是方法,“人文”是對象。這種理解固然沒錯,但并不全面。原因在于,它只是將“人文”作為研究的對象來看待,忽略了研究的主體性問題,而主體性是人文研究非常重要的一個方面。與自然科學、社會科學等相比,人文學科最大的不同不僅在于研究對象的差別,更在于研究方法上對研究主體性的強調。正因如此,我們才會更強調人文研究中的“個性”“特色”“差異”“歷史的具體性”以及研究者“情感”“價值”“悟性”等因素在研究活動中的介入。數字人文研究作為人文研究與數字技術的跨學科結合,同時包含了兩個維度的趨向:其一是“人文研究數字化”,即用數字技術解決人文問題;其二是“數字技術人文化”,即以人文方式發展數字技術,“讓數字更人文”。
作為研究方法的數字人文有一個共同模式,就是將文化經典視為可編碼的信息,將日常生活轉換為可追溯的數據,將價值體系打上可識別的標簽,進而通過詞頻軟件、數據統計及相關可視化手段呈現出一個全新的數字化文本形態。數字人文研究者就是基于這一可視化的文本展開意義的闡釋。我們可以聚焦這一研究方法及其過程,看看數字人文與傳統的人文研究之間存在哪些交織、滲透、抵牾,進而如何做到“數字”與“人文”的有效縫合。
無論是文學闡釋還是藝術分析,抑或是基于概念抽象的形而上思考,都建立在研究者對經典文獻中的符號信息的直接把握和對日常生活世界的人類生活方式的切身體驗基礎之上。而數字人文方法將所需要分析的文獻信息和行為活動進行數據化和可視化處理后,形成新的文本形態。因此,數字人文研究者的認知、理解和闡釋活動并非直接“面對事實本身”,而是面對經過“二度加工/創造”形成的數據可視化文本形態。如果說那些作為“事實本身”的經典文獻和行為活動相當于人文研究的“原初文本”的話,那么,經過數字人文方式處理過而形成的新的文本形態則是“次生文本”。對“原初文本”的研究,就是英美新批評所說的“細讀”(close reading),對“次生文本”的研究則是數字人文倡導的“遠讀”(distant reading)。不過值得重視的是,所謂“遠讀”之“遠”是相對于“原初文本”的距離來說的,因為畢竟與研究者之間“隔了一層”。但是研究者面對“次生文本”的研究仍然是“細讀”式的,需要充分調用研究者對“原初文本”的認知、對相關理論觀念的理解以及對個人感性經驗的體悟等。
因為數字人文方法的介入,人文研究的層次變得更加豐富了。在傳統人文研究中,研究者主要面對的是兩個層次的問題:一個是“原初文本”(即經典文獻和行為活動),相當于索緒爾所說的“言語”層;另一個則是“元文本”,即柏拉圖所說的“理式”、原型批評中所說的“母題”、利奧塔所說的“宏大敘事”,相當于作為規則的“語言”層。而數字人文研究增加了人文研究的“次生文本”層次。這一“次生文本”是寄生于“原初文本”的,但又對“原初文本”進行了數據化處理。這一過程本身就已包含了研究者的問題意識、理論預設和價值判斷。或者可以比附為“話語”層。因此,當“次生文本”出現之后,此前傳統人文研究所面對的“元文本”與“原初文本”之間的二元關系,就演變成新增了“次生文本”的三角關系:“次生文本”既可能是對“原初文本”的抽象化還原,也有可能包含著對“原初文本”的顛覆性解構,既有可能突顯“元文本”與“原初文本”之間的隱性關聯,也有可能提示兩者之間的矛盾和張力。從這個意義上說,將數字人文方法引入人文研究,將會極大地豐富和擴展人文研究的層次和內涵,成為人文研究的延伸和補充。
不過,經過數據可視化形成的“次生文本”還只是對海量的人文信息的存儲、檢索、統計等輔助性功能的完善,還不足以作為一種獨立的研究方式完成人文研究的全過程。“人文研究數字化”還需要經過有效性驗證和默會、理解與闡釋,才能實現新的人文知識生產。而這一過程就是“數字技術人文化”。
通過對比參照進行交叉分析
數字人文正在致力于不斷豐富、發展和完善能夠應用于人文研究的數字技術、工具,試圖建構成可重復、可推廣的體系和方法。這一套方法的有效性實現應同時獲得兩方面的驗證:其一是技術路線的可行性;其二是人文分析的有效性。前者主要由計算科學、統計學等技術手段來實現,后者則需要傳統人文研究方法的參與和評價。比如說在數字人文工具的完善過程中,標注、分詞、數據的清洗、權重的設定等,都需要研究者以人工的方式“教會”相關程序進行更為有效和精準的識別。因此就有了數字人文研究中“有多少智能,就有多少人工”的調侃。
工具完善中的人工性正是傳統人文研究的知識、技能、感性經驗、價值觀念注入、融入數字人文方法的過程,也是數字人文提高其統計精準性的重要方法。再比如數字人文研究中的情感分析一般會采取二元分類(積極情感/消極情感)和多元分類(如細分為“快樂”“悲傷”“憤怒”“痛苦”等)相結合的方法,建立可調用的情感詞典。在這一過程中,需要研究者對各類情感詞語及其在特定語境中的情感指向進行區分,完成所謂的“降噪”過程。這種方法在分析日常生活和行為中的情感粒度時已經初具有效性了。在購物網站中用戶對產品的評價、觀眾對正在上映的電影的評價以及網絡輿情的總體判斷等方面,研究者已經能夠完成相關的受眾/用戶分析了。不過,如何將這一情感分析引入文學、藝術作品的內部研究還是一個有待完善的課題。
一般情況下,虛構性敘事作品大多包含有敘述層次、話語類型、文類風格、修辭策略等要素,這些要素既有別于日常語言文本,也會極大影響情感價值的趨向和情感內涵的意指。在有效性驗證方面,數字人文還面臨著一個與個人感性經驗相匹配的悖論性問題:如果數字人文方法對海量文本的分析能夠與個人感性經驗相匹配,那么,這一方面會證明數字人文方法的有效性,但另一方面又會降低數字人文方法的有用性——如果與感性經驗相符,那么,運用數字人文方法豈非多此一舉?反之,如果與人的感性經驗不相符,那么,它的有效性又該如何驗證?
因此,數字人文研究在知識生產方面要解決的問題,比傳統的人文研究要復雜得多。一方面,它需要研究者擁有傳統人文研究的文獻處理、文本分析和意義闡釋的能力。即使要處理的是個人頭腦無法把握的海量文獻、信息,也需要研究者擁有“說文(文本)解字(文字、圖像等符號)”的能力,能夠以抽樣的方式完成對相關信息的閱讀和觀看,進而獲得對研究對象的感性經驗和個人判斷。雖然這些經驗極其有限、非常片面,但仍然是必不可少的。另一方面,它還需要研究者擁有“看圖(可視化圖形)識字(數字、數據等信息)”的能力,能夠從“次生文本”的各種圖式、圖形、符號、數字等信息中,形成對原始文本的意義挖掘和價值判斷。進而,將兩種研究方法做出的分析進行對比、參照,展開“元文本”“原始文本”和“次生文本”之間多重交叉性質的反思性分析。
當然,以上的所有分析都建立在數字人文研究目前處于初級階段基礎上。它的根本特點是,在“人—機”關系中,“人”的因素還處于支配性地位。隨著人工智能技術的發展,數字人文方法也會不斷地升級換代,“人—機”關系也會出現“人”的因素支配性作用不斷下降,甚至出現“機”對“人”的控制和替代的可能。這也使得人文學者對數字人文方法常常抱有一種本能的敵意,認為這一研究隔絕了研究者面對“原初文本”的感性經驗,將人文研究認知、理解、闡釋和判斷的權力讓渡給了計算機軟件程序。究其原因其實是人文學者(也包括計算機科學和其他社會科學的學者)對數字人文方法的雙重誤判:第一重誤判是針對數字人文方法目前只能應用于人文研究初級階段的蔑視,另一重誤判則是受當前各種科幻大片渲染的超級人工智能技術帶來的“后人類”“超人類”甚至“反人類”的技術恐慌。其實,我們既不能因為數字人文方法之于人文研究尚處襁褓時期而輕視它的價值,也不能過分夸大數字技術的分析能力轉而心生恐懼。我們對待數字人文的最好態度,既不是擁抱,也不是逃離,而是真誠的握手。