迄今為止中國最大的口頭文學遺產數據庫——中國口頭文學遺產數據庫近日正式亮相。該數據庫包含116.5萬篇(條)神話、傳說、史詩、歌謠、諺語、歇后語、謎語、民間說唱等,總字數達8.878億字,幾乎囊括了新中國成立以來我國口頭文學收集的原始資料,堪稱一部“民間四庫全書”。
自新中國成立以來,中國民間文藝家協會分別在上世紀50年代、80年代以及本世紀初,組織過三次大規模民間口頭文學的搜集和整理。這三次搜集活動耗時三四十年,先后組織了200萬人次在全國2800多個縣進行口頭文學的普查、記錄工作,獲得了巨量的民間文學原始資料。不過,這幾次搜集行動最終只出版了省級口頭文學集成著作,絕大多數縣級傳說、故事等雖然被采集回來,卻沒有機會公開出版。未能出版的原始記錄,大部分還以手抄本、油印本、鉛印本等方式保存著。
為了將這部分沉睡的資源喚醒,2010年12月30日,在作家、民間文藝家馮驥才的倡議下,中國民間文藝家協會發起了中國口頭文學數字化工程。該工程由中國民協與漢王公司合作,將這些原始資料中的圖片、文字全部數字化,并掃描每一頁記錄的原始頁面,匯成一個數據庫。數據還提供按地區、按故事主題等多種檢索方式,方便使用者利用這些資源。例如輸入“女媧補天”會得到1160多篇不同地域的人們對它的不同講述。
民間文藝家、數據庫專家劉錫誠介紹,數據庫的主體是上世紀80年代至上世紀末20年間搜集到的口頭文學資料。他表示:“20世紀最后20年是隨時處在流變之中的,民間口頭文學也像滔滔逝水隨著時代、社會的變遷而嬗變。以數字化方式較完整全面地保存這20年的中國民間口頭文學,就留下了這一風云激蕩的時間段里民間文化的活態樣相。”
目前,數據庫完成了一期建設,未來將繼續數據庫的知識加工工作,進行更加詳細的分類。此外,該數據庫目前還只有光盤版,不能無償在互聯網上供人查詢和下載,工程領導小組正在研究如何讓該數據庫為研究者提供服務。(李 洋)