中國口頭文學遺產建數據庫

http://www.donkey-robot.com 2014年03月14日07:22 李洋

　　迄今為止中國最大的口頭文學遺產數據庫——中國口頭文學遺產數據庫近日正式亮相。該數據庫包含116.5萬篇(條)神話、傳說、史詩、歌謠、諺語、歇后語、謎語、民間說唱等，總字數達8.878億字，幾乎囊括了新中國成立以來我國口頭文學收集的原始資料，堪稱一部“民間四庫全書”。

　　自新中國成立以來，中國民間文藝家協會分別在上世紀50年代、80年代以及本世紀初，組織過三次大規模民間口頭文學的搜集和整理。這三次搜集活動耗時三四十年，先后組織了200萬人次在全國2800多個縣進行口頭文學的普查、記錄工作，獲得了巨量的民間文學原始資料。不過，這幾次搜集行動最終只出版了省級口頭文學集成著作，絕大多數縣級傳說、故事等雖然被采集回來，卻沒有機會公開出版。未能出版的原始記錄，大部分還以手抄本、油印本、鉛印本等方式保存著。

　　為了將這部分沉睡的資源喚醒，2010年12月30日，在作家、民間文藝家馮驥才的倡議下，中國民間文藝家協會發起了中國口頭文學數字化工程。該工程由中國民協與漢王公司合作，將這些原始資料中的圖片、文字全部數字化，并掃描每一頁記錄的原始頁面，匯成一個數據庫。數據還提供按地區、按故事主題等多種檢索方式，方便使用者利用這些資源。例如輸入“女媧補天”會得到1160多篇不同地域的人們對它的不同講述。

　　民間文藝家、數據庫專家劉錫誠介紹，數據庫的主體是上世紀80年代至上世紀末20年間搜集到的口頭文學資料。他表示：“20世紀最后20年是隨時處在流變之中的，民間口頭文學也像滔滔逝水隨著時代、社會的變遷而嬗變。以數字化方式較完整全面地保存這20年的中國民間口頭文學，就留下了這一風云激蕩的時間段里民間文化的活態樣相。”

　　目前，數據庫完成了一期建設，未來將繼續數據庫的知識加工工作，進行更加詳細的分類。此外，該數據庫目前還只有光盤版，不能無償在互聯網上供人查詢和下載，工程領導小組正在研究如何讓該數據庫為研究者提供服務。(李洋)