• <ul id="wsmey"></ul>
  • 用戶登錄投稿

    中國作家協會主管

    AI賦能千行百業,傳統文科也不例外
    來源:文匯報 | 劉釗   2025年03月22日09:35

    2023年是人工智能(AI)大模型元年。2024年,AI技術持續高速發展,在腦機接口、醫療、自動駕駛、機器人、量子計算等領域取得突破性創新。

    向外看世界,2024年諾貝爾物理學獎和化學獎都授予了AI大咖,其中,化學獎得主利用阿爾法折疊預測了2億多個蛋白質的可能結構,解決了“太陽底下最難的科學問題”之一,而且還預測,10年之內AI會協助人類攻克各種疾病。

    向內看中國,AI賦能下的科技創新正全面爆發,尤其是DeepSeek的橫空出世,極大地提升了中國科技創新的信心和動力,使得AI完成了一次全民科普。當AI重塑千行百業之時,人文社會科學自然不能例外。

    數字人文拓展諸多新概念

    說到AI,先要提到數字人文。計算機技術應用于人文社科研究,可以追溯到1949年。當時,意大利耶穌會神父羅伯特·布薩率團隊用IBM計算機花費了30年左右,到1980年編成了56卷百科全書式的托馬斯著作索引。20世紀末,美國的一些研究機構開始使用數字人文,到2024年《數字人文指南》一書誕生,這個名稱正式確定。

    目前,國際上的數字人文機構已有200多家,中國有70多家數字人文專門研究機構,另有30多家高校機構也積極開展數字人文交叉研究。

    從研究角度看,近年來,數字人文拓展出很多新概念,如數字文化、數字史學、數字考古學、計算哲學等,此外還包括計算語言學和自然語言處理。計算語言學和自然語言處理萌芽于1940至1950年代,核心問題是語言的自動理解和生成。基礎研究包括算法框架、知識圖譜;應用研究也涵蓋很多種類,其中就包含有古文字信息處理。

    谷歌公司2017年推出的Transformer深度學習架構是算法框架上的突破;2018年推出的預訓練語言模型BERT,在語言理解指標上超越人類。另一AI巨頭OpenAI則從2018年起推出GPT系列模型。

    在這樣的影響下,中文語言大模型也層出不窮,例如通義千問、文心一言、智譜清言、百川等。同時,在垂類領域,還出現了很多古漢語語言模型、民族語言模型及古籍智能平臺。

    技術影響下的傳統文科

    談到數字人文,也不得不說說AI與人文社科的關系。

    其實,文學對AI的沖擊更為敏感,文學家在AI面前越來越顯得無奈。中文逍遙大模型基于創作者的想法靈感,能夠一鍵生成萬字、一張圖寫出一部小說,它能大幅提升創作者的效率,也具備一次讀懂100萬字小說的功能。雖然對文學創作來說,作者的個性思維是機器永遠無法替代的,但是AI寫作的《機憶之地》已在第五屆江蘇省青年科普科幻作品大賽評選中獲得二等獎——這是人類作家用3個小時,與AI平臺前后對話66次、形成4萬多字的稿件后,從中復制5900多字形成的作品。

    再以哲學為例。中國工程院院士李德毅2023年在《人工智能看哲學》一文中提出:“人工智能的飛速發展正深刻地改變著人類的生產方式、生活方式以及思維方式,沒有哪門學科比人工智能更需要和哲學打交道。”2024年,日本名古屋大學團隊利用生成式AI開發了一款可以與古希臘哲學家們進行對話的系統。

    在歷史學研究中,AI也有廣泛應用。比如,通過綜合運用數據挖掘、指標評價、可視化分析等技術,研究人員可基于歷代《食貨志》文本研究古代中國農作物的空間分布與集聚性特征;此外,通過AI制作復原的數字人,諸多歷史人物得以“復活”,從教材中走出來,穿越到現實之中。

    考古學對科技進展最為敏感,有兩個案例令人印象深刻。其一是地質學家朱利安·湯普森團隊2016年在學術期刊《科學》上發表的《公元前1920年的洪水爆發為中國傳說中的大洪水和夏朝的存在提供依據》。他通過建立黃河流域數字高程模型,在鄭州至開封段發現寬達30公里的古河道遺跡,證明在公元前1920年的前后20年間存在一場持續20年以上的超級洪災,這正是大禹治水的現實背景。它不僅印證了《尚書》中“湯湯洪水方割”的記載,更意外觸發了關于大禹治水技術體系的全球大辯論。另一個案例是2024年2月,谷歌旗下的DeepMind發布了一個根據互聯網視頻訓練的基礎世界模型——Genie(精靈),可從合成圖像、照片、草圖生成多種動作可控的環境。2024年底推出的新一代世界模型Genie2,則可根據一張圖生成可供人類或AI智能體游玩的無限3D世界。這在考古發掘、歷史場景復原方面,有極為可觀的應用前景。

    此外,AI在繪畫、音樂、詩歌、電影、舞蹈、雕塑等藝術領域也展現出強大能力。2018年,首件AI生成作品《埃德蒙·貝拉米肖像》就被佳士得以43.25萬美元拍出。

    AI賦能古文字研究

    再看筆者所熟悉的古文字研究領域,雖然我們是傳統得不能再傳統的人文學科,但近年來同樣可以看到明顯的AI賦能的進展。

    近幾年,國外在古典文字AI破譯方面有很多新的突破。比如,DeepMind與威尼斯大學人文系、哈佛大學希臘研究中心、牛津大學古典學院和雅典經濟與商業大學信息學系合作,共同推出名為“伊薩卡(Ithaca)”的深度學習模型,并將其用于修復古希臘受損的石碑銘文。另一個轟動學界的案例是,美國21歲的年輕科學家盧克·法里托將AI與超過陽光亮度數億倍的X射線結合,由此成功解讀出意大利赫庫蘭尼姆古城中被火山灰掩埋燒焦的莎草紙卷軸中的第一個完整單詞“ΟΡΦΥΡΑ□”(意為“紫色”)。隨后,盧克還與其他人合作分析出超過兩千個字符,并認為這些內容與伊壁鳩魯哲學有關。

    這些案例都給古文字研究者帶來啟示。1973年河北省定縣(今定州市)八角廊40號西漢墓中出土的竹簡,由于墓葬被燒,導致竹簡嚴重碳化、變形。以往,研究者采取的是通過紅外照相和物理拉直的辦法來整理資料并辨別竹簡上的文字。現在,我們完全可以借用上述案例中辨別莎草紙的方式來提高整理質量。

    據筆者所知,目前全國范圍內,已有十個院校團隊在從事古文字AI研究與開發工作,除復旦大學、清華大學、南京大學、華東師范大學等學校外,還包括三家河南的高校,因為河南是甲骨文的故鄉。

    目前已知現存的甲骨片的總數大約是有16萬片,這16萬片當中有很多都是殘片、碎片。那么,如何把這些碎片拼合到原來牛骨和龜甲上?必須借助于AI。

    清華大學的李霜潔研發了人工智能文物拼綴系統“知微綴”,其與復旦大學教授蔣玉斌、博士生楊熠等人合作,以AI引導人類直覺的交互方式,帶動研究者高效發現甲骨新綴,目前已發現超過50組甲骨新綴成果。蔣玉斌承擔的國家社科基金重大項目“人機協同的甲骨分類綴合研究”,目前甲骨綴合成果已超7000組,其中蔣玉斌綴合了500多組,楊熠綴合了400多組,兩人綴合加起來共900多組,占學術界綴合總數的近七分之一。

    古文字與AI的結合還包括圖像校重、古文字單字識別、古文字圖像文字識別、知識圖譜、多模態數據集等。

    當然,AI與人文學科的融合,目前尚處于初步階段,AI生成內容在可信度、規范性上距離高質量的人文研究、教育和推廣的需求還有很大差距。另一方面,由于人文學科專業領域知識庫尚未形成規模,數據標準不統一,共享、整合的難度較大。加之跨學科人才培養,更是涉及招生、教學、就業以及評價機制各方面問題,這也帶來人文研究“AI鴻溝”的凸顯和加劇。

    不過,即便如此,我們還是期待更多人文學者與AI雙向奔赴,共同迎接AI賦能的人文學科研究的騰飛。

    (作者為復旦大學文科資深教授,古文字研究中心主任)

    中文国产成人精品久久96| 中文字幕动漫精品专区| 国产成人精品999在线| 3d动漫精品一区视频在线观看| 久久精品国产一区二区| 国产精品色午夜视频免费看| 精品国产一二三产品价格| 日本精品一区二区三区在线观看| 一本一本久久a久久精品综合| 久久人午夜亚洲精品无码区 | 精品性影院一区二区三区内射 | 久久精品人人爽人人爽| 国产三级国产精品国产普男人 | 亚洲精品字幕在线观看| mm1313亚洲精品国产| 日韩AV无码精品一二三区| 日日夜夜精品视频| 久热中文字幕在线精品免费| 日韩人妻精品一区二区三区视频 | 99久热只有精品视频免费观看17 | 99热这里只有精品7| 日本人精品video黑人| 韩日美无码精品无码| 久久中文精品无码中文字幕| 国产精品免费在线播放| 亚洲av午夜精品一区二区三区| 在线91精品亚洲网站精品成人| 亚洲精品无码永久在线观看男男| 久久精品久噜噜噜久久| 久久精品青青草原伊人| 亚洲国产精品免费在线观看| 2021国产精品久久久久| 久久精品中文字幕无码绿巨人| 亚洲综合一区二区国产精品| 日本午夜精品一区二区三区电影| 久久9精品久久久| 日产精品久久久久久久| 91久久国产精品| 四虎永久在线精品波多野结衣| 亚洲首页国产精品丝袜| 亚洲中文字幕久久精品无码VA|