《大辭海》與大模型深度融合,推出智能審校解決方案 “辭文”問世,10分鐘審校40萬字
以《大辭海》為“地基”,插上人工智能大模型的“翅膀”……3月25日,上海辭書出版社與百度、鯨湯(上海)智能科技有限公司在滬發布最新產品“辭文智能知識審校系統”(以下簡稱“辭文”)。歷時兩年研發的該產品深度整合我國標志性大型綜合性辭典《大辭海》中30多萬個詞條的權威知識體系與文心大模型理解、生成、邏輯、記憶四大核心能力,成為國內首個融合權威工具書資源的智能審校解決方案。
近幾年,文本審校工具如雨后春筍般不斷涌現,從早期的黑馬校對、方正智能審校,到i校對、鳳凰智能校對系統、蜜度校對通、果麥AI校對王等產品,各有所長。融合權威辭書資源和大模型能力的“辭文”瞄準了傳統文本審校在知識性、邏輯性方面的痛點,實現四大技術突破:一是精準的知識溯源能力,當發現錯誤時,系統不僅能指出問題所在,更能通過Agent技術精準定位到《大辭海》中的相關條目,展示完整的知識鏈條,讓用戶不僅知道“錯在哪里”,更明白“正確的應該是什么”;二是強大的多輪推理能力,可深入驗證文本多維度合理性,找出隱藏的邏輯謬誤,比如當審核一篇關于歷史人物的文章時,系統不是簡單地核對年代,而是會通過多重推理,驗證人物關系、歷史背景、事件順序等多個維度的合理性;三是動態的知識更新機制,當《大辭海》數據庫有更新時,系統能自動完成知識的同步;四是智能的交互式審校流程,通過有效控制大模型的發散、幻覺問題,提供個性化的審校建議,這種人機協作的方式既保留人工審校的專業判斷,又發揮了AI的效率優勢。
通過高算力支持,“辭文”目前可在10分鐘之內完成40萬字文本量的審校。樣本實測數據顯示,采用該系統后,審校工作效率成倍提升,錯誤識別準確率可達80%。
“隨著知識專業化分工的日益精細,單個審校人員難以完全掌握跨學科知識,市場迫切需要一套智能、高效、準確的知識審校系統。這不僅是新聞出版機構、內容發布平臺的把關利器,也將是整個內容創作行業的前置工具。”上海世紀出版集團副總裁、上海辭書出版社社長秦志華表示,“辭文”突破以往文本審校工具的局限,實現從“文字糾錯”到“知識審校”的能力跨越,其價值更在于守護知識傳播的準確性與嚴肅性。據悉,目前該產品已應用于人文社科、科學技術等出版領域的文本審校,未來還將拓展至新聞傳媒、教育科研等場景,致力于成為內容生產領域的“數字質檢員”。
上海辭書出版社針對一份50多萬字的關于上海歷史主題的付型稿件,采用“辭文”進行深度檢測,系統共標記471處潛在錯誤,經專業編輯團隊逐條復核,最終確認采納87處知識性差錯(含歷史事件誤記、人物關系錯位、地理沿革錯誤等),錯誤類型覆蓋上海開埠史、租界制度、地方文獻等專業領域。橫向對比測試數據顯示,“辭文”系統檢出471處,確認采納87處;而此前一審校產品檢出262處,確認采納0處。
有“語林啄木鳥”之稱的上海《咬文嚼字》也試用“辭文”測試了11條材料,7條提示沒有審校到錯誤點,4條提出了修訂點。其中對一句元好問詩句的糾錯令上海咬文嚼字文化傳播有限公司總經理王敏驚艷,對唐代詩人李端的字的糾正也很正確。他感慨,在大模型助力下,通過人機協同,產品有很大潛力。