發展新質生產力 推動出版業高質量發展 推動出版業與AI融合發展
出版業應對AI浪潮:在變革中尋找生產力
■姜占峰(北京師范大學音像電子出版社社長、京師訊飛公司董事長)
人工智能大模型飛速發展。與AIGC剛出現時相比,如今部署和應用大模型的難度和成本大幅降低,性能顯著提升。算力基礎設施層面,大模型依托GPU/TPU等高性能計算芯片構建硬件底座,并匹配穩定的能源供應體系保障持續運轉;算法創新方面,以DeepSeek研發團隊突破的模型架構優化技術為代表,通過算法效率提升實現算力資源集約化利用,達成“低能耗、高精度”的訓練產出; 數據資源基礎方面,出版行業因其積累的專業知識庫、學術文獻等結構化高質量的數據,可為大模型訓練提供稀缺性高、專業性強和高準確度的核心語料資源。去年,國內已經出現了部分大模型平臺算力過剩情況,當前又因DeepSeek等帶來的創新算法大幅度提高計算性能而導致算力需求下降,這些變化都為出版業等行業帶來了難得的戰略發展機遇,預示著大模型進入中小型出版企業應用不再是夢想。
出版業面臨的機遇與挑戰。大模型在為出版業帶來重大發展機遇的同時,也帶來了諸多挑戰。傳統加工編輯因其工作具有低協作性和高可替代性,可能因大模型的廣泛應用被替代。同時,大模型的普及引發了對人類是否會被“硅基人”控制的擔憂。如大模型已能通過視覺模型實現電商下單的自動化操作,甚至可自動識別在朋友圈點贊。大模型存在幻覺問題,越是性能高級的大模型給出的結果幻覺問題越嚴重。如何善用大模型、提高大模型的安全性,將成為一個嚴峻挑戰。
此外,大模型在應用監管、信息安全、投入產出比、利益分配以及版權問題等方面也存在諸多問題,大模型將大量出版數據納入數據庫,可能導致出版單位數字化內容被非法牟利。出版企業可能因數據被濫用而無法享受收益,在利益分配中也難以計算自身所得。當發生侵權責任時,現有法律很難界定是作者責任還是大模型技術本身,難以追責。
出版業的應對之策。建議采取“擁抱、應用、規范”的策略。首先,要積極擁抱大模型技術,培養員工對大模型的好奇心、想象力和探求欲,避免因擔心被取代而產生抵制心理。在應用方面,要從作者端、編校端、營銷端和服務端四個方面尋找應用場景。一是尋找場景,以小切口覆蓋大范圍,比如可從領導快速決策、出版合同審查、內部資源流轉和外部商機維護等方面入手;二是建立知識庫,構建出版企業和個人的知識庫,將企業文檔、大數據、業務數據等整合形成企業知識庫;三是搭建智能體,根據選題策劃、內容編校、市場營銷和運營服務等場景搭建相應智能體,如選題智能生成、智能審校、營銷直播文案生成等;四是將知識庫和智能體融合到出版業務流程中,深度賦能出版效率提升。在規范方面,可由相關行業協會組織國內出版行業形成版權聯合體,同時建議行業主管部門制定大模型應用管理規范和相關標準等。
智領未來:AI技術應用重新定義出版邊界
■陸彩云(知識產權出版社總編輯助理)
基于不同板塊的AI應用實踐。為應對技術變革,知識產權出版社對傳統組織結構進行優化,構建敏捷型組織。首先成立了全社的創新管理機構——創新研究院,針對出版社業務中的知識產權服務、數字出版等各個場景,規劃相關AI相關產品或服務,并調配資金、組織管理,保障研發工作順利開展,諸如“中智慧海”“中知慧融”等平臺。在出版板塊,成立了出版融合管理中心,以“出版+融合”與“融合+出版”為主要職能工作,除了帶動傳統編輯部將人工智能應用在出版業務中,將AI審校、智能排版、AI營銷等融合到出版生產管理流程中,還積極組織策劃融合創新項目,積極探索新型出版模式,助力出版高質量發展。
在知識產權服務板塊,基于社內海量知識產權大數據庫,利用AI技術實現了多源數據的深度融合,通過先進的數據互聯技術,構建了“知識產權數據+”立體化數據庫,實現了專利商標等知識產權數據、訴訟維權信息、產業園區數據、商業情報數據和產業分類標準等多維度數據的智能關聯與互通。同時,還嘗試了將知識產權縱深領域的圖書、文獻、課件資料等知識資源,同大模型技術融合,構建專業知識問答系統,實現行業科普和培訓教育,并將這項技術引入知識產權學習平臺,開發智能助教——虛擬人艾曉園。
在出版融合板塊,積極融合AI技術,構建智能化生產管理系統和圖書數據AI檢索系統,提高了書稿審校效率和內容質量,并做到圖書數據存儲智能化管理,賦能圖書數據全版權運營、數據庫及知識服務相關業務。
知識產權社還根據各個大模型的特點,構建出版及新媒體運營應用場景,深受編輯和營銷人員歡迎。一是實現出版流程智能化,融合大數據和人工智能技術構建AI編輯助手,利用智能化應用場景構建提高內容質量,初步實現了編輯在選題策劃、內容創作、營銷、運營等方面的降本增效。二是資源數字化,通過紙電同步、AI生成有聲書和視頻、構建知識庫等,實現對數字資源的轉化、保護、管理,實現作品內容一次生產、多元服務。三是運營智能化,通過AI智能生成宣傳文案,通過虛擬人錄制宣傳視頻,提升運營效果。四是實現從產品到知識服務的轉變,構建“一書一智能體”模式下的多種融合出版服務,與圖書內容進行深度交互。
融合出版平臺應用與AI技術突破。出版融合管理中心以“來出書”融合出版平臺為抓手,構建了AI編輯助手,為社內出版相關業務提供了AIGC工具服務平臺,可以讓作者、編輯、設計、營銷及印務等出版全鏈條相關人員積極探索AI在出版業務的應用,賦能出版業務發展。平臺除了提供豐富的出版業務場景化應用,還支持自建業務場景應用,按照員工個人工作需求構建適合自己的業務場景,幫助員工提高在選題、內容、營銷、運營、設計及印刷等工作的質量和效率。出版社還獲批了北京市科委項目“科幻IP全生命周期數智化技術研究與應用示范”,利用人工智能大模型創作內容,通過AI技術,根據內容情節生成視頻,AI視頻甚至可以較為完整地還原書稿中的情節。AI技術使出版內容可以通過文字、圖片、視頻等多種形式展現,為出版內容創作和呈現形式帶來了巨大的創新變革。
AI賦能出版高質量發展
■陳永剛(人民衛生出版社智慧數字中心主任)
人工智能對出版的作用。內容生產變革方面,人工智能,尤其AIGC的出現,以數據為原材料,突破季節和倉儲限制,帶來指數級的生產力解放,能實現多模態輸出。數據重組創新方面,AI通過學習數據不斷成長,打破學科壁壘,交叉產生新知識點,為未來智能出版及流程再造提供支持。融入場景拓展方面,數字技術憑借知識介入可融入眾多產業和平臺,出版作為以內容生產為主的行業,能借此機遇自然切入應用場景。知識服務升級方面,AI可以扮演助手角色,助力出版社發揮內容組織、篩選和優化的優勢,持續提供高質量內容生產力。
AI在出版場景應用中面臨的問題。一是傳播分流與邊緣弱化。DeepSeek低成本高性能等特性,讓AI技術加速滲透產業,許多用戶爭相接入大模型應用,出版在作者端和用戶端的信息橋梁作用不再突出,生產端和傳播端功能弱化。二是輸出同質化。AI基于已有數據和模型輸出內容,在原有數據集難以突破情況下,易出現形式相似問題,尤其在宣傳文案撰寫和營銷方案寫作中用詞重復。三是可信度存疑。AI本質是算法概率傳遞,信息在傳遞中衰減,若無新數據和算法,且未學到正確知識,輸出結果易存疑。同時,AI輸出具有高度仿真性,可能將不確定事件確定化,影響信息可信度。四是倫理安全風險。個人對數據的控制力下降,數據泄露和使用安全問題凸顯,數據和算力主導權導致信息不對稱加劇。此外,目前沒有適用于所有場景的AI大模型,增加了出版應用的難度。
AI推動出版高質量發展的著力點。在“內容-技術-場景”融合的新價值鏈中,出版需從單一內容輸出升級為知識服務生態構建者,強化知識賦能與場景滲透能力,重塑出版價值。一是融入產業鏈與知識賦能。利用出版社系統的知識體系、嚴謹流程、優秀編輯團隊和持續更新能力,為AI發展提供高質量的知識基石;深耕專業數據,保障大模型知識輸出的正確性;滿足數字閱讀時代便捷、個性、場景化需求;加強與大廠和科研單位合作,促進知識流動和場景拓展。
二是平臺化生產與知識服務升級。傳播內容日益數據化,出版應轉向以內容為核心的多中心生產模式,平臺化生產成為重點。這不僅能保證內容質量,借助AI提升工作效率,還能促進數據循環,加強出版社與讀者用戶的聯系,適應不同場景需求。同時,圖書生產向專業知識庫生產轉變,打造垂直智能體,提供知識查詢和多模態輸出,滿足高階推理需求,推動知識迭代。
三是教育領域的數字化轉型。教育出版社面臨數字化轉型挑戰,大規模工業化教育模式若被打破,利潤來源將受沖擊。國家推動數字化融入教學教育,出版社需考慮AI介入數字教材,以模塊化建設匹配學生能力培養,注重個性化學習路徑和擬人化陪伴,交叉化融合打破學科壁壘,推動新工科、新醫科發展。
四是打造智能化技術底座。考慮本地算力和云端算力混合算力調用,建設在特定場景中專有小規模大模型的本地化部署與應用,滿足對知識產權保護要求嚴格的場景,通過“數據倉庫+計算引擎”,實現內容可計算、知識可應用、服務可擴展,釋放數據價值,支撐知識服務。
AI與古籍出版融合發展的現狀、挑戰與未來
■洪 濤(中華書局古聯(北京)數字傳媒科技有限公司總經理)
人工智能在古籍出版領域的應用實踐。人工智能尤其是大模型技術在古籍出版領域展現出獨特的影響力與應用潛力。古聯公司開展了四個與人工智能緊密相關的業務方向。一是數據庫業務,10年來構建了近30個古籍數據庫,涵蓋經典古籍文獻整理、出土文獻以及各類專題數據庫,形成龐大的數據資源。二是古籍智能整理業務,自2016年成立新聞出版署的古籍實驗室以來,持續推進相關技術研發。如利用word模型進行古籍自動標點、圖像識別,到打造古籍在線智能整理平臺等。三是人才培養業務,建立線上集合學院,增設數字化前沿課程,著力培養兼具古籍功底與數字素養的復合型人才。四是文化產業業務,積極開展數字人項目,如上線蘇東坡數字人、為大同文旅打造花木蘭數字人等。
古籍出版中AI技術面臨的挑戰。一是知識產權界定愈發困難。古籍整理包含標點、注釋、校勘、翻譯等對文本內容的加工,其知識產權存在爭議?,F行著作權法對古籍整理成果保護模糊,基礎整理工作難以構成獨創性表達,侵權維護困難。從學術發展角度看,古籍整理需借鑒前人成果,如何確保數據溯源與知識產權保護,是古籍整理行業亟待解決的重要問題。
二是現有模型存在很大局限性。以古文垂直模型為例,其迭代速度落后于通用模型,常需借助通用模型進行增量化訓練與蒸餾。雖然通用模型在專業領域表現有所提升,但仍無法解決諸多專業問題。如古籍用字統計顯示,常用古籍字約2萬字,可涵蓋99.96%語料,但中華書局古籍庫包含13萬個字符,中華字庫項目更是包含約50萬個字符,其中包含大量甲骨金文、小篆、簡帛石刻異體字等,現有大模型難以處理。
三是技術能力與應用場景不夠統一。古籍專業模型在古籍整理工作中,如文字識別、標點、內容分類等方面效率較高,但在將古籍內容與大眾需求打通方面存在不足。與通用模型相比,古籍模型推理和交互能力較弱,從古籍知識向大眾應用轉化的能力也有待提升。
基于人工智能的古籍出版融合發展趨勢。一是實現企業級智能化。出版企業不僅要在選題策劃、編輯加工、宣傳推廣、融媒體制作等產品線應用人工智能技術,還需應用到企業經營管理的各個環節。例如通過與ERP整合,利用大模型抓取圖書館館藏、市場需求及二手書交易信息,可助力重印書選題策劃,盤活歷史出版資源,根據市場需求重組產品線。
二是數字化資源價值釋放更加迅速。以往古籍數字化資源主要通過出售數據庫變現,模式單一。借助大模型定制,可實現數據定制服務,滿足用戶對特定古籍內容的精準需求,如古代軍事、防災抗災、地方史料等信息,降低成本的同時拓展業務領域,充分盤活數字化資源。
三是落實國家古籍工作規劃。古籍作為國家傳統文化傳承的重要載體和基礎文化設施建設內容,國家高度重視。兩辦文件提出開展古籍文本結構化、知識體系化、智能化研究和實踐,推動古籍利用轉型升級。國家制定的《2021—2035年國家古籍工作規劃》,明確了古籍智能化利用和數字化支撐體系建設任務。
四是重塑產業鏈條。下游面臨游戲、視頻等外部競爭,用戶獲取知識方式轉變為網絡問答,全民個性化學習和教育趨勢凸顯;上游高校學科要求文理結合,傳統學科與新興技術融合,成立數字人文中心和專業。出版方需響應上下游變化,打通上下游,構建新的出版生態鏈條。
制定戰略路徑 擁抱AI時代
■朱濟順(中金易云科技有限責任公司總裁)
人工智能的本質局限與出版業的AI路徑。人工智能的核心是基于事實與模型進行推理,其本質根據已有的事實及模型進行推理得到可能存在的事實。其計算速度和知識儲備遠超人類,但存在兩個根本局限:一方面,人工智能創新能力仍舊有所欠缺。文藝創作等需要突破性思維的領域仍是人類專長。人工智能雖然知識存儲巨大,推理機制豐富、速度快,但是本質是無意識的數據重組與模仿,缺乏真正的原創性,無法提出突破性理論或藝術理念。另一方面,人工智能在價值判斷層面存在缺失。創造力源于意識、情感和主題體驗的結合,能夠透過抽象思維和哲學思考推動科學革命或藝術創造。
出版行業的AI路徑,更應向著專業化、精細化、最優化的方向發展。一是專業化,利用通用人工智能技術建立行業大數據人工智能工具,實現途徑是利用行業大數據(數據實時性、覆蓋率要求不是很高),解決的問題是“定方向(如選題策劃)”等,結合企業自身數據(顆粒度細、數據實時性、覆蓋率要求高),構建企業自身數據資產、構建人工智能工具,實現“精運營”。二是精細化,引入先進的ERP系統解決行業一直存在的問題。如:成本核算、管理粗放等問題,做到數據清晰,盡快建立企業自身的精確數據資產、建立科學的考核體系、建立先進的運營體系。三是最優化,智能工具與ERP系統集成,能快速迭代,充分考慮運營成本。
出版行業的轉型機遇。當前出版業數字化轉型已進入攻堅階段,需通過“數據+AI場景+流程”三位一體架構實現高質量發展。行業面臨三大轉型機遇:一是利用AI工具提高生產效率,如智能校對工具的使用,提高三審三校的工作效率;二是推進知識服務升級,將紙質書轉化為知識服務平臺并開發文創產品,構建專有知識庫形成競爭壁壘;三是實現運營數據資產化,整合生產、銷售、用戶行為等數據建立企業數據資產,通過AI分析賦能精準重印補貨、選題優化、營銷策劃及評估等智能場景。
數字化轉型實施路徑。首先夯實數據底座,構建覆蓋全渠道的智能運營平臺,整合ERP、電商、門店、新媒體各渠道數據并細化至日級顆粒度;其次利用這些數據深化場景應用,在選題策劃、營銷優化、供應鏈管理等環節建立智能的應用場景,建立矩陣式管理模式并將AI工具深度嵌入ERP系統。
實施建議方面,應分階段從信息化過渡到數字化再到智能化,與技術公司共建解決方案降低成本,同時強化數據安全管理和知識產權保護。行業需在擁抱AI技術提升效率的同時,堅守內容創新的核心競爭力。當前,出版業數字化轉型已進入攻堅階段,既要擁抱AI技術提升效率,更要堅守內容創新的核心競爭力,通過構建“數據+流程+智能場景”的三位一體架構,在AI時代實現出版業高質量發展。