第三章 智能化语境下出版业知识服务

杨海平,钱聪

作者简介:杨海平,钱聪 杨海平,南京大学信息管理学院教授、博士生导师,南京大学出版研究院副院长,国家新闻出版署“智慧出版与知识服务重点实验室”主任;钱聪,南京大学信息管理学院2021级博士研究生。

摘要:随着数字技术的不断发展,出版业早已从单纯提供内容服务发展到个性化、场景化、智能化的知识服务,探讨智能化语境下出版业知识服务是智能化发展的必然趋势和要求。在智能化语境下,出版业与智能技术深度结合,在一定限度上构建起知识服务的全新智慧模式,出版业的知识增量、专业性、转化度都得到了大幅度提升,对于传统出版模式也带来了新的变革与生机。但不可否认的是,智能化对于出版业的渗透仍处于初级阶段,出版业的智能化转型也存在一定的问题,直面这些问题并找出有效的优化路径,希冀推动我国相关领域的发展水平有所提升。

关键词:智能化;出版业;知识服务;挑战。

一、智能化语境下出版业知识服务的背景、概念与特点

(一)智能化语境下出版业知识服务的背景

1.政策背景

出版业知识服务是一个动态发展的过程,随着人工智能、大数据等新技术的不断发展,出版业知识服务已逐渐从单纯的内容服务到个性化、场景化、智能化的知识服务,探讨智能化语境下出版业知识服务是智能化发展的必然趋势和要求。

2016年1月,国家新闻出版广电总局提出新闻出版业“十三五”科技发展规划总体思路,要加速新闻出版业转型升级,增强新闻出版业的文化服务与信息内容服务能力,并下发《关于同意筹建知识资源服务中心的批复》,标志着出版专业领域知识服务上升为国家科技文化发展战略。2017年3月,《新闻出版大数据应用工程》入选国家发展和改革委员会大数据发展重大工程,出版业需要与科技深度融合,以科技促进新闻出版业转型升级。2017年5 月,科技部下发《“十三五”现代服务业科技创新专项规划》,强调在当今文化科技融合发展的趋势下,要建设开放式专业内容资源知识服务众智平台,用科技助力出版业知识服务。2017年7月,国务院发布了《新一代人工智能发展规划》,移动互联网、云计算、大数据等技术日新月异,人工智能迅速发展,正在推动经济社会各领域从数字化、网络化向智能化加速跃升,现代互联网逐渐向高附加值的知识创新型服务延伸。2020年提出的“十四五”规划明确提出推动传统产业智能化发展。出版业知识服务围绕大数据、智能化、核心技术等关键词不断发展,出版业要紧跟国家政策和时代发展,在智能化语境下,促进知识服务平台的构建与知识服务产品的生产,用科技为知识服务赋能,构建出版业知识服务的新兴生态模式。

2.技术背景

1)NFT:出版业知识服务新路径

NFT(Non-fungible token)的全称为非同质化代币(也称“非同质化通证”),本质上是加密货币的一种。与比特币类似,构建NFT的数据结构与加密传输交易信息的“底层技术”是区块链,因而具有数据化结构、分布式存储、加密算法和共识机制等特征。区块链由“区块”和“链”组成,是一种旨在通过去中心化的方式集体维护一个安全可靠的数据库的技术方案。

NFT 的非同质化属性体现在其提供了标记特定数字资产所有权的方法,具有去中心化、公开透明和不可篡改等区块链技术的基本特征。目前,NFT已经较为广泛应用于艺术收藏品、虚拟游戏等领域中,许多数字资产都在NFT平台进行拍卖式交易,从而对版权、创意等进行保护。出版业的知识服务也具有非同质化的特征,应着力将NFT与出版业知识服务相结合,可以从不同场景探索NFT在出版业的应用。就技术手段而言,各类出版物都可以被数字化并形成NFT化的产品形态,而NFT化的出版物是独一无二的,因此沿着这一思路,出版业可以从不同层面探索NFT在行业内的应用。出版业拥有大量的传统知识资源,如果这些知识资源能够NFT化,其稀缺性会吸引买家竞标,从而提供可观的收益,同时数据的可追溯性能够防止各类盗版侵权的行为发生。

2)数字孪生:出版业知识服务新动能

数字孪生技术在出版业有其独特的应用价值,可以利用数字孪生模型构建出版业仿真系统,从而实现出版资源需求与数字孪生模型同步更新,数字孪生技术能够实现出版产业链的数据化。出版产业链的数据化包括内容数据(图书、期刊、报纸、有声读物等)、发行数据(销售量、码洋、库存等)、印刷数据(印数、印张等)、出版物元数据(ISBN、ISSN等)、网站数据(页面浏览量、独立用户数、访问次数等),以及第三方平台的用户行为数据、消费数据、社交数据等。数字孪生能够实现出版业的先知先觉,为出版业提供信息化发展的基础,数字孪生技术使定制图书、定制期刊、定制报纸、定制绘本等出版物成为可能。数字孪生能够实现出版业的智能决策,通过组织出版业中各领域的力量,结合多学科交叉点,构建出版业仿真系统,减少出版物编制、印刷、营销之间的壁垒,发挥数字孪生技术在出版业的综合效应。

3)脑机接口:出版业知识服务新探索

狭义的脑机接口一般指的是输出式脑机接口,即利用中枢神经系统产生的信号,在不依赖外周神经或肌肉的条件下,把用户的知觉、认知和思维等直接转化为动作,在大脑与外部设备之间建立直接的交流和控制通道。用更通俗的语言来讲,所谓脑机接口,其实指的就是在大脑与外部环境之间,建立一种全新的、不依赖于外周神经和肌肉的交流与控制通道,从而实现大脑与外部设备的直接交互。脑机接口其实是一种关于信息传递的科学,运用在现代出版业,其实就是实现“精准出版”,首先需要获取大脑的信号,解读这些信号,分析目前所处的场景,然后通过技术将这些信号传递出来,通过智能分析再进行定制出版,形成的出版物可以是多元的,通过虚拟现实技术、增强现实技术,真正做到“所想即所得”。

3.出版业的转型升级需要

传统出版的内涵与外延随着社会、技术的不断变革与发展,扩展到网络文学、问答网站、音频应用、视频应用、听书应用、维基百科、推特、微博、微信等开放获取平台,改变了以往出版的流程和模式,出版形态多元,各类出版物蓬勃发展。在海量的信息数据面前,如何快速、精准地获取有价值的信息,已经成为当代出版业转型升级的重要目标。在如今的出版业发展中,谁能掌握数据并加以整合利用,谁就会占有中心地位,经过重组的知识单元网络日益成为出版业的重要资源。智能化令受众打开知识服务的新视角,知识生产和知识传播模式发生巨大变革,转型升级是出版业可持续发展的必然要求。知识资源数据化后,出版机构可以重新整合知识资源,对知识资源进行自动关联整合,丰富优化数字知识资源结构体系,将各领域、各场景的用户需求进行深加工,以便于把普通的知识资源优化升级为对受众有巨大价值的优势资源,实现知识资源的高效利用。在此背景下,出版业正在积极进行战略谋划和整体布局,整理转型思路,进一步提高出版生产力,开发多元产品和服务平台,提供文字、声音、图像、思维导图、知识点等多种知识服务产品,致力于受众需求,同时承担社会责任,营造知识、文化服务环境,有效提升社会公共文化服务能力,助力文化强国建设。

(二)智能化语境下出版业知识服务的概念

近年来,出版业知识服务受到广泛关注,学界专家从不同角度界定知识服务的概念,部分学者关于知识服务概念的界定如表3-1所示。

表3-1 部分学者关于知识服务概念的界定

综合上述学者的研究,知识服务是一种融合内容、数据、技术、运营于一体的创新服务业态。目前其实没有标准的知识服务运营企业,需要诞生一种跨界整合、服务集聚的新型服务运营公司。在各专业和垂直领域,传统机构在内容、渠道和政策方面具有排他性优势,如何把这些优势转化为真正的流量经济呢?出版业的知识服务本质上就是针对用户在知识断层方面的需求给予匹配,出版业由于其特殊性,其知识服务要求更为专精,需要建立专业知识体系库,利用语义分析识别用户需求,并根据关联内容匹配并完成搜索。

在出版业的发展历史上,每一次的技术革新都会推动出版业行业实践的巨大变化。当前,高反馈、强互动的智能化语境为出版业知识服务提供了新的可能性,出版业要根据自身的发展目标,结合已有的知识资源、线上线下平台特点、知识服务用户需求,充分发挥智能化相关技术,着眼于整体的媒介平台和出版业知识服务的发展新业态,积极探索智能化语境下出版业知识服务的创新和发展。

智能化语境下知识服务的产品形态不仅限于纸质图书,还包括微信公众平台、App应用搭载线上课程和知识服务,出版业拥有丰富的知识资源,具有突出的内容优势。例如,华东师范大学出版社的知识服务业务主要分为教育服务与阅读服务两部分。教育服务部分包含产品和平台,其中,产品分为学前教育和基础教育,学前教育包括阅读树、美慧树、点读笔等,基础教育包括二维码图书、IPTV、手机报等;平台包括安全平台、多功能题典、大学语文等。阅读服务主要包含重点图书的电子书化与相关App建设。目前,华东师范大学出版社打造的App内容主要为敦煌、阅读树、中国风三款App,这些新媒体平台依托丰富的教育资源从事相关的专业型知识服务。同时,智能化语境的知识服务为消费场景提供了个性化需求,实现了价值共享。智能化语境下,新兴技术能够进行场景感知、场景再造、场景配适,促使出版业除了能够提供简单的内容文本,还能够分析用户的潜在需求、具身体验、知识异化等个性化服务,完成了内容的空间流动性,聚合相同消费场景群体,并最大化释放知识服务价值。

(三)智能化语境下出版业知识服务的特点

1.智能化语境下出版业知识资源的数量和形式都大幅增加

出版业知识资源丰富,覆盖人群多元,随着网络信息技术的高速发展,出版业的界限越来越模糊,相互融合发展的速度越来越快,以高新技术作为主要手段的现代出版业迅速产生和壮大,这已经成为出版业发展的社会趋势,出版数字化、网络化带动传统出版走向数字出版、智能出版,产品数量快速增长,同时越来越多的受众参与到出版的过程中来,出版的形式也呈现出多样化,除了图书、报纸、期刊,还有数据库、视频、游戏、动漫、音乐等相关的出版形式介入出版业,不断增强出版业的生命力和创造力。

2.智能化语境下出版业知识服务的专业性限度更高

许多垂直领域和专业领域的出版业务具有明显的导向型和针对性,专业性限度高,用户精准,服务需求明确。例如,农业领域的知识服务平台通常由农业出版社进行运营,交通领域的知识服务平台由交通出版社进行运营,行业性、专业性的知识服务平台是出版业服务的主阵地。这类专业性知识服务是出版业实践最多、市场占有率最高的一种知识服务,许多行业垂直领域的知识搜索平台、专家智库平台、知识数据库平台等类型的知识服务平台都是行业出版机构的独有项目。具有代表性的有中国大百科全书出版社的中国大百科全书数据库,人民法院出版社的法信,知识产权出版社有限责任公司的中国知识产权大数据与智慧服务系统,人民卫生出版社的临床助手、中医助手,社会科学文献出版社的皮书数据库等。

3.智能化语境下出版业知识服务个性化愈加明显

个性化需求不仅是知识需求,而且已经渗透到生活的方方面面。智能化语境下的出版业知识服务,不仅提供知识服务产品,还要搭建用户与作者、用户与专家的互动平台,增加知识服务的体验感。很多出版企业针对不同的读者群体,搭建了不同的沟通平台,组建微信群,方便读者之间的交流,提升了用户的存在感,增加了用户黏性,提升了用户的阅读参与感,能够针对用户需求解决问题,丰富产品形态,针对不同场景提供知识服务产品,契合用户需求,实现个性化服务。

4.智能化语境下出版业知识服务数字经济转化更有效

数字经济发展速度之快、辐射范围之广、影响限度之深前所未有,正在成为重组全球要素资源、重塑全球经济结构、改变全球竞争格局的关键力量。出版业知识服务紧紧抓住了这一契机,推动互联网、大数据、人工智能与传统出版业相结合,提出数字出版、智能出版、智慧出版,推进出版产业链条发展,打造具有竞争力的出版产业集群,构成知识密集型服务产业。

在智能化变革和新冠肺炎疫情等外部挑战的冲击下,当前出版业知识服务仍面临盈利模式单一、用户画像不精确、受众参与度低、版权保护欠缺等诸多问题。智能化出版业知识服务为以上问题提供了新的解决思路,成为后疫情时代出版业知识服务转型升级的动力引擎。

二、出版业知识服务现状

(一)传统出版业知识服务现状

传统出版业知识服务发展分为三个阶段,即信息化阶段、数字化阶段和智能化阶段,如表3-2所示。

表3-2 传统出版业知识服务发展的三个阶段

传统出版业结合知识图谱、机器学习、语义网等技术,推出各类知识平台进行检索。传统出版业的知识服务大多为用户提供文献检索层面的服务,对知识库的资源还没有进行深层次的加工和标引,有部分出版社已经着手开始对本领域的知识进行重组,以便为用户提供更深层次的知识服务。例如,人民出版社将中国共产党理论资源数据库中的党的思想理论进行碎片化处理,并进行知识点重组阅读,使文献内容以不同的知识逻辑形式呈现,为用户提供更精准的知识检索服务。

(二)数字出版业知识服务现状

智能化语境下,不仅传统出版机构进行了知识服务转型,也有一批科技企业不断为此付出努力。科技企业的知识服务大多以谋求经济利益为出发点,通过互联网技术为受众提供省时高效的知识服务,科技企业的知识服务做到了交付感的变化、时间感的变化、对象感的变化、口语感的变化,他们将知识服务分为不同需求情况下的场景需求。如在收藏和静态阅读环境下的纸质图书;在随时随地能阅读环境下的电子版图书;在快速了解核心内容环境下的听书产品;在深度了解作者想法、与作者深度交流的课程产品(《大师课》等)。在不同场景下,通过不同载体的设计给用户更好的知识服务体验。

(三)出版业知识服务模式现状

智能化语境下出版业知识服务是以用户需求挖掘为导向,以海量和多结构数字出版资源深层开发为基础,以智能化技术为依托的知识服务模式,以智能化技术对知识服务流程进行再造,形成“用户需求挖掘—数字资源重组—个性化知识服务”的知识服务流程。智能化语境下出版业知识服务主要包括三个方面:一是对用户知识需求的挖掘;二是出版资源重组;三是个性化知识服务。从国内出版业知识服务的发展模式来看,智能化语境下出版业的知识服务分为智能化、半智能化与人工协作等模式,随着出版业知识服务发展的多元化,出版业知识服务的主要类型、知识来源、组织形式、平台展示、获取渠道、盈利模式等都存在差异。

1.智能化模式

知识服务型资源数据库和知识获取终端设备是传统出版与数字出版相融合的智能化产物。知识服务型资源数据库由专业的出版机构运营,出版机构将出版资源上传到数据库平台,提供文章的题目、摘要、关键词、全文等知识资源供用户下载。不少传统出版社纷纷利用自身的资源优势建立专题数据库,在垂直领域提供权威的专业内容和个性化的检索服务。

知识服务型资源数据库的背后一般都有传统的专业出版机构作为支撑,知识资源组织形式是职业生产内容(Occupationally-generated Content,OGC),对生产者有一定要求,通过将原有的资源数字化或购买其他数字资源,为用户提供检索或下载服务,具有专业性、职业化、深耕性的特点。智能化背景下的知识服务型资源数据库本身就具有的海量的数据、权威的作者、专业的出版机构、高质量的出版内容,经过智能分析可以为用户提供更为精准的决策支撑和科学参考依据。

知识获取终端设备主要以平台产品研发为主导,其知识资源组成形式是OGC,在知识服务功能上开拓了电子资源的检索、阅读、购买、上传等,知识获取终端设备的知识服务更多以用户为中心,完善用户的阅读体验。

2.半智能化模式

知识付费App模式、社交媒体知识分享模式都属于知识服务的半智能化模式,知识付费App模式将知识商业化,用户通过付费订阅专门的课程、专栏等获取知识。社交媒体知识分享模式是在社交媒体平台进行知识分享的活动。社交媒体知识分享模式是以社交平台作为依托,用户之间可以相互分享知识资源的一种新兴形式。社交媒体知识分享模式以用户生产内容(User-generated Content,UGC)为主,用户将自己所掌握的信息发布在平台上,分享自身生产的信息,具有非职业化、低门槛、内容质量良莠不齐等特点,资源类型多元,包括文章、图片、音乐、视频等,并依托用户的社交与社群关系进行知识分享与知识服务。

3.人工协作模式

人工协作模式是指大众通过网络对知识资源进行协同编辑加工的组织模式,主要应用于问答类社区,这种模式是智能化语境下出版业的延伸探索。如 Quora,它为用户提供提问、回答的平台,把存储在人类脑海里的经验、技术和方法等隐性知识显性化,借助社交网络实现知识与人的对接,Quora具有关注和订阅功能,相关人员可以互为好友,促进用户之间的互动。智能化语境下出版业知识服务模式如图3-1所示。

图3-1 智能化语境下的出版业知识服务模式

三、智能化语境下出版业知识服务所面临的问题

(一)知识资源结构单一,知识链构建不足

出版业利用数据挖掘与分析技术、语义技术等重组、标记和应用海量碎片化的数据资源,以领域本体为基础建构知识体系资源的过程中,暴露了对内容资源的 XML 结构化拆分不足的问题。在知识服务平台的建设过程中,出版业对文本资源中的知识单元进行挖掘与重组,一般很少能突破“本”的限制,向下挖掘以篇、章、节、图、表等为单位的内容单元,将其拆分为数以万计的知识元。此外,出版业局限于对文本知识资源的挖掘,较少实现对图文、音视频等多种形态的内容资源的知识提取、标引和结构化整合,知识资源结构单一,知识资源的增值效果不佳。在知识链方面,智能化语境下出版业知识服务努力以主题词表和领域主体的方式进行知识体系与内容资源的链接,方便用户快速准确地导航、检索和解决问题,但这两种方式在出版业知识服务的应用仍不太常见。

真正的知识服务是以用户需求为出发点,形成知识链,根据用户的搜索从各种显性和隐性的资源中按照用户的需求有针对性地提炼知识或信息内容,快速构建知识网络,为用户提供知识内容或解决方案。但目前出版业的知识资源结构单一,尝试做知识服务的出版机构在某一个领域能够做到内容深耕,但打破出版机构之间的壁垒并形成知识链仍较为困难。由于面前的知识服务平台大多由出版机构自主开发,分散且没有共识机制,如果构建知识链,在性能、生态、安全、监管等方面都存在问题。

(二)知识服务产品盈利模式单一,价值开发不足

目前出版业的知识服务产品商业模式单一,当下出版业一般以广告、软文、知识服务收费等模式进行盈利,知识服务收费主要以数据库收费、App 会员收费、问答类收费等模式进行盈利,在短期有效,但是在流量红利消退后,整个知识服务行业将会重建格局,越来越多的用户为订阅付费、为内容付费,出版业应该善用自身资源为受众提供深度、优质的内容,解决内容产出和内容呈现平台收益不对等的问题,打造新的盈利模式。互联网数字经济的浪潮下,实现从硬知识付费向软知识变现是制约出版业向知识服务转型的瓶颈,出版业需对已有的知识服务产品进行更加深入的价值开发,重视用户的服务体验与多元化的个性需求,为知识服务产品的盈利模式开辟更多可能。

(三)用户的数据存在风险,安全保障不足

在大数据时代,用户的数据存在网络安全问题,无论是软件还是硬件都容易造成信息泄露,严重威胁个人的隐私和安全,利用数据发掘、关联、分析,能够从普通数据中提取大量具有统计意义的信息。出版知识服务集聚大量数据,涉及个人隐私、财务信息等敏感信息,但安全保障却不足。

(四)出版业知识服务模式单一,创新活力不足

出版业知识服务主要由出版机构或互联网公司作为主体,目前的知识服务模式主要是“用户搜索—资源提供”,但是想要做到真正的知识服务,必须要站在用户的角度,真正帮助用户解决他们所关注的问题。首先要确定谁是知识服务的核心用户,他们会在什么场景下需要知识支撑,如何使用这些知识,当前的知识服务能否满足其需求等,然后再整合出版资源组织知识内容。但是,目前出版业的知识服务对用户需求的精准分析不足,知识服务模式较为单一,创新活力不足。具体原因如下,一是知识服务时代的来临,并没有引起出版业足够的重视;二是由于体制机制的限制,没有足够的条件和动力紧随时代潮流;三是对于传统出版利益的依赖,不愿涉足知识服务领域。

(五)版权及所有权不够健全,司法解释不足

数字经济与实体经济结合,使物理世界映射到数字世界,中间可能存在着鸿沟。例如,我们可以把出版物做成链上NFT进行流转,用户购买了NFT出版物就拥有了该出版物的唯一所有权,但是在实际中仍存在版权及所有权等相关问题。数字世界与物理世界的融合,需要在现实规则和法律框架下进行系统化设计。在这个系统化设计中,政府、法院等部门不能缺位,这样才能保证权益在物理世界中得到保障。

四、智能化语境下出版业知识服务发展策略

(一)完善智能化语境下出版业知识链的资源积累

完善智能化语境下出版业知识链的资源积累可以从以下几个方面入手。第一,打造术语库,建立术语统一体系及术语映射关系,术语是各学科的专门用语,可以是词,也可以是词组,用来描述技术、科学、社会生活、艺术等领域中的事物、现象、特征、关系和过程,出版业在多年的发展进程中,积累了众多文本材料,可以建立梯形标准,从国家标准到行业标准,建立相关术语的映射关系。第二,基于知识内容的提取规则,形成规则库,规则库是知识和技术结合的直接数据支撑,规则库需要将知识进一步碎片化、规则化,将每个字段都进行量化,就必要字段设置触发条件,一旦被检测,则触发相应规则。第三,构建知识图谱,知识图谱是实体、实体属性及实体与实体之间的关系,出版业应基于已有的数据资源构建不同行业的应用型知识图谱,建设不同类型的知识库,各知识库的字段又能构建成更高阶段的知识图谱,便于知识库的层次化构建。

(二)推动智能化语境下出版业知识服务数字经济价值开发

从工业经济时代提供的图书出版商品到数字经济时代提供的全方位知识服务,均属于不同时期市场主导技术体系对行业价值增值模式进行重塑的产物。因此,数字经济时代下数字技术赋能出版业价值链重构是弥合技术变革与消费需求供需两端的有效选择。出版业数字经济的价值开发,仅依靠出版业是难以实现的,移动场景下的知识服务需要内容、技术、产业多方共同作用。大数据、云计算、人工智能等技术在知识服务中的作用不断增强,出版产业链上的终端应各自依托优势,打造面向行业应用场景的知识服务价值链,增加知识服务驱动内核,转变经营管理模式,开拓新的知识服务盈利点,为受众提供全方位的知识服务商业模式,创新出版业新生态。同时强化出版业产业链节点之间的有机链接,形成出版业知识服务网络生态,以保证数字经济的价值开发。

(三)从技术、监管等层面加强知识服务数据的安全性能

技术层面的数据安全应该从基础技术、核心关键技术进行研发攻关,如建立“云安全监控中心”,以云安全运维监控团队为核心,整合相关安全产品,管理平台资源,为用户提供实时、实用的网络安全解决方案。增强全民对数据安全的意识,提升公民的个人数据安全意识和数据使用规范,定期对计算机系统进行杀毒,提升对虚假信息、钓鱼网站的甄别能力,做好网络隔离控制等。

从监管方面,工业和信息化部已组织中国信息通信研究院、电信终端产业协会,以及多家终端厂商、互联网企业,有针对性地制定了《App用户权益保护测评规范》和《App 收集使用用户个人信息最小必要评估规范》,并组建了全国App技术检测平台,连续三年组织开展App侵害用户权益专项整治行动。相关部门应以此为经验借鉴,加强知识服务平台监管,建立知识服务监管体系,逐步形成技术监管与人工审核结合的机制,保护知识服务平台使用的用户数据的安全,使知识服务平台在合法依规的条件下为用户提供服务。