搜索
您的当前位置:首页正文

大数据技术赋能数字出版产业发展

来源:独旅网
2019.1新闻传播NewsDissemination编辑出版大数据技术赋能数字出版产业发展

张海迪

(上海理工大学出版印刷与艺术设计学院上海

200082)

【摘要】最近几年,数字出版业保持着快速发展态势,在大数据时代背景下,研究大数据在数字出版中的运用有着相当重要的意义。本文从大数据的概念入手,探讨了大数据驱动数字出版产业思维上的转换,综合分析了数字出版+大数据的应用新模式。

【关键词】大数据;数字;出版;产业;应用模式

年来,我国数字出版业发展势头良好,产业规模不断扩大,收入规模持续上升,据《2017-2018中国

的泛互联网数据、大量的IoT设备产生的机器数据,以及科研、学术等行业产生的专业数据,大数据已经成为一种自然资源,它不被利用就是成本。由此,对大数据可以简单总结为四个特性:价值高但密度低、速度快、数据量巨大、包含各种各样的数据。在海量数据中,仅有20%左右属于结构化数据,主要源于企业ERP、财务系统等数据库,这些数据相对容易处理,80%的数据属于非结构化的数据,在社交平台、IoT设备、搜索引擎、电商、物流等领域产生,这些数据所占的比例还将进一步加大,因此挖掘和多维度分析数据对于各行各业都有重大的价值,否则数据量再大也是数据废气。

二、大数据驱动数字出版思维转换

大数据时代背景下应积极转变传统的出版思维方式,用新的数据思维模式指导产业发展,才能为我国出版业带来新的生机与活力。大数据产品一定是业务、数据和技术三者之间的协同互通,只有三者之间相互理解、相互熟悉、相互帮助,才能真正开发出有竞争力的大数据产品。[4]

(一)传统的出版思维向数据思维转换

数字出版产业在新的技术背景下应进行思维方式上的转换。传统出版社的核心思维一直是围绕产品进行的,而产品的核心是编辑,编辑的思维方式通常决定出版社的大体方向,它是一种产品-市场-用户的模式。出版机构极少运用数据进行价值增值,大多数只卖图书不研究数据,只卖产品不提供服务,单一的价值增值模式使出版产业活力下降,所以传统的出版单位或新闻媒体很难解决大众传播与个性化需求之间的高效匹配问题。在大数据时代,通过对数据的挖掘和分析,可以有针对性地为每一个用户量身定制符合每个人兴趣的专属报纸或图书,是真正的用户至上时代,是一种用户-产品-市场的运作模式。

(二)因果关系转换为相关关系

数字出版产业年度报告》显示,2017年国内数字出版产业整体收入规模突破7000亿元,达到7071.93亿元,较2016年增长23.6%[1],可见数字出版产业规模、效益都在IoT、人工智能等新技术的发展使全世界数据量呈指数级稳步提升,互联网技术的发展为我国出版业尤其数字出版业注入了新的活力和动力。移动互联网、社交媒体、增长,大数据概念由此产生,我们用它来描述在各种场景下、不同设备间所产生的人力无法处理的海量数据信息。我国前瞻性地提出并实施“国家大数据战略,建设数字中国”策略,作为文化创意产业的数字出版业必然也要融入到国家大数据战略之中,数字出版业应积极拥抱大数据技术进行发展思维和发展模式的转换,提高我国数字出版产业产品和服务质量。

一、关于大数据的概述(一)大数据的定义

大数据是无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。[2]2012年12月舍恩伯格所著的《大数据时代》正式问世,开启了大数据研究暴正在变革我们的生活、工作和思维方式,大数据开启了重大的时代转型,人们迎来了大数据时代思维的变革、商业的变革和管理的变革。[3]

(二)大数据的特性

随着人类对网络的应用,数据规模急剧增加,数据量的存储已经由GB、TB到PB,在某些领域达到了EB和ZB级别,吉姆-格雷发现的新摩尔定律,即人类有史以来的数据总量,每过18个月就会翻一番,再次表明全球数据量增长速度之快。这些规模庞大的数据来源于大人群产生的新篇章,他在书中前瞻性地指出,大数据带来的信息风

【作者简介】张海迪,上海理工大学出版印刷与艺术设计学院在读研究生。

572019.1新闻传播NewsDissemination舍恩伯格在《大数据时代》中明确提出,大数据时代

最大的转变就是放弃对因果关系的渴求,取而代之关注相关关系,也就是只要知道“是什么”,而不需要知道“为什么”。无论是建立在大数据基础上的数据新闻、机器写稿,还是拥有聚合计算能力的“今日头条”“一点资讯”,这些都与传统出版模式有着根本性的差异,这些出版模式的背后都是基于数据挖掘与计算分析的,从根本上颠覆了多年的线性出版流程和传播模式,更多地从数据中心获得对用户需求和市场趋势相关关系的洞察,并高效完成即时化、智能化、个性化的内容生产、分发、传播和消费[5],如“亚马逊”“天猫”“京东”等网站运用技术抓取用户的数据并进行深入分析,为每个用户个性化地推荐图书。大数据时代,我们不需要过多地弄清楚一些出版现象的原因,但这并不影响我们得出某些结论,就像在分析数据进行推荐时发现买了这本书的人,也同样购买另一本风格完全不同的书,但数据确实显示两者之间有很高的相关性,就像是沃尔玛超市中将啤酒和尿布两件看似毫无相关的商品放在一个购物篮中一样,相关性在大数据中是极其重要的。

(三)向科学研究的第四范式转换

面对大数据浪潮,图灵奖得主吉姆·格雷提出数据密集型科学研究的第四范式,是继实验、理论推演、计算机仿真后的第四种研究范式。[6]相对于以前做出假设提出可能理论,然后收集数据、通过计算来验证的研究,基于大数据的第四范式是通过已有的海量已知数据计算出之前未知的理论,是一种数据驱动的模式,数据仓储技术也应顺应这一技术发展趋势,因为在数据推动模式下必然要获取大量的研究数据,包括学术著作、期刊论文、网络文献等。传统的学术出版,不论是出版商垄断资源阻碍开放获取,还是数据库技术的不完善,都不能满足用户在大数据背景下的需求,爱思唯尔作为全球著名的出版商和服务提供商,推出了数据仓储平台MendeleyData,它可以允许不同学科背景下的研究者上传、发布和管理他们的研究成果。与其他出版商的数据仓储产品不同,MendeleyData上的数据遵循公平原则,即易检索、可获取、互操作、可再用。爱思唯尔这一平台符合科学的研究范式,是在新的研究模式下做出的积极探索。

三、大数据+数字出版的产业应用模式(一)精准选题策划和营销

目前数字出版物的选题和策划主要是编辑凭借自己的从业经验和对一些领域的关注来进行,具有很强的主观性,往往缺乏对目标读者群体的分析,存在对当下内容热点判定不准确等问题。在大数据时代背景下,应该通过对主流的社交媒体平台、搜索平台和电商平台的用户行为数据的挖掘与分析,挑选出热点议题作为备选的选题,通过分析读者的性别、年龄、职业等信息确定目标读者群体,在数字产品生产出之后通过社交平台或电商平台进行精准的广告和内容推送。对于出版方来说,读者的阅读兴趣、

58编辑出版文化水平、购买能力都能通过数据分析出来,在出版前可以对是否出版、发行范围、发行量进行决策,在发行后可以实时监测出版物的读者评价等反馈信息,通过用户反馈对数字内容进行优化和改进,这样既能增加用户黏性,又能在这一过程中获得大量的数据信息。

(二)不同场景下的个性化服务

要服务特性,阅读内容碎片化和消费时间碎片化是一种不Web3.0时代是一个场景细分的时代,以个性化为主

可避免的发展趋势,通过场景适配并基于用户需求为其提供个性化的服务。数字出版业场景主要是信息的适配和精准的服务,信息适配主要在线上平台,也就是高效精准地提供知识信息,服务适配集中在线下,主要是生活周边服务,可以称之为数字出版的O2O。从线上看,数字出版机构可以深入分析用户的行为画像,从即有的内容中挑选出个性化的数字出版内容推荐给用户,满足用户不同场景下的需求,还可以依靠大数据预测市场需求,按需出版。从线下看,通过移动设备、传感器、定位系统等技术可确定用户所在场景及可能的需求,针对性地对用户形成一对一的需求实时匹配。

(三)用户体验和产品效果评估

用户体验是以用户为核心的,同时也是产品价值的体现,大数据时代更应该强调用户体验的重要性。为了让读者获得更好的用户体验,可以在收费电子书中提供部分章节内容免费试读,读者根据自己的阅读体验和兴趣爱好决定是否购买此电子书,这样出版机构不仅能够知道电子书的阅读情况和读者的购买频次,还能根据用户大数据信息了解用户试读时间、试读量、哪一章的停留时间最长,最后是否购买了电子书等各种有价值的用户体验信息,并且根据这些用户行为数据构建出读者画像,通过读者画像的反馈对数字内容进行评估和改进,不断提升内容价值。

结语

大数据技术在数字出版领域将起到越来越重要的作用,数据挖掘和分析将对出版企业至关重要,企业应充分认识到大数据所带来的巨大商业价值,运用数据资产为数字出版业服务。随着大数据、人工智能等新技术的不断发展,更加智慧的出版方式将会来临。■参考文献:

年度报告[1]中国新闻出版研究院[R].北京:中国新闻出版研究院.2017-2018,2018.

中国数字出版产业[2]http://en.wikipedia.org/wiki/Big_data.

大变革[3]迈尔[M].浙江·舍恩伯格:浙江人民出版社.大数据时代:生活、工作与思维的,2012:67-88.报业[4],2016郭全中(15).:媒体应用大数据,先解决三大难题48.

[J].中国革—[5]—以数字出版为例狄野.大数据语境下数字内容产业发展的思维变[J].出版发行研究,2017(2):40.中国社会科学出版社[6]张弛.大数据时代中国出版产业链的重构,2016:39-50.

[M].北京:

因篇幅问题不能全部显示,请点此查看更多更全内容

Top