1.4 数据化运营应掌握的技能与工具

数据化运营需要业务人员通过数据化的工具、技术和方法,对运营过程中的各个环节进行科学的分析,为数据使用者提供专业、准确的行业数据解决方案,从而达到优化运营效果和效率、降低运营成本、提高效益的目的。“工欲善其事,必先利其器”,这里对数据化运营过程中的所需技能和常用工具进行介绍。

1.4.1 数据化运营的五种能力

作为一名合格的数据化运营人员,需要具备数据处理能力、数据分析能力、数据呈现能力、数据决策能力、计算机及数据分析信息技术五种能力,如图1.8所示。

图1.8 数据化运营人员知识体系架构图

(1)数据处理能力:数据化运营人员应该灵活掌握数据获取、数据存储与数据预处理的技能。其中,在数据获取方面,要求业务人员能够认知数据产生的时间、条件、格式、内容、长度、限制条件等,能针对性地实施和控制数据产生和采集的过程,加深对数据的理解程度;在数据存储方面,要求业务人员掌握数据存储基本理论,了解云端数据存储和本地数据存储,掌握MySQL、Oracle、SQL Server等数据存储系统,了解数据存储内部的工作机制和流程;在数据预处理方面,要求业务人员熟知数据处理规则,能实际解决数据分散、不清洁问题,具备与业务需求相结合的能力,保证动态和迭代更新的数据存储和处理达到及时、完整、有效、一致、准确。

(2)数据分析能力:数据化运营人员应该掌握数据挖掘和模型构建技术,明确业务场景、确定分析目标、构建分析体系、梳理核心指标,并通过评估标准衡量模型的效果,能够进行商业运行和模型解释。业务人员需要做的是,明确业务场景,对于不同的业务场景,分析体系随之不同;结合业务问题确定分析目标,列出核心指标,搜集整理所需要的数据。

(3)数据呈现能力:数据化运营人员应该掌握数据呈现工具,能够运用图表和图形将业务信息与决策方案清晰、明确地展现出来,使分析结果一目了然。图表设计是门大学问,如何选择图形,如何进行版式设计,颜色怎样搭配等,都需要掌握一定的设计原则。

(4)数据决策能力:数据化运营人员应该对分析结果进行业务应用和解读,将数据分析结果反馈到业务操作过程中。通过业务场景确定受众和了解受众的需求和习惯,能及时从相关的数据库中搜索挖掘出信息以满足特定时间、地点、场景的需求,最终基于业务驱动的数据化运营方法,为业务需求提供解决方案。

(5)计算机及数据分析信息技术:在商业智能时代,任何业务运营都将以底层数据为支撑,数据化运营人员需要掌握一定的计算机及数据分析信息技术,才能灵活地运用数据,相关工具既包括集搜客、SQL数据库、OpenRefine等数据处理工具,又包括Python、R语言、Excel等数据分析工具,还包括Tableau、Gephi、水晶易表、ECharts等数据可视化工具。

1.4.2 数据化运营的常见工具

正如上文所讲,数据化运营人员需要具备五种核心能力,其中的计算机及数据分析信息技术可以将数据灵活运用,解决业务问题,为企业提供解决方案。一款功能强大的数据化运营工具,将极大地提升数据化运营人员的工作效率。这里,我们针对数据处理、数据分析和数据可视化几种能力的实现,介绍一些常见的数据化运营工具。

1.数据处理工具

集搜客:集搜客网页数据抓取软件是一款专业的网页数据采集/信息挖掘处理软件,能够轻松抓取网页文字、图片、表格、超链接等多种网页元素,并得到规范化的数据。通过集搜客网页数据抓取软件,整个Web都可以成为用户的数据库,有效降低数据获取成本,得到全面、灵活的多维度行业数据,界面如图1.9所示。

图1.9 集搜客网页数据抓取软件界面

SQL数据库:SQL(Structured Query Language)是具有数据操纵和数据定义等多种功能的数据库语言,这种语言具有交互性特点,能为用户提供极大的便利,数据库管理系统可以充分利用SQL语言特点提高计算机应用系统的工作质量与效率。SQL不仅能独立应用于终端,还可以作为子语言为其他程序设计提供有效帮助,在这些程序中,SQL可与其他程序语言一起优化程序功能,进而为用户提供更多、更全面的信息。SQL Server数据库包括Microsoft SQL Server和Sybase SQL Server两个子数据库,该数据库能否正常运行直接关系着整个计算机系统的运行安全。SQL数据库软件界面如图1.10所示。

图1.10 SQL数据库软件界面

OpenRefine:OpenRefine软件前身是谷歌公司开发的数据清洗工具GoogleRefine,随后于2012年开放源代码,改为现在的OpenRefine。该软件是一款基于计算机浏览器的数据清洗软件,在数据清洗、数据探索及数据转换方面非常有效,可以在计算机中直接运行,这样可以避免上传指定信息到外部服务器的问题。OpenRefine软件类似于传统Excel处理软件,但是工作方式更像数据库,以列和字段的方式工作,而不以单元格的方式工作。OpenRefine软件界面如图1.11所示。

图1.11 OpenRefine软件界面

2.数据分析工具

Microsoft Excel:这款大家熟悉的电子表格软件已经被广泛使用20多年了,以至于现在有很多数据只能以Microsoft Excel表格的形式获取到。在Microsoft Excel中,让某几列高亮显示、做几张图表都很简单,用户很容易对数据有大致的了解,然而Microsoft Excel局限在它一次所能处理的数据量上,因此用Microsoft Excel来进行全面的数据分析或制作公开发布的图表会有难度。Microsoft Excel软件界面如图1.12所示,在Microsoft Excel中内置图表工具,利用这个工具可以方便快捷地插入已有的图表。

图1.12 Microsoft Excel软件界面

Python:Python由荷兰数学和计算机科学研究学会的Guido van Rossum于1990年代初设计,作为ABC语言的替代品。Python提供了高效的高级数据结构,还支持简单有效的面向对象编程。Python简洁的语法、动态的数据类型,以及解释型语言的本质,使它成为多数平台上写脚本和快速开发应用的编程语言。随着版本的不断更新和语言新功能的添加,Python逐渐被用于独立的、大型项目的开发。Python解释器易于扩展,可以使用C或C++(或者其他可以通过C调用的语言)扩展新的功能和数据类型。Python丰富的标准库提供了适用于各个主要系统平台的源代码或机器代码。Python软件界面如图1.13所示。

图1.13 Python软件界面

R语言:R语言是用于统计分析、绘图的语言和操作环境。R语言属于GNU系统的一个自由、免费、源代码开放的软件,是一个用于统计计算和统计制图的优秀工具。R语言是一套由数据操作、计算和图形展示功能整合而成的套件,包括有效的数据存储和处理功能、一套完整的数组(特别是矩阵)计算操作符,拥有完整体系的数据分析工具,可以为数据分析和显示提供强大的图形功能,是一套(源自S语言)完善、简单、有效的编程语言(包括条件、循环、自定义函数、输入输出功能)。R语言软件界面如图1.14所示。

图1.14 R语言软件界面

3.数据可视化工具

Tableau:Tableau致力于帮助人们查看并理解数据。Tableau可以帮助任何人快速分析、可视化并分享信息,如图1.15所示。Tableau的程序很容易上手,各公司可以用它将大量数据拖放到“画布”上,转眼间就能创建好各种图表。这款软件的理念是,界面上的数据越容易操控,公司对自己在所在业务领域里的所作所为到底是正确的还是错误的,就能了解得越透彻。

图1.15 Tableau软件界面

Gephi:Gephi是一款开源免费跨平台基于JVM的复杂网络分析软件,主要用于各种网络和复杂系统,是动态和分层图的交互可视化与探测开源工具,具有探索性数据分析、链接分析、社交网络分析、生物网络分析等功能。Gephi软件界面如图1.16所示,其窗体中的图形是一个典型的由节点和连线生成的Gephi图形。

水晶易表:水晶易表(Crystal Reports)是一款商务智能(BI)软件,主要用于设计及产生报表。水晶易表是专业的报表系统,具有强大的报表功能,包括使用各种资料来源制作报表、功能强大的设计与格式设定能力、具有弹性的分析能力、快速的报表处理能力、灵活的报表传送作业能力、可扩充的Web报表制作能力,可以将精巧报表的制作能力结合到用户的Windows及Web应用程序上,让用户享用前所未有的弹性与操控能力。水晶易表软件界面如图1.17所示。

图1.16 Gephi软件界面

图1.17 水晶易表软件界面

ECharts:ECharts是国内百度公司开发的JavaScript的图表库,兼容性好、使用简单,提供了大量直观、生动、可交互的数据可视化图表,其底层基于ZRender创建了坐标系、图例、提示、工具箱等基础组件,并在此基础上构建出了折线图(区域图)、柱状图(条状图)、散点图(气泡图)、K线图、饼图(环形图)、地理坐标/地图、热力图等,同时支持任意维度的堆积和多图表混合展现。ECharts软件界面如图1.18所示。

图1.18 ECharts软件界面