1 入门篇

第1章 认识Power BI:强大的自助商业智能分析工具

拥抱Power BI,从这里开始……

在人人都将成为数据分析师的大背景下,本章介绍了为什么要学习Power BI、Power BI的主要框架、操作界面以及Power BI数据处理的基本步骤,并通过一个示例,带你体验Power BI如何分分钟制作出一个动态可视化报告。

1.1 让数据技能成为你的竞争力

如今,我们生活在一个数字化的世界中,生活中有各种智能设备,我们可以选择智能出行、在线办公,可以在网上购买商品和服务,甚至在睡觉时都有设备记录身体的各项数据。数据正改变我们的工作、生活和娱乐方式。

我们的各种行为每时每刻都在产生大量数据。我们上网的浏览记录、交易记录,行走数据、衣食住行等各种行为数据,可以帮助我们彼此建立更多和更深的联系,并让我们更快,更轻松地获取产品和服务。伴随而来的是数据的爆炸式增长。

当前,不仅是互联网公司在利用数据做各种算法和推荐,以增强客户体验,提升业绩,传统行业同样也在寻求数据化转型。各行各业都在想方设法利用数据来获取客户、开拓新市场、提高工作效率、创造新的竞争优势,以及更科学高效地制定决策。各种组织都在想办法将数据转化为更好看的各项业务指标,以保持竞争力,从而为组织带来价值,“数据是组织中重要的资产”已不仅仅是口号。

尽管每个组织都认识到了数据的重要性,知道数据中隐藏着巨大的价值,并且对从这些数据中获取新见解、提高运营效率和促进业务增长寄予厚望,但将数据转化为价值并非易事。更常见的情形是,我们手中拥有海量数据,但不能充分利用。

从海量数据到实现价值之间,还有个重要的因素:人。

数据没法变现或没法产生业务价值就无法发挥作用,大部分组织,尤其是非互联网公司,很少或者没有专门的数据分析岗位,IT部门的职责也主要在于系统管理和维护。随着数据范围的扩大和维度的不断增加,各种岗位都面临着海量的数据,不仅仅是运营、财务,现在连人力、行政、审计都必须处理海量并且依然在大幅增长的各类数据。让组织的各个业务流程人员拥有数据分析能力,从与其岗位相关的数据中提取自己的见解,变得更加必要和迫切。

组织的痛点在哪里,我们的机会和价值就在哪里!

组织中缺乏数据专长的人才,我们可以先人一步,将数据技能变成自己的优势。我们应该主动融入业务,从自己的角色中识别数据问题,并将数据成果转化为业务问题的解决方案,发现数据的价值和力量。

无论是已身处社会的职场人士,还是即将走出校园的大学生,早一点掌握数据分析技能,会增加自身的竞争力,这也意味着更多的工作机会以及获得更高的收入。

未来,人人都将是数据分析师,提前用数据技能武装自己,让该技能成为自己的基本素养,它也会支撑你走得更远、更稳固。

1.2 为什么是Power BI

虽然数据分析技能很重要,但作为非数据分析专业人士,没有受过专业的训练,没有时间和精力再学习复杂的编程,面对海量的数据,我们可能有想法,想探索、发现其中蕴含的价值,但现实情况却让人无所适从,心有余而力不足。

那么该如何迈出这一步呢?或者更具体一些,应该选什么工具呢?

首先,这个工具应该足够简单、易于使用,让数据能够讲述自己的故事。虽然Excel作为大众化的分析工具,非常容易使用,也能进行日常的数据分析工作,但在海量数据、多种数据源以及实时快速的分析需求面前,显得捉襟见肘。

其次,它还要功能强大、足够灵活,不依赖技术人员就可以让你轻松处理海量数据,并实时快速地发现数据中蕴含的信息,随时随地回答你的业务问题。

有没有这样的工具呢?当然有,它就是自助商业智能分析工具。自助表示人人可用,几乎没有门槛。由于它的出现,数据分析正在发生革命性的变化,这种改变体现在效率、性能和对数据量的驾驭上。

本书介绍的微软Power BI就是这样的工具——强大的自助商业智能分析工具。

Power BI可以快速将数据进行分析和呈现,它支持数百种数据源,可以建立模型,创建美观的交互报表。

你也许知道Power BI炫酷的可视化效果,但它的可视化不仅仅是指传统的图表,它的可视化本身就是分析的一部分,是在动态交互式可视化界面的支持下进行的分析推理过程,这个过程远比传统图表的意义要大得多。

当然,市场中与Power BI类似的也有其他工具,那么为什么要学习和使用Power BI呢?不妨来看看世界上最顶级的商业智能(BI)工具的排名情况。这里介绍的排名是由国际著名的第三方机构Gartner发布的BI平台魔力象限,微软Power BI近几年一直处于领导者位置,图1-2-1是2020年魔力象限。

魔力象限中标识的是公司名称,全球范围内上榜的有20余家公司,在魔力象限上我们可以看到很多熟悉的公司名称,右上角是领导者象限,而微软所处的是最高领导者位置,微软的BI产品就是Power BI。

既然要选一个工具,为什么不用最高的呢?

其实Power BI不仅是一个BI软件、一个商业数据分析工具,而是一整套解决方案,它赋能每一个人,从数据准备,数据建模,再到最后的可视化,均有强大的模块支持。

与其他自助工具相比,Power BI还有以下这些明显的优势。

上手更快:Power BI简洁的外观与大家熟悉的微软Office界面类似,从而使用户能快速上手,提高工作效率。

图1-2-1 Gartner 2020年BI平台魔力象限

与微软其他产品无缝协作:Power BI与微软众多其他工具无缝集成,可以使用现有解决方案无缝协作。比如将Power BI与Power Apps和Power Automate相结合,可轻松构建业务应用程序并使工作流自动化,Power BI与Azure配合使用,可以跨PB级数据进行快速、交互式分析,满足苛刻的企业级需求。

成本低:相对于其他BI工具,成本低是Power BI的一大优势,它最核心的Power BI Desktop完全免费,这意味着,个人可以完全免费地学习和使用,中小企业也可以低成本甚至零成本地应用Power BI。

截至2020年初,Power BI支持43种语言,并已在全球40个数据中心中部署。全世界有超过二十万客户使用Power BI,每个月将40PB的数据带入Power BI。在不到五年的时间里,Power BI社区的成员数已迅速发展为超过一百万。如今,大部分《财富》世界500强公司使用Power BI。

从这些数据里,你能得到什么信息呢?

它们一方面说明Power BI在全球的普及度已相当广泛,另一方面,我们也应该看到,顶级公司的员工都已在学习和运用这个强大的工具,加速自己的知识积累和技能更新,那么我们是不是应该相信顶级公司的视野和眼光,追随他们的步伐呢?

不管我们是否做好了准备,我们的很多同龄人和同事们都在武装自己,与其最后迫不得已去学习,不如主动拥抱Power BI,驾驭海量数据,增强自己的竞争力。

1.3 Power BI主要架构

本节开始正式介绍Power BI。在学习之前,我们先来认识Power BI的主要知识架构,分清楚Power BI的一些概念。

Power BI是微软推出的自助商业智能分析工具,Power BI不仅仅是计算机中安装的一个软件,而是一系列的软件服务和应用,这些软件服务和应用协同工作,不管数据是简单的Excel工作簿,还是基于云的数据仓库和本地混合数据仓库的集合,Power BI都可以轻松连接到数据源,将多种的数据源转化为数据模型,形成可交互的可视化报告,并与所需的人共享。

图1-3-1很形象地展示了Power BI从各种数据源到可视化的过程。

图1-3-1 Power BI从数据源到可视化

Power BI主要由Power BI Desktop、Power BI服务以及在移动终端上也可用的Power BI移动版组成,如图1-3-2所示。

图1-3-2 Power BI主要架构

1.Power BI Desktop

Power BI Desktop是Power BI的桌面应用程序,也称为桌面版,专为分析人员设计。它结合了一流的交互式可视化效果和业界领先的内置数据查询和建模功能,可以创建报告并将报告发布到Power BI服务中。

我们平时学习和使用Power BI,主要使用的是Power BI Desktop,数据分析的大部分环节主要在桌面版完成,而且Power BI Desktop完全免费。

本书的主要内容也是在介绍和使用Power BI Desktop的相关模块,其中数据准备是在Power Query编辑器中进行。Power Query在Excel 2010之后的版本中同样可以使用,本书第2章会介绍它的用法。

数据建模和DAX,是Power BI数据分析的灵魂,本书第3章会重点介绍。

数据分析的结果一般都会以可视化的方式来呈现,在Power BI Desktop中有大量的图表类型和丰富的交互方式,本书第4章和第5章会介绍可视化的部分。

数据准备、数据分析到数据可视化,整个流程在Power BI Desktop中一气呵成。

使用Power BI Desktop制作的报告可以在本地保存成扩展名为.pbix的文件,还可以上传到Power BI服务中。

2.Power BI服务

Power BI服务(Power BI Service)是一个在线服务。Power BI Desktop中制作的报表发布后,就会显示在Power BI服务中,用户可以在浏览器中查看、分享、发布Power BI报表,也可以设置数据刷新计划、管理数据的安全性等。

3.Power BI移动版

需要在移动终端查看跟踪数据时,可以使用适用于iOS、Android的Power BI移动版。它是非常友好的Power BI移动应用程序,可以让每一个人获得触手可及的交互式数据报表。

Power BI中的一个常见工作流开始于Power BI Desktop,数据分析人员在其中创建一个报表。然后,该报表将发布到Power BI服务并在最后进行共享,Power BI移动版的用户可以随时随地查看该报表。

1.4 初识Power BI

本节介绍如何下载安装Power BI Desktop,介绍Power BI Desktop的界面和操作的一般步骤。现在就来迈出我们学习Power BI的第一步吧。

1.如何安装Power BI Desktop

安装Power BI Desktop有如下两种方式。

(1)如果计算机操作系统为Windows 10,进入Microsoft Store,搜索Power BI Desktop,单击安装即可,如图1-4-1所示。

图1-4-1 从Microsoft Store中安装Power BI Desktop

通过Microsoft Store安装的好处是,当Power BI Desktop更新时,可以后台自动更新且无须重新下载安装。

(2)如果计算机操作系统不是Windows 10,那么登录微软Power BI官网,在产品中选择Power BI Desktop,单击下载即可,如图1-4-2所示。

图1-4-2 官网下载Power BI Desktop

根据计算机的操作系统选择32位或者64位的安装包。

这种安装方式不能自动更新,当Power BI Desktop更新时,必须按上述方式重新下载安装。

Power BI的一大优势是更新迭代非常迅速,几乎每个月都有更新,所以强烈推荐第一种安装方式。

安装完成,启动后会提示注册,可以用企业邮箱或者学校邮箱注册,暂时不想注册可以直接跳过,大部分功能不注册同样可以使用。

2.认识Power BI Desktop界面

Power BI Desktop界面如图1-4-3所示。

图1-4-3 Power BI Desktop界面

数据处理的第一步就是获取外部数据,如图1-4-4所示。

图1-4-4 数据获取

常用的数据来源如Excel、SQL Server、文本/CSV、Web出现在“最常见”里面,如果是其他来源,单击“更多”,目前能见到的大多数数据格式都可以直接导入。

以一个Excel文件为例,导入之后,进入内嵌的Power Query编辑器,如图1-4-5所示。

图1-4-5 Power Query编辑器

这是Power BI的一个主要模块,数据整理都在这里完成,第2章会专门介绍。

整理后的数据上载到Power BI数据模型中,可以在数据视图中查看这些数据,如图1-4-6所示。

不要被数据建模这个词吓到了,其实就是表格之间建立关联,这是下一步数据可视化的基础,可以在模型视图中查看数据模型,如图1-4-7所示。

图1-4-6 数据视图

图1-4-7 模型视图

然后就可以进行可视化工作了。Power BI主界面显示的是系统默认自带的一些图表,都是平时最常见的图表类型。另外推荐Power BI的一大理由就是还可以加载更多的自定义可视化包,包含各种酷炫的图表,如图1-4-8所示。

图1-4-8 Power BI自定义视觉对象(部分)

目前已经有200多种自定义图表可供免费下载使用,而且仍在不断增加中。

通过上面这些介绍,读者应该对Power BI的界面基本熟悉了,下面利用一个示例来介绍Power BI如何将数据快速转化为动态可视化报告。

1.5 体验Power BI:快速从原始数据到动态报告

本节让我们尝试一下,使用Power BI快速将原始数据表变成一个精美的、可交互的可视化报告,如图1-5-1所示。

图1-5-1 从Excel数据到Power BI报表

源数据为1999年到2018年全国部分省区市的生产总值数据,为Excel格式,如图1-5-2所示。

图1-5-2 Excel源数据

下面来体验一下Power BI的操作流程。

1.数据导入

打开Power BI Desktop,在“数据”组中单击“Excel”,如图1-5-3所示。

图1-5-3 获取Excel格式数据

然后从本地路径中选择Excel文件,在弹出的“导航器”窗口选择“转换数据”,如图1-5-4所示。

图1-5-4 转换数据

这样数据就导入到Power BI的Power Query中了,如图1-5-5所示。

图1-5-5 导入到Power Query中的数据

为了便于分析,接下来需要对数据进行整理。

2.数据清洗

Power Query是Power BI的数据清洗模块,可以帮用户快速整理成需要的数据,第2章会重点介绍。

下面简单看一下这个示例数据的清洗步骤。

(1)将第一行用作标题。

在Power Query中第一行就是数据行,如果标题在第一行,可以单击功能栏上的“将第一行用作标题”,如图1-5-6所示。

图1-5-6 将第一行用作标题

(2)二维表转一维表。

源数据是一个二维表,为了便于分析,需要转为一维表。在Power Query中进行这样的转换很简单,选中“地区”列,单击“逆透视其他列”,这样就变成了一维表,如图1-5-7所示。

图1-5-7 二维表转一维表

(3)完成整理。

修改标题,并将“年度”字段中的“年”去掉,数据整理完成,然后可以在字段区看到这个表的3个字段,如图1-5-8所示。

图1-5-8 该表的3个字段

3.制作可视化报告

在Power BI中,只需要选择一个图表类型,然后拖曳字段到图表中,就可以生成一个可视化图表。

(1)制作生产总值年度趋势图。

选择柱形图,然后将“年度”字段放到【轴】中,“生产总值”字段放到【值】中,柱形图就做好了,如图1-5-9所示。

图1-5-9 年度趋势图

(2)同样的方式再生成三个图表。

卡片图:用于展示生产总值的数据。

条形图:用于展示各省份的生产总值排名。

树形图:用于直观展示生产总值的分布情况。

主要的图表制作完成,如图1-5-10所示。

图1-5-10 Power BI图表

(3)添加年度切片器。

上面这几个图表显示的地区数据是所有年度的生产总值之和,如果想查看每个年度的数据,添加一个切片器就可以了,如图1-5-11所示。

图1-5-11 添加切片器

提示:关于切片器,在“格式”→“常规”→“方向”中,设置为“水平”,就可以显示图1-5-11的样式。

然后在上方添加一个文本框作为报告标题,Power BI可视化报告就制作完成了。

是不是很快?如果操作熟练,几分钟就可以生成这样一个可视化图表。表面看这个报表也没有什么特别的,但Power BI报表的特点是所有的图表都可以动态交互。

单击年度切片器,其他图表会动态切换为该年度的数据;如果单击条形图的某个省份,其他图表也显示为该省份的数据,如单击条形图的“江苏省”,切片器选为2016,效果如图1-5-12所示。

图1-5-12 江苏省2016年数据

单击树状图中的某个省份,比如单击“广东省”,其他图表同样会动态响应,效果如图1-5-13所示。

图1-5-13 广东省2016年数据

以上只是基本的交互形式,在Power BI中还有更丰富更高级的交互方式,在第5章会重点介绍。

提示:关于上面介绍的交互,可能读者单击某个数据,其他图表变成只有一个数据了,这涉及编辑交互的技巧,具体操作可参考本书5.1节的介绍。

以上的报表布局是适应计算机端的,Power BI还支持移动布局,以满足移动端查看报表的需要。单击“视图”→“移动布局”,前面制作好的各个图表已存放在右侧的可视化栏,分别将其拖到画布上即可,如图1-5-14所示。

图1-5-14 移动布局

将此报表发布以后,就可以在Power BI App上按照移动布局来查看了。

4.发布分享

除了在Power BI Desktop中查看这张报表,还可以发布报表,其他人可以随时随地查看。如果读者已经注册账号,登录以后,单击“发布”按钮,如图1-5-15所示。

图1-5-15 发布报表

在浏览器中登录Power BI服务,即可在线查看,并且在Power BI App中同样可以查看该报表的移动布局,如图1-5-16所示。

图1-5-16 在多种设备上随时随地查看报表

还可以在Power BI服务中,单击“发布到Web”,如图1-5-17所示。

图1-5-17 发布到Web

这样就会生成报表网址。

把这个网址发给相关人员,他们就可以随时随地通过浏览器查看这个报表了。并且这个报表不是静态的,仍然是可以单击交互的。

提醒:内部敏感数据请不要随意发布到Web。

看到这里,感觉Power BI怎么样,是不是有种相见恨晚的感觉呢?这个示例只是简单介绍了Power BI的最基本功能,更强大的数据分析和可视化技巧,后面的章节会逐一介绍。

1.6 本章练习

下载Power BI Desktop,并用本章最后一节的示例数据模仿制作可视化报表,熟悉Power BI的界面,体验Power BI的基本功能。