内容提要

本书系统、全面地介绍了大数据技术的基础知识,期望读者通过对本书的学习和实践了解大数据技术的概貌,掌握Hadoop生态圈大数据技术中最为基础和关键的知识。本书主要内容包括大数据概述、大数据软件基础、大数据存储技术、MapReduce分布式编程、数据采集与预处理、数据仓库与联机分析处理、大数据分析与挖掘技术、Spark分布式内存计算框架、数据可视化技术、大数据安全。

本书可作为数据科学与大数据、软件工程、计算机科学与技术等专业的大数据概论课程的教材,也可供大数据工程技术人员阅读使用。