封面
版权信息
作者简介
内容提要
前言
第一部分 大数据基础篇
第1章 大数据思维
1.1 什么是大数据
1.2 从IT时代到大数据时代
1.3 大数据的产生与作用
1.4 大数据时代的新理念
1.5 总结
习题
第2章 大数据技术概述
2.1 大数据处理的基本流程
2.2 大数据关键技术
2.3 总结
习题
第3章 大数据采集
3.1 大数据采集概述
3.2 系统日志采集方法
3.3 网络数据采集方法
3.4 总结
习题
第4章 大数据预处理
4.1 大数据预处理概述
4.2 数据清洗
4.3 数据集成
4.4 数据转换
4.5 数据消减
4.6 离散化和概念层次树
4.7 ETL工具Kettle
4.8 总结
习题
第5章 大数据处理系统
5.1 大数据技术概述
5.2 Google大数据处理系统
5.3 Hadoop大数据处理系统
5.4 总结
习题
第二部分 大数据存储篇
第6章 大数据文件系统HDFS
6.1 HDFS简介
6.2 HDFS基本原理
6.3 HDFS系统实现
6.4 HDFS数据访问机制
6.5 HDFS操作
6.6 总结
习题
第7章 NoSQL数据库HBase
7.1 NoSQL概述
7.2 HBase概述
7.3 HBase数据模型
7.4 HBase命令行
7.5 HBase的运行机制
7.6 HBase的编程
7.7 总结
习题
第三部分 大数据处理篇
第8章 大数据批处理Hadoop MapReduce
8.1 MapReduce概述
8.2 Hadoop MapReduce架构
8.3 Hadoop MapReduce的工作流程
8.4 实例分析:单词计数
8.5 Hadoop MapReduce 的工作机制
8.6 Hadoop MapReduce编程实战
8.7 总结
习题
第9章 大数据快速处理Spark
9.1 Spark简介
9.2 RDD概念
9.3 Spark运行架构和机制
9.4 Spark生态系统
9.5 Spark编程实践
9.6 总结
习题
第10章 大数据实时流计算Spark Streaming
10.1 Spark Streaming简介
10.2 Spark Streaming的系统架构
10.3 编程模型
10.4 DStream的操作
10.5 编程实战
10.6 总结
习题
第四部分 大数据挖掘篇
第11章 大数据挖掘
11.1 数据挖掘概述
11.2 Spark MLlib简介
11.3 分类和预测
11.4 聚类分析
11.5 关联分析
11.6 总结
习题
第五部分 大数据应用篇
第12章 大数据应用
12.1 大数据功能应用
12.2 大数据行业应用
12.3 总结
习题
更新时间:2020-01-10 16:24:31