
会员
Python 3 爬虫、数据清洗与可视化实战(第2版)
教材教辅研究生/本科/专科教材4.3万字
更新时间:2020-08-06 15:42:22 最新章节:专业服务
书籍简介
本书是一本通过实战教初学者学习爬取数据、清洗和组织数据进行分析和可视化的Python读物。书中案例均经过实战检验,笔者在实践过程中深感采集数据、清洗和组织数据的重要性,作为一名数据行业的“码农”,数据就是沃土,没有数据,我们将无田可耕。本书共13章,包括6个核心主题,其一是Python基础入门,包括环境配置、基本操作、数据类型、语句和函数;其二是Python爬虫的构建,包括网页结构解析、爬虫流程设计、代码优化、爬虫效率优化、无线端的数据采集、容错处理、反防爬虫、表单交互和模拟页面点击;其三是Python数据库应用,包括MongoDB、MySQL在Python中的连接与应用;其四是数据清洗和组织,包括NumPy数组知识,以及pandas数据的读写、分组、变形,缺失值、异常值和重复值处理,时序数据处理和正则表达式的使用等;其五是综合应用实例,帮助读者贯穿爬虫、数据清洗与组织的过程;最后是数据可视化,包括matplotlib和pyecharts两个库的使用,涉及饼图、柱形图、线图、词云图等图形,帮助读者进入可视化的殿堂。本书以实战为主,适合Python初学者及高等院校相关专业的学生阅读,也适合Python培训机构作为实验教材。
上架时间:2020-07-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行
最新章节
零一
最新上架
- 会员本书以Hive为开发平台,主要介绍了如何使用HiveQL来查询和分析存储在Hadoop分布式文件系统上的大数据集合,具体内容包括Hive入门、Hive数据库及表操作、Hive元数据、Hive高级操作、Hive函数与Streaming、Hive视图与索引、Hive调优、Hive与HBase集成、数据迁移框架Sqoop等。本书介绍的每个任务都运用了大量案例,紧密结合实际应用,融入了含金量十足的开发经验教材教辅8万字