
Python网络爬虫:从入门到精通
教材教辅研究生/本科/专科教材11.2万字
更新时间:2023-10-25 19:34:57 最新章节:参考文献
书籍简介
本书主要介绍如何使用Python语言进行网络爬虫程序的开发,从Python语言的基本特性入手,详细介绍Python网络爬虫开发的多个方面,涉及HTTP、HTML、正则表达式、JavaScript、自然语言处理、数据处理与科学计算等不同领域的内容。全书共12章,包括基础篇、进阶篇、提高篇和实战篇4个部分。基础篇包括第1、2、3章,分别为Python基础及网络爬虫、静态网页抓取、数据存储。进阶篇包括第4、5、6章,分别为JavaScript与动态内容、模拟登录与验证码、爬虫数据的分析与处理。提高篇包括第7、8、9章,分别为爬虫的灵活性和多样性、Selenium模拟浏览器与网站测试、爬虫框架Scrapy与反爬虫。实战篇提供了3个实战项目供读者学习参考。本书内容覆盖网络数据抓取与爬虫编程中的主要知识和前沿技术。同时,本书在重视理论基础的前提下,从实用性和丰富度出发,结合实例演示爬虫程序编写的核心流程,将理论与实践结合,力求提高读者的网络爬虫实操技能。本书可作为高等院校数据科学、统计学、计算机科学、软件工程等相关专业课程的教材,也可作为Python语言初学者、网络爬虫技术爱好者的参考书。
品牌:人邮图书
上架时间:2023-07-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
同类热门书
最新上架
- 会员人工智能技术在新媒体领域中的应用,不仅极大地提高了新媒体的生产效率,而且让新媒体传播更加精准和智能化。越来越多的企业通过短视频、直播和图文等新媒体平台开展营销内容创作与生产、私域经营和管理、短视频直播带货、广告投放与管理等互联网组合营销活动。本书根据新媒体运营和营销岗位及其要求,聚焦抖音、视频号、小红书等主流的新媒体平台,讲解移动互联网环境下对新媒体职业领域的认知与策划、营销内容的采编与生产、以及教材教辅9.6万字
- 会员本书主要包括农村电子商务发展的经济增长效应和家庭消费福利效应两部分内容。第一部分基于2000—2017年中国县级数据展开研究,研究发现电子商务发展显著促进了县域经济增长。第二部分将行政村网络代购点数量与家庭微观消费数据匹配,研究发现增加一个村级网络代购点,家庭人均网络消费平均提高41.23%,占家庭人均网络消费对数值均值的36.81%,表明网络代购点建设经济效应是显著的。本书的研究结果表明电子商务教材教辅7.3万字
- 会员本书主要讲解Hadoop的分布式文件系统、MapReduce编程模型和Spark大数据处理技术。全书共12章,具体包括大数据概述、Hadoop大数据处理架构、HDFS分布式文件系统、MapReduce分布式计算框架、HBase分布式数据库、Spark概述、基于Scala的Spark编程、Windows环境下Spark综合编程、SparkSQL结构化数据处理、SparkStreaming流计算、教材教辅9.7万字
- 会员本书整合了2021—2022年重庆工商大学经济学院各门课程的课程思政教学案例,这些案例既能帮助读者更好地理解经济学理论,还能帮助读者了解在经济学教学实践中如何进行思政教育。本书介绍了课程思政教育的教学方法和策略,例如启发式教学、案例教学、互动教学等,这些教学方法可以使经济学课程更加生动、有趣、富有思想性,提高学生的学习热情和学习效果。本书旨在为读者们提供一些实用、具有指导意义的课程思政教学案例和方社科7.8万字