
会员
精通Scrapy网络爬虫
更新时间:2020-11-28 14:59:54 最新章节:本书特点:
书籍简介
本书深入系统地介绍了Python流行框架Scrapy的相关技术及使用技巧。全书共14章,从逻辑上可分为基础篇和高级篇两部分,基础篇重点介绍Scrapy的核心元素,如spider、selector、item、link等;高级篇讲解爬虫的高级话题,如登录认证、文件下载、执行JavaScript、动态网页爬取、使用HTTP代理、分布式爬虫的编写等,并配合项目案例讲解,包括供练习使用的网站,以及京东、知乎、豆瓣、360爬虫案例等。本书案例丰富,注重实践,代码注释详尽,适合有一定Python语言基础,想学习编写复杂网络爬虫的读者使用。
品牌:清华大学
上架时间:2017-10-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
刘硕
最新上架
- 会员本书分别讲解了大模型基础,数据集的加载、基本处理和制作,数据集的预处理,卷积神经网络模型,循环神经网络模型,特征提取,注意力机制,模型训练与调优,模型推理和评估,大模型优化算法和技术,AI智能问答系统和AI人脸识别系统。计算机11.2万字
- 会员本书是一份旨在帮助Java求职者在面试中脱颖而出的重要指南。本书涵盖Java并发编程的多个关键主题,如并发原理和线程安全、并发关键字原理、并发锁和死锁、并发容器和工具、并发线程池以及并发设计与实战等。本书的特色在于将“大厂”“名企”的面试问题和实践经验相结合,不仅对面试问题和面试官心理进行深度剖析,还对面试问题解答和相关技术点进行详细介绍,这样更有利于读者全面理解相关知识点和技术,并能够在实际工作计算机17.6万字
- 会员本书采用“任务驱动”的编写模式,由浅入深、循序渐进、系统地介绍了JavaWeb开发的相关知识。通过实际应用的案例,帮助读者巩固所学知识,以便更好地进行开发实践。全书共15章,内容涵盖了JavaWeb开发基础知识、Servlet接收GET请求数据、Servlet接收POST请求数据、Servlet生成HTTP响应数据、异步请求和异步响应、会话控制技术:Cookie与Session、过滤器Filt计算机16.7万字
- 会员本书分为9篇,共35章。第1篇主要介绍基本配置;第2篇主要介绍用户及权限管理;第3篇主要介绍网络相关配置;第4篇主要介绍存储管理;第5篇主要介绍系统管理;第6篇主要介绍软件管理;第7篇主要介绍安全管理;第8篇主要介绍容器管理;第9篇主要介绍自动化管理工具ansible的使用。计算机12.4万字
- 会员本书全面深入地介绍Elasticsearch的核心功能及其工作机制。本书由浅入深,从Elasticsearch的基本用法和架构原理,以及倒排索引、分片、节点角色和相关性等核心概念讲起;然后深入探讨数据处理和索引管理,涵盖映射模式、数据类型、文本分析、索引模板;接着详细介绍词项级搜索、全文搜索、复合查询和高级搜索等Elasticsearch的搜索功能,并深入讲解聚合;最后聚焦生产环境中的Elasti计算机27.5万字
- 会员本书跟随了Node.js的标准与行业的发展趋势,在介绍新标准与新技术的同时兼顾了理论基础和实际应用,主要内容分为基础和应用两部分,基础部分内容包含了Node.js环境配置,npm项目管理,JavaScript语法基础,Node.js基本模块的原理与使用,异步代码的编写与组织,应用部分包含了网络编程,桌面应用开发以及测试和调试。本书讲解与示例并重,由浅入深地剖析了Node.js模块与语言原理,并通过计算机10.9万字
同类书籍最近更新
- 会员本书的程序案例采用广泛流行的PHP、MySQL、XML、CSS、JS、HTML5等程序开发语言及数据库实现。将案例和相关知识点融合,所有案例均在书中给出了核心实现代码并进行了讲解。初学者可以在了解PHP和MySQL语法之后,从头至尾地学习,对于其中难以理解的部分可以查阅相关资料,部分功能的开发还需要读者具有一定的JS、CSS等知识。有经验的微信公众平台开发人员可以根据自己的需要,直接切入相应章节程序设计16.5万字
- 会员本书采用常用技术与真实案例相结合的讲解方式,深入浅出地介绍了Python机器学习应用的主要内容。全书共8章,内容包括Python概述、NumPy数值计算、pandas基础、pandas进阶、Matplotlib绘图、scikit-learn、餐饮企业综合分析与预测、通信运营商客户流失分析与预测。前6章设置了选择题、填空题和操作题,后两章设置了操作题,希望通过练习和操作实践,读者可以巩固所学的内容。程序设计7.4万字
- 会员本书从初学者的角度出发,详细介绍了JavaWeb开发需要掌握的相关技术。全书分4个部分,共17章,由浅入深地介绍了HTTP、Tomcat、Servlet、Maven、数据库基础知识、JDBC、MyBatis、JSP、框架原理、如何设计自己的框架,以及在线购书商城、个人云文件系统、论坛、个人博客项目开发的完整过程。本书理论联系实际,不但能让读者全面掌握JavaWeb开发基本技术,而且能让读者开发程序设计8.5万字
- 会员本书作者李骏作为多点生活的资深前端架构师,曾就职于阿里、腾讯等知名互联网公司,具有顶尖的前端技术能力和丰富的实战经验,在第一时间便投入到微信小程序的实践中。本书可分为3部分,第一部分作为基础章节,介绍了第一个小程序的搭建流程,让大家能快速上手;同时对小程序框架原理进行了详细介绍,为后面学习组件、API打下基础。第二部分对小程序组件、API进行介绍,对组件、API的使用、注意事项进行详细讲解,并给出程序设计10.7万字
- 会员《运维前线:一线运维专家的运维方法、技巧与实践》(以下简称《运维前线》)是前线系列的一个子集,前线系列图书的出版理念是邀请多位业界专家,总结所在行业的最新理念或深度实践经验。前线系列图书不同于市面上的很多图书,这类书并不系统,有的只是一线专家的实战经验,人们常称之为“干货”。一篇文章、一家公司、一个案例、一个场景,独立成篇,在满足碎片化阅读的同时,也能让读者进行横向比较和深入思考。本系列图书不强调程序设计19.3万字