《Python网络爬虫从入门到实践》电子书在线阅读-庄培杰-得到APP

计算机类型

可以朗读语音朗读

109千字字数

2019-08-01 发行日期

展开全部

主编推荐语

本书深入浅出剖析Python爬虫，从零开始学习，涵盖基础知识、爬虫库、存储数据、反爬策略等内容。

内容简介

借着人工智能的浪潮，Python的热度一直持续上涨，训练人工智能依赖于大量的数据，而数据的获取基本靠爬虫。大量的信息通过Web站点进行展示，通过学习编写Python爬虫，编写采集数据的爬虫脚本，对所需的数据进行爬取。本书尝试着由浅入深来剖析Python爬虫，让读者更快更系统的上手Python爬虫的编写。本书包括12章内容，从零开始学习Python爬虫。第1章是Python爬虫概念与Web基础，介绍了Python的一些概念，HTTP协议，简单介绍了网页基本三剑客HTML,CSS和JavaScript的基本语法。第2章介绍Python爬虫库的基本使用，包括Chrome抓包，urllib和lxml库的使用。第3章介绍Python抓包与数据分析，包括HTTPS简介，Charles抓包，Packet Capture抓包，requests库和Beautiful Soup库的使用。第4章介绍使用CSV和Excel存储数据。第5章介绍使用数据库存储数据，包括MySQL,Redis和MongoDB的使用。第6章介绍一些常见的反爬虫策略，代理，ajax,selenium等。第7,8章详细讲解了Python爬虫框架Scrapy的使用。第9章介绍了构建自己的代理ip池。第10章介绍了如何搭建分布式爬虫。第11,12章，利用爬取到的数据进行可视化数据分析。

评分及书评

尚无评分

目前还没人评分

出版方

电子工业出版社

电子工业出版社成立于1982年10月，是国务院独资、工信部直属的中央级科技与教育出版社，是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展，已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域，综合出版能力位居全国出版行业前列。