[toc]
本章介绍了网络爬虫,然后给出了一个能够在后续章节中复用的成熟爬虫。此外,我们还介绍了一些外部工具和模块的使用方法,用于了解网站、用户代理、网站地图、爬取延时以及各种高级爬取技术。
下一章中,我们将讨论如何从已爬取到的网页中获取数据。