[toc]
本章首先介绍了网络爬虫框架Scrapy,该框架拥有很多能够改善抓取网站效率的高级功能。然后,我们介绍了Portia,它提供了生成Scrapy爬虫的可视化界面。最后我们试用了Scrapely(Portia中使用了该库),它通过先训练简单模型的方式自动化抓取网页。
下一章中,我们将应用前面学到的这些技巧来抓取现实世界中的网站。