当前位置:嗨网首页>书籍在线阅读

16-本章小结

  
选择背景色: 黄橙 洋红 淡粉 水蓝 草绿 白色 选择字体: 宋体 黑体 微软雅黑 楷体 选择字体大小: 恢复默认

[toc]

8.7 本章小结

本章首先介绍了网络爬虫框架Scrapy,该框架拥有很多能够改善抓取网站效率的高级功能。然后,我们介绍了Portia,它提供了生成Scrapy爬虫的可视化界面。最后我们试用了Scrapely(Portia中使用了该库),它通过先训练简单模型的方式自动化抓取网页。

下一章中,我们将应用前面学到的这些技巧来抓取现实世界中的网站。