当前位置:嗨网首页>书籍在线阅读

18-本章小结

  
选择背景色: 黄橙 洋红 淡粉 水蓝 草绿 白色 选择字体: 宋体 黑体 微软雅黑 楷体 选择字体大小: 恢复默认

[toc]

3.5 本章小结

本章中,我们了解到缓存已下载的网页可以节省时间,并能最小化重新爬取网站所耗费的带宽。不过,缓存页面会占用磁盘空间,而我们可以使用压缩的方式缓解一些空间占用。此外,在类似Redis的现有存储系统的基础之上创建缓存,可以有效避免速度、内存以及文件系统的限制。

下一章中,我们将为爬虫添加更多的功能,从而实现并发下载网页,使爬虫运行得更快。