当前位置:嗨网首页>书籍在线阅读

02-何时使用缓存

  
选择背景色: 黄橙 洋红 淡粉 水蓝 草绿 白色 选择字体: 宋体 黑体 微软雅黑 楷体 选择字体大小: 恢复默认

[toc]

3.1 何时使用缓存

缓存,还是不缓存?对于很多程序员、数据科学家以及进行网络抓取的人来说,是一个需要回答的问题。在本章中,我们将介绍如何对网络爬虫使用缓存,不过你是否应当使用缓存呢?

如果你需要执行一个大型爬取工作,那么它可能会由于错误或异常被中断,缓存可以帮助你无须重新爬取那些可能已经抓取过的页面。缓存还可以让你在离线时访问这些页面(出于数据分析或开发的目的)。

不过,如果你的最高优先级是获得网站最新和当前的信息,那此时缓存就没有意义。此外,如果你没有计划实现大型或可重复的爬虫,那么可能只需要每次去抓取页面即可。

在开始实现之前,你可能想要简要了解一下正在抓取的页面多久会发生变更,或是你应该多久清空缓存并抓取新页面,不过首先让我们学习如何使用缓存!