当前位置:嗨网首页>书籍在线阅读

01-理解Scrapy性能

  
选择背景色: 黄橙 洋红 淡粉 水蓝 草绿 白色 选择字体: 宋体 黑体 微软雅黑 楷体 选择字体大小: 恢复默认

第10章 理解Scrapy性能

通常情况下,性能很容易出现问题。对于Scrapy来说,性能就不只是容易出现问题了,而是几乎肯定会出现,因为它有很多有悖常理的行为。除非你对Scrapy内部有非常好的理解,否则你会发现,即使非常努力地优化性能,也很可能得不到收益。这是使用高性能、低延迟以及高并发环境复杂性的一部分。在优化瓶颈性能时,阿姆达尔定律仍然是正确的,不过除非你能指明真正的瓶颈所在,否则在系统其他任何部分的优化都无法增长每秒能够抓取的item数量(吞吐量)。我们可以从Goldratt博士经典的The Goal一书中获得更多的感知,这本商务书籍通过优秀的隐喻对瓶颈、延迟和吞吐量的理念进行了阐释。相同的理念同样也适用于软件。本章将帮助你找出Scrapy配置中的瓶颈,以及避免出现明显的错误。

请注意本章是一个进阶章节,其中会涉及一些数学知识。计算将会比较简单,并且会附有用于展示相同概念的图表。如果你不喜欢数学,只需忽略掉公式即可,你仍然能够获得Scrapy性能如何工作的重要领悟。