当前位置:嗨网首页>书籍在线阅读

11-请求和响应

  
选择背景色: 黄橙 洋红 淡粉 水蓝 草绿 白色 选择字体: 宋体 黑体 微软雅黑 楷体 选择字体大小: 恢复默认

3.2.2 请求和响应

大家可能注意到在前面的日志中,scrapy shell本身已经为我们做了一些工作。我们给出了一个URL,然后它执行了一个默认的 GET 请求,并得到了一个状态码为 200 的响应。这就意味着,页面信息已经加载完毕,可以使用了。如果想要打印 response.body 的前50个字符,可以按如下命令操作。

>>> response.body[:50]
'<!DOCTYPE html>\n<html>\n<head>\n<meta charset="UTF-8"'
`[:50]` 是什么?这是Python从文本变量(本例为 `response.body` )中抽取最前面50个字符(如果存在)的方式。如果你之前并不了解Python,请保持冷静,继续向前。很快,你就会熟悉并享受所有这些语法技巧了。

这是Gumtree上指定页面的HTML内容。请求和响应部分不会给我们带来太多麻烦。不过,在很多情况下,你需要做一些工作才能保证其正确。第5章中讲到这些内容。就目前来说,我们尽量保持简单,直接进入下一部分—— Item