当前位置:嗨网首页>书籍在线阅读

01-网络爬虫简介

  
选择背景色: 黄橙 洋红 淡粉 水蓝 草绿 白色 选择字体: 宋体 黑体 微软雅黑 楷体 选择字体大小: 恢复默认

[toc]

第1章 网络爬虫简介

欢迎来到网络爬虫的广阔天地!网络爬虫被用于许多领域,收集不太容易以其他格式获取的数据。你可能是正在撰写新报道的记者,也可能是正在抽取新数据集的数据科学家。即使你只是临时的开发人员,网络爬虫也是非常有用的工具,比如当你需要检查大学网站上最新的家庭作业并且希望通过邮件发送给你时。无论你的动机是什么,我们都希望你已经准备好开始学习了!

在本章中,我们将介绍如下主题:

  • 网络爬虫领域简介;
  • 解释合法性质疑;
  • 介绍 Python 3 安装;
  • 对目标网站进行背景调研;
  • 逐步完善一个高级网络爬虫;
  • 使用非标准库协助抓取网站。