当前位置:嗨网首页>书籍在线阅读

03-3种网页抓取方法

  
选择背景色: 黄橙 洋红 淡粉 水蓝 草绿 白色 选择字体: 宋体 黑体 微软雅黑 楷体 选择字体大小: 恢复默认

[toc]

2.2 3种网页抓取方法

现在我们已经了解了该网页的结构,下面将会介绍3种抓取其中数据的方法。首先是正则表达式,然后是流行的 BeautifulSoup 模块,最后是强大的 lxml 模块。