[toc]
现在我们已经了解了该网页的结构,下面将会介绍3种抓取其中数据的方法。首先是正则表达式,然后是流行的 BeautifulSoup 模块,最后是强大的 lxml 模块。
BeautifulSoup
lxml