章节目录
- 01-从Web抓取信息
- 02-项目_利用webbrowser模块的mapIt.py
- 03-第1步_弄清楚URL
- 04-第2步_处理命令行参数
- 05-第3步_处理剪贴板内容,加载浏览器
- 06-第4步_类似程序的想法
- 07-用requests模块从Web下载文件
- 08-用requests.get()函数下载一个网页
- 09-检查错误
- 10-将下载的文件保存到硬盘
- 11-HTML
- 12-学习HTML的资源
- 13-快速复习
- 14-查看网页的HTML源代码
- 15-打开浏览器的开发者工具
- 16-使用开发者工具来寻找HTML元素
- 17-用bs4模块解析HTML
- 18-从HTML创建一个BeautifulSoup对象
- 19-用select()方法寻找元素
- 20-通过元素的属性获取数据
- 21-项目_打开所有搜索结果
- 22-第1步_获取命令行参数,并请求查询页面
- 23-第2步_找到所有的结果
- 24-第3步_针对每个结果打开Web浏览器
- 25-第4步_类似程序的想法
- 26-项目_下载所有XKCD漫画
- 27-第1步_设计程序
- 28-第2步_下载网页
- 29-第3步_寻找和下载漫画图像
- 30-第4步_保存图像,找到前一张漫画
- 31-第5步_类似程序的想法
- 32-用selenium模块控制浏览器
- 33-启动selenium控制的浏览器
- 34-在页面中寻找元素
- 35-单击页面
- 36-填写并提交表单
- 37-发送特殊键
- 38-单击浏览器按钮
- 39-关于selenium的更多信息
- 40-小结
- 41-习题
- 42-实践项目
- 43-命令行电子邮件程序
- 44-图像网站下载
- 45-链接验证
- 46-48