01-动态内容
[toc]
第5章 动态内容
根据联合国2006年的一项研究,73%的主流网站都在其重要功能中依赖JavaScript。诸如React、AngularJS、Ember、Node等使用JavaScript的模型-视图-控制器(MVC)框架的增长与流行,更加提高了JavaScript作为网页内容主流引擎的重要性。
和单页面应用的简单表单事件不同,使用JavaScript时,不再是加载后立即下载页面全部内容。这种架构会造成许多网页在浏览器中展示的内容可能不会出现在HTML源代码中,我们在前面介绍的抓取技术也就无法抽取网站的重要信息了。
对于这种动态的JavaScript网站,本章将会介绍两种抓取其数据的方法,分别是:
- JavaScript逆向工程;
- 渲染JavaScript。