老师你好,
在这节课的例子中你提到了通过查看 div标签的方式来判断网页是否有js 或ajax加载,我的疑惑是:
1. Chrome - F12 - elements 和 网页源代码 出来出来的html有何区别
2. HTML和XML之间到底是什么关系?我知道一个网页的文本下载下来后是HTML,但是我们解析的时候xpath解的又是XML。XML和HTML之间可以自由的相互转换吗?为什么不能用scrapy直接在html上抓取数据?
3. 除了你提到的这种方法,业届在做爬虫的时候还会用什么方法来判断静态动态?
可能我在一些地方的理解有误,希望老师不吝赐教