百度爬虫程序要明确服务器数据格式

发布于 2021-03-09 14:04:19
关注者
0
被浏览
640
1 个回答
搜一搜社区
搜一搜社区 2021-03-09
搜一搜问答社区

百度爬虫程序之所以要明确服务器数据格式就是为了可以不用每次调用都先发请求,而是直接从服务器获取数据而无需遍历每一个文件,定制爬虫程序也更加灵活方便。通过我的个人实践以及在百度搜索结果页源码的比对,目前可以非常确定数据格式。至于获取到了什么数据,可以参考我的博客:baiduspiderjs[SEP]google的结果是json,百度是htmljson格式。

撰写答案

请登录后再发布答案,点击登录

发布
问题

分享
好友

手机
浏览

扫码手机浏览