任务3:抓取下列5页商标的数据,并将出现频率最高的申请号填入答案中
查看请求地址,由于猿人学的题目请求链接具有相似性,此题用控制台查看内容时发现https://match.yuanrenxue.cn/jssm
这样一个地址如下:
查看具体内容发现set-cookie
,set-cookie含义:浏览器看到请求中未携带Cookie,在HTTP的响应头中加入Set-Cookie。 浏览器收到Set-Cookie后,会将Cookie保存下来 下次再访问该网站时,HTTP请求头就会携带Cookie。
在看看数据地址中请求需要携带 sessionid=
如下:
所以整个逻辑应该是先请求https://match.yuanrenxue.cn/jssm
得到sessionid=
,再携带sessionid=