练习具体网址请私信博主,或者博客中有什么不明白的也可以私信博主
作者学习初衷:在面对ai时代,数据是基础,然而那么多的数据去哪找呢,这个时候就需要用到我们的爬虫,本博客的任何代码都是合法合规,不给源代码,会回答一些问题,读者怎么做,怎么用和本人没有任何关系,宗旨是传播知识
先从简单的网站开始:良好的开始是成功的一半,由于各种原因,没有办法写完整的东西,因此有需要请私信
我们先来看看书上的描述打开网站的开发者工具后,发现网站的数据是通过ajax动态加载的,因此只用勾选这一块的xhr就行:如何确定是xhr断点呢?请自行查找或者后台私信博主
我们先来看看书上的描述然后我们来看接口数据(很明显该接口的返回数据是密文,那为什么在浏览器中用户看到的都是明文呢,那么解密的方法肯定在浏览器里面,那应该在哪呢,这会在js里面,到这里后我们现在要做的就是去跟踪js):
我们现在就启动器里面看看(很明显是异步的,他的加载顺序是混乱的),这就不得不说我们常用的定位方法了,(hook,启动器,dom调试,xhr调试),因为他这个是在返回数据中加密,因此我们直接用hook会快很多。
到这我们分析部分就做完了
我们可以看到密文是在这加载的:
执行完这个函数后它就变成了明文,因此解密的函数就是这个:_0x1683d3[‘a’][‘decipher’],我们只要解决他就行了 ,我们只要进入它,看他里面的函数是怎么写的就行
图片中的1是密文,2是解密的位置,3是解密后的明文
创作不易,给作者点个赞吧,球球了