引言:如果使用post方法访问网页时,参数中需要输入动态验证码,我们该如何去获取呢?
使用fiddler进行登录数据分析
打开fiddler。点击被测网站的登录页面,但是先不登录,然后前往fiddler查看相应信息。双击fiddler中跳出的相应登录页面网址,然后导航到Header-->SyntaxView,我们首先可以看到这是一个get请求,同时也能在下面内容中找到对应的token值,如下。但是这是一个动态的值,意味着我们每次去登录,token值都会变化。接下来就使用脚本去抓取这个值。
编写脚本
编写思路:
导入类库包:importrequestsfromlxmlimportetree定义url:url='登录网址'第三点也是最重要:要使用requests方法中的session保持方法,而不能直接使用get去获取响应结果定义一个session=requests.session()获取响应结果:response=sessioget(ur.text把字符串类型的响应结果转化为DOM格式doc=etreHTML(respons用xpath方式抓取token,如上所示token=doxpath('//meta[@name='csrf-token']/@content')[0]然后就可以将获取到的token传入到登录所需的参数中登录时仍然要使用之前定义的session保持,否则就会视作再次访问,token值又会变化。login=sessiopost(url,data='参数')之后如果要访问其他页面同样要使用session保持。
完整代码如下:
#导入类库包importrequestsfromlxmlimportetree#定义URLurl='xxxxxxxxxxxxxxxxxxxx'#将requests请求使用session保持session=requests.session()response=sessioget(ur.text#把字符串类型的响应结果转化为DOM格式的doc=etreHTML(respons#用xpath方式抓取tokentoken=doxpath('//meta[@name='csrf-token']/@content')[0]#print(toke#把token值传入登录的参数中,进行登录#登录信息userinfo={'_csrf':token,'LoginForm[identity]':'xxxxxxx','LoginForm[password]':'xxxxxxx',}#使用session保持发送登录请求result=sessiopost(url,data=userinfo)#打开被测页面testURL='xxxxxxxxxxxxxxxxxxxxxxxxxx'#发送请求,获取页面的内容testresult=sessioget(testUR.text
文章为作者独立观点,不代表 股票程序化软件自动交易接口观点