爬百度账户手机号脚本

已认证 随性且迷人 4天前 12


因为抓取提交的数据,有几个参数值不知道怎么算所以用了Chrome无头浏览器.


原理

通过输入手机号并提交,如果手机号绑定了账户就会返回出用户名


分配线程

①输入完文件名和线程数量之后,获取一共有多少个手机号.用手机号数量/线程数量得出来的就是每个线程任务数量

②如果有余数那么额外线程的任务数量就是手机号数量-线程数量*每个线程任务数量


线程处理

①每个线程都启动一个无头浏览器,设置UA,禁止加载图片和CSS,最长等待时间

②根据每个线程任务数量循环(包括出错的任务)

③如果这个任务总体出错超过了5次就会被淘汰

④接下来打开网页,获取网页源码,获取验证码并识别,赋值数据,点击按钮

⑤因为提交之后不可能立刻就会响应,所以需要等待1秒种

⑥重新获取网页源码判断是不是验证码识别错误,如果错误就重试(5次错误淘汰,自动变成总体错误)

⑦接下来就是判断是不是存在账户,如果返回的信息存在未知错误就会自动变成总体错误.如果是存在或不存在则写入文件


下载源码  baidu_phone.py

还没有人收藏过本帖~
访客记录
  • 随性且迷人
最新回复 (0)

你可以在 登录 or 注册 后,对此帖发表评论!

返回