一个小项目自动登录淘宝联盟抓取数据,由于之前在Github上看过类似用Python写的代码因此选择用Python来写,第一次用Python正式写程序还是被其“简单”所震撼,当然用的时候还是对其(2.7版)编码、迁移环境等问题所困扰,还好后来都解决了。

言归正传,抓取淘宝联盟的数据首先要解决的就是登录的问题,之前一般会碰到验证码的困扰,现在支持二维码扫码登录反而简单了,以下是登录的Python代码,主要是获取二维码打印,然后不断的检查扫码状态,如果过期了重新请求二维码(主要看逻辑,由于有些通用方法做了封装所以不保证能直接执行)
def getQRCode(enableCmdQR):
payload = {'_ksTS': str(time.time()), 'from': 'alimama'}
qrCodeObj = utils.fetchAPI('https://qrlogin.taobao.com/qrcodelogin/generateQRCode4Login.do', payload,
"json", None, True, True)
print(qrCodeObj)
utils.printQRCode('http:' + qrCodeObj['url'], enableCmdQR)
lgToken = qrCodeObj['lgToken']
return lgToken
def login(enableCmdQR=False):
lgToken = getQRCode(enableCmdQR)
code = 0
successLoginURL = ""
while code != 10006:
payload = {'lgToken': lgToken,
'defaulturl': 'http%3A%2F%2Flogin.taobao.com%2Fmember%2Ftaobaoke%2Flogin.htm%3Fis_login%3D1&_ksTS=' + str(
time.time())}
rObj = utils.fetchAPI('https://qrlogin.taobao.com/qrcodelogin/qrcodeLoginCheck.do', payload, "json", True,
False)
code = int(rObj['code'])
if 10000 == code:
# print("请扫描二维码登录")
continue
elif 10001 == code:
print("已扫描二维码,请在确认登录")
elif 10004 == code:
print("已过期请重新扫描")
login()
elif 10006 == code:
successLoginURL = rObj["url"]
print("登录成功,正在跳转")
else:
print("未知错误,退出执行")
sys.exit(0)
time.sleep(5)
print "登录成功跳转:" + successLoginURL
r = utils.fetchAPI(successLoginURL, None, "raw", True, False, True)
utils.fetchAPI(r.headers['Location'], None, "raw", True, True, False)
解决登录问题接下去就要解决保存状态的问题,Python的Requests库非常强大,如果简单的话可以直接使用request.session来进行会话操作,但由于项目中的很多操作是异步的因此需要解决cookie的存储和读取,使用pickel进行对像的序列化和反序列化。其中保存cookie默认用增量的方式进行更新
def save_cookies(cookies, overWrite=False):
try:
currentCookie = requests.utils.dict_from_cookiejar(cookies)
if len(currentCookie) < 1:
return
oldCookie = requests.utils.dict_from_cookiejar(load_cookies())
with open(config.COOKIE_FILE, 'w') as f:
if not overWrite:
cookieDict = dict(oldCookie, **currentCookie)
else:
cookieDict = requests.utils.dict_from_cookiejar(cookies)
pickle.dump(cookieDict, f)
print 'Saved cookie'
print cookieDict
f.close()
except:
print 'Save cookies failed', sys.exc_info()[0]
sys.exit(99)
def load_cookies():
try:
with open(config.COOKIE_FILE, 'r') as f:
cookies = requests.utils.cookiejar_from_dict(pickle.load(f))
f.close()
except:
cookies = []
return cookies
封装好之后,在requests.Session请求时加载cookie并保存cookie
s = requests.Session()
# 统一请求API
def fetchAPI(url, params=None, resultFormat="text", isNeedCookie=True, allowRedirects=True, saveCookie=False,
method='GET'):
try:
cookies = load_cookies()
if 'POST' == method:
response = s.post(url, data=params, headers=config.Headers, cookies=cookies)
else:
response = s.get(url, params=params, headers=config.Headers, cookies=cookies,
allow_redirects=allowRedirects)
if "json" == resultFormat:
result = response.json()
elif "raw" == resultFormat:
result = response
else:
result = response.text
# if saveCookie:
# print 'save cookie:' + str(response.cookies)
save_cookies(response.cookies)
return result
except Exception, e:
print e
return False
这两步做好之后基本后续的请求就直接使用统一的API请求方法即可,效果也非常不错,运行效果截图:
当然还有一个问题未解决:如何在session过期之后如何自动重新申请(不确定淘定是否支持),由于淘宝是用统一登录而且是独立的服务因此通过浏览器自动刷新或者请求过程中不断去更新cookie都没有获得服务器方更新的票据,不知道这一块大家有没有可以提供的思路。
# python
# 生成二维码
# 二维码识别
# 二维码
# Python自动登录
# Python模块 _winreg操作注册表
# python中扫描条形码和二维码的实现代码
# 通过python扫描二维码/条形码并打印数据
# python利用winreg生成桌面路径及实现扫描二维码图片返回相关信息
# 淘宝
# 跳转
# 这一
# 序列化
# 请在
# 对其
# 言归正传
# 还有一个
# 可以直接
# 不确定
# 验证码
# 两步
# 非常不错
# 装好
# 来写
# 过程中
# 接下去
# 主要是
# 并保存
# 自动登录
相关文章:
宝塔建站后网页无法访问如何解决?
Android自定义控件实现温度旋转按钮效果
高防网站服务器:DDoS防御与BGP线路的AI智能防护方案
建设网站制作价格,怎样建立自己的公司网站?
建站之星安装模板失败:服务器环境不兼容?
如何零基础开发自助建站系统?完整教程解析
c# Task.Yield 的作用是什么 它和Task.Delay(1)有区别吗
Python多线程使用规范_线程安全解析【教程】
如何批量查询域名的建站时间记录?
西安市网站制作公司,哪个相亲网站比较好?西安比较好的相亲网站?
如何在搬瓦工VPS快速搭建网站?
广州网站设计制作一条龙,广州巨网网络科技有限公司是干什么的?
网站设计制作公司地址,网站建设比较好的公司都有哪些?
建站之星会员如何解锁更多建站功能?
如何在IIS中新建站点并配置端口与物理路径?
网站制作难吗安全吗,做一个网站需要多久时间?
如何选择CMS系统实现快速建站与SEO优化?
建站之星代理费用多少?最新价格详情介绍
如何彻底删除建站之星生成的Banner?
如何设计高效校园网站?
如何高效完成独享虚拟主机建站?
品牌网站制作公司有哪些,买正品品牌一般去哪个网站买?
武汉外贸网站制作公司,现在武汉外贸前景怎么样啊?
建站为何优先选择香港服务器?
湖南网站制作公司,湖南上善若水科技有限公司做什么的?
如何基于云服务器快速搭建个人网站?
头像制作网站在线观看,除了站酷,还有哪些比较好的设计网站?
代购小票制作网站有哪些,购物小票的简要说明?
如何在阿里云服务器自主搭建网站?
英语简历制作免费网站推荐,如何将简历翻译成英文?
Bpmn 2.0的XML文件怎么画流程图
高防服务器租用指南:配置选择与快速部署攻略
如何快速生成高效建站系统源代码?
公司网站的制作公司,企业网站制作基本流程有哪些?
如何在自有机房高效搭建专业网站?
C++中的Pimpl idiom是什么,有什么好处?(隐藏实现)
c++23 std::expected怎么用 c++优雅处理函数错误返回【详解】
青浦网站制作公司有哪些,苹果官网发货地是哪里?
弹幕视频网站制作教程下载,弹幕视频网站是什么意思?
如何在IIS服务器上快速部署高效网站?
如何快速查询网站的真实建站时间?
非常酷的网站设计制作软件,酷培ai教育官方网站?
网站视频制作书签怎么做,ie浏览器怎么将网站固定在书签工具栏?
网站制作外包价格怎么算,招聘网站上写的“外包”是什么意思?
网站建设制作需要多少钱费用,自己做一个网站要多少钱,模板一般多少钱?
建站VPS选购需注意哪些关键参数?
C#如何序列化对象为XML XmlSerializer用法
建站VPS能否同时实现高效与安全翻墙?
常州自助建站:操作简便模板丰富,企业个人快速搭建网站
Android使用GridView实现日历的简单功能
*请认真填写需求信息,我们会在24小时内与您取得联系。