这里用到的工具是Charles,是Mac下的一个抓包工具。
Windows下对应的是Fiddler。
如果你不会用,或者不熟习,建议先安装一个,自己动手熟习一下软件的用法。

好了,准备事情完成了,废话不多说,开始干货!

(1)开启Charles后,打开新浪微博的登录页面,并输入用户名、密码、验证码后登录一遍,这时候会在Charles留下全体登录的流程,后边逐步剖析。

html模仿新浪网页图文详解Python模仿登录新浪微博流程 Webpack

(2)剖析的第一步,要知道用户名如何加密。
在Charles中搜索“username”。
为什么这么搜?你如果是做网站的,估计90%的可能都会把用户名变量命名为username吧!
搜索后看到只有文件loginLayers.js中包含username,该文件的命名也解释跟文件干系,根据履历该当能判断出这个文件很主要。

(3)将这个文件的内容复制出来,放到一个文本文件中,搜索username,会找到下边图示中的这么几行代码,从而得知用户名的加密办法。
用户名加密方法很大略,encode之后紧跟一个base64即可。
详细用Python怎么写,自己看代码。

(4)用户名加密完了,该当要加密密码了。
连续在这个文件中搜索password,得到:

这里可以推测出this.login中的参数b该当便是password。
查看login函数,可以得到:

这里调用了loginByXMLHttpRequest函数,并传入参数b,即password。
以是我们连续搜索loginByXMLHttpRequest,得到:

这里调用了makeXMLRequestQuery函数,并传入参数b,即password。
以是我们连续搜索makeXMLRequestQuery,得到:

这里调用了makeRequest函数,并传入参数b,即password。
以是我们连续搜索makeRequest,得到:

这里就可以清晰的看到密码加密流程。
详细Python怎么实现,还是自己看代码。
但是这里有个问题,密码加密的时候,会有几个参数须要传入,比如nonce、servertime、rsakv等等,这是什么鬼呢?连续往下看。

(5)在Charles中搜索servertime,会得到一个prelogin的要求,该要求返回servertime、nonce、pubkey等参数。
这里返回的是一个json串。

查看该要求的request,可以看到他须要加密后的用户名su。
根据这里的参数,就可以对密码进行加密了。
这里轻微回忆总结下全体流程:

根据用户名username得到加密后的用户名su

根据su得到一个json串,里边包含加密密码用到的各种参数,servertime、nonce等

根据json串和密码得到加密后的密码,然后就可以上岸了。

(6)在Charles中可以找到一个login.php要求,根据履历也可以大体判断这便是登录要求,事实证明也确实如此。
根据该要求的request,自己构建postdata,并发送要求即可。

这里须要解释下验证码问题。
有些账号登录须要验证码,有些不须要,这和账号设置有关,带有登录保护的就须要输入验证码。
这里也可以根据上边得到的json串中的showpin参数得知(详细见上边的图)。
如果须要验证码,则只须要找到验证码的地址,得到图片:

将这个图片保存到本地进行人工打码,或者接入打码平台,都可以获取验证码内容。
在我的代码中,我原来封装了云打码平台的接口,直接调用即可,但为了方便大家测试,我改为人工打码的形式,详细见代码:

(7)布局postdata,发送要求,即便是要求成功了,实在还没登录成功。
由于新浪微博还有一步跳转。
是不是很麻烦?别焦急,胜利立时就在面前了。
我们仔细查看Charles后,会创造在上个要求之后,有下边一个要求wbsso.login,这便是那个跳转,如下图。

该跳转要求的要求如何构建,大家看代码即可,这里就不多说了。
代码如下:

代码中还检讨登录是否成功,这里也不过多描述。
到这为止,新浪微博就算是登录成功了。

这里还有一个问题没有说到,便是Cookie问题。
本文中一贯没有提到Cookie,是由于Python中的Cookiejar会帮我们自动处理所有的cookie问题。
你只须要在仿照上岸之前,首先声明一个cookiejar和opener即可,详细这两个东西的用法,大家自行百度。
代码如下:

仿照上岸微博真的很麻烦,也确实须要一定的履历,大家多多练习,闇练节制了这个,相信你们在仿照上岸其他网站的时候,也能举一反三的去破解登录流程。
有什么问题,可以在评论中指出,有韶光我会帮大家解答的。

总的代码如下:

# __ coding: utf-8 __

import re

import rsa

import ssl

import time

import json

import base64

import logging

import binascii

import urllib.parse

# 参考PSpider项目

import spider

ssl._create_default_https_context = ssl._create_unverified_context

class WeiBoLogin(object):

\公众\公众\公众

class of WeiBoLogin, to login weibo.com

\公众\"大众\公众

def __init__(self):

\"大众\公众\"大众

constructor

\"大众\"大众\"大众

self.user_name = None # 登任命户名

self.pass_word = None # 登录密码

self.user_uniqueid = None # 用户唯一ID

self.user_nick = None # 用户昵称

self.cookie_jar, self.opener = None, None

return

def login(self, user_name, pass_word, proxies=None):

\"大众\"大众\"大众

login weibo.com, return True or False

\"大众\公众\公众

# 变量赋值初始化

self.user_name = user_name

self.pass_word = pass_word

self.user_uniqueid = None

self.user_nick = None

# 构建cookie_jar和opener,这里不该用代理,同时担保全体流程中不须要关心cookie问题

self.cookie_jar, self.opener = spider.make_cookiejar_opener(is_cookie=True, proxies=proxies)

self.opener.addheaders = spider.make_headers(

user_agent=\"大众pc\"大众,

host=\公众weibo.com\"大众,

referer=\"大众http://weibo.com/\公众,

accept=\公众text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,/;q=0.8\"大众,

accept_encoding=\"大众gzip, deflate\公众,

accept_language=\"大众zh-CN,zh;q=0.8\"大众

).items()

# (1) 打开weibo.com/login.php,先要求一些必要的cookie信息

self.opener.open(\"大众http://weibo.com/login.php\"大众)

# (2) 根据用户名获取加密后的用户名

s_user_name = self.get_username()

# (3) 利用加密后的用户名,获取其他一些数据:json格式

json_data = self.get_json_data(su_value=s_user_name)

if not json_data:

return False

# (4) 根据第三步得到的json数据,获取加密后的密码

s_pass_word = self.get_password(json_data[\公众servertime\公众], json_data[\"大众nonce\公众], json_data[\"大众pubkey\"大众])

# (5) 布局登录中用到的postdata

post_dict = {

\"大众entry\公众: \"大众weibo\"大众,

\"大众gateway\"大众: \公众1\"大众,

\"大众from\公众: \"大众\"大众,

\"大众savestate\公众: \"大众7\公众,

\"大众userticket\"大众: \"大众1\公众,

\"大众vsnf\公众: \"大众1\"大众,

\公众service\公众: \"大众miniblog\"大众,

\"大众encoding\"大众: \公众UTF-8\公众,

\公众pwencode\"大众: \"大众rsa2\"大众,

\"大众sr\"大众: \"大众1280800\"大众,

\"大众prelt\"大众: \"大众529\"大众,

\公众url\公众: \"大众http://weibo.com/ajaxlogin.php?framelogin=1&callback=parent.sinaSSOController.feedBackUrlCallBack\"大众,

\"大众rsakv\"大众: json_data[\"大众rsakv\公众],

\"大众servertime\公众: json_data[\"大众servertime\"大众],

\"大众nonce\"大众: json_data[\"大众nonce\公众],

\"大众su\"大众: s_user_name,

\"大众sp\"大众: s_pass_word,

\"大众returntype\"大众: \公众TEXT\"大众,

}

# (6) 判断是否须要输入验证码,如果须要,获取验证码并进行打码操作

if json_data.get(\"大众showpin\公众, None) == 1:

url = \"大众http://login.sina.com.cn/cgi/pin.php?r=%d&s=0&p=%s\"大众 % (int(time.time()), json_data[\"大众pcid\"大众])

with open(\"大众captcha.jpeg\"大众, \公众wb\公众) as file_out:

file_out.write(self.opener.open(url).read())

code = input(\"大众请输入验证码:\公众)

# cid, code = self.yundama.get_captcha(self.opener.open(url).read(), \"大众captcha.jpeg\"大众, \公众image/jpeg\"大众, codetype=\"大众1005\公众)

# if not code:

# return False

post_dict[\公众pcid\"大众] = json_data[\公众pcid\公众]

post_dict[\"大众door\"大众] = code

# (7) 根据布局的postdata,登录微博

login_url_1 = \公众http://login.sina.com.cn/sso/login.php?client=ssologin.js(v1.4.18)&_=%d\"大众 % int(time.time())

json_data_1 = json.loads(spider.get_html_content(self.opener.open(login_url_1, data=spider.make_post_data(post_dict))))

if json_data_1[\"大众retcode\"大众] == \公众0\公众:

# 登录后有一个跳转, 布局跳转链接的postdata

post_dict = {

\公众callback\公众: \公众sinaSSOController.callbackLoginStatus\"大众,

\"大众ticket\公众: json_data_1[\"大众ticket\"大众],

\公众ssosavestate\"大众: int(time.time()),

\"大众client\公众: \"大众ssologin.js(v1.4.18)\"大众,

\公众_\"大众: int(time.time()1000),

}

login_url_2 = \"大众https://passport.weibo.com/wbsso/login?\"大众 + urllib.parse.urlencode(post_dict)

html_data = spider.get_html_content(self.opener.open(login_url_2), charset=\公众gbk\"大众)

json_data_2 = json.loads(re.search(\公众<span class='3e76fd8d3fcc928c MathJax_Preview'><img src='http://python.jobbole.com/wp-content/plugins/latex/cache/tex_d91626e87dc0c68a5173e9a7eb5dad84.gif' style='vertical-align: middle; border: none; padding-bottom:2px;' class='fd8d3fcc928c01b8 tex' alt=\公众(?P<result>.)\"大众 /></span><script type='math/tex'>(?P<result>.)</script>\公众, html_data).group(\"大众result\公众))

# 检讨登录是否成功,并获取用户唯一ID,用户昵称等

if json_data_2[\"大众result\"大众] is True:

self.user_uniqueid = json_data_2[\"大众userinfo\"大众][\"大众uniqueid\公众]

self.user_nick = json_data_2[\公众userinfo\"大众][\"大众displayname\"大众]

logging.warning(\"大众WeiBoLogin succeed: %s\"大众, json_data_2)

else:

logging.warning(\"大众WeiBoLogin failed: %s\公众, json_data_2)

else:

logging.warning(\"大众WeiBoLogin failed: %s\"大众, json_data_1)

return True if self.user_uniqueid and self.user_nick else False

def get_username(self):

\"大众\"大众\"大众

get username, encrypt file: http://tjs.sjs.sinajs.cn/t5/register/js/page/remote/loginLayer.js

\"大众\"大众\公众

username_quote = urllib.parse.quote_plus(self.user_name)

username_base64 = base64.b64encode(username_quote.encode(\"大众utf-8\"大众))

return username_base64.decode(\"大众utf-8\公众)

def get_json_data(self, su_value):

\"大众\"大众\"大众

get the value of \"大众servertime\"大众, \"大众nonce\公众, \"大众pubkey\"大众, \公众rsakv\"大众 and \"大众showpin\公众, etc

\"大众\公众\"大众

post_data = urllib.parse.urlencode({

\"大众entry\"大众: \公众weibo\公众,

\"大众callback\公众: \"大众sinaSSOController.preloginCallBack\公众,

\"大众rsakt\"大众: \"大众mod\公众,

\公众checkpin\"大众: \公众1\"大众,

\公众client\"大众: \"大众ssologin.js(v1.4.18)\"大众,

\"大众su\"大众: su_value,

\公众_\"大众: int(time.time()1000),

})

try:

response = self.opener.open('http://login.sina.com.cn/sso/prelogin.php?'+post_data)

data = spider.get_html_content(response, charset=\公众utf-8\"大众)

json_data = json.loads(re.search(\"大众<span class='3fcc928c01b84dba MathJax_Preview'><img src='http://python.jobbole.com/wp-content/plugins/latex/cache/tex_2113437cb5d6c60798b4b1eaf9e54223.gif' style='vertical-align: middle; border: none; padding-bottom:2px;' class='928c01b84dba0949 tex' alt=\"大众(?P<data>.)\"大众 /></span><script type='math/tex'>(?P<data>.)</script>\"大众, data).group(\公众data\"大众))

except Exception as excep:

json_data = {}

logging.error(\"大众WeiBoLogin get_json_data error: %s\公众, excep)

logging.debug(\"大众WeiBoLogin get_json_data: %s\公众, json_data)

return json_data

def get_password(self, servertime, nonce, pubkey):

\公众\公众\公众

get legal password, encrypt file: http://tjs.sjs.sinajs.cn/t5/register/js/page/remote/loginLayer.js

\公众\公众\"大众

string = (str(servertime) + '\t' + str(nonce) + '\n' + str(self.pass_word)).encode(\公众utf-8\"大众)

public_key = rsa.PublicKey(int(pubkey, 16), int(\公众10001\"大众, 16))

password = rsa.encrypt(string, public_key)

password = binascii.b2a_hex(password)

return password.decode()

if __name__ == '__main__':

logging.basicConfig(level=logging.DEBUG, format=\"大众%(asctime)s\t%(levelname)s\t%(message)s\"大众)

# 测试登录,输入微博的用户名和密码

weibo = WeiBoLogin()

weibo.login(\公众username\公众, \"大众password\"大众)

原文作者:笑虎

您的每一次评论及转发是我为您供应最精彩的内容的动力,帮转起来,感激。

如果您没有关注本 头条号 请先关注。

同时关注微信公众年夜众账号:Mobile_Internet (也可以第一韶光理解到最新的开拓头条资讯。

立即加入QQ群:326254067 (程序员与源代码 (群2))