人人网消息中心的页面是http://req.renren.com/notify/nt”>http://req.renren.com/notify/nt
想提取更多的消息中心的提醒,可以点击 显示更多留言消息及回复
然后查看到页面进行的xhr操作发现了以下操作:
1 2 3 |
Request URL:http://notify.renren.com/rmessage/get?getbybigtype=1&bigtype=1&limit=20&begin=20&view=16 Request Method:POST Status Code:200 OK |
分析url后得出其实不用POST,直接GET就行,不懂页面为啥要POST,以后有空深究下。
1 |
http://notify.renren.com/rmessage/get?getbybigtype=1&bigtype=1&limit=<要获取的消息数目>&begin=<开始第一条的id>&view=16 |
GET这个url,返回得到的是一堆json
经过查看,发现返回的json格式是这样的
1 2 3 4 5 6 7 8 9 10 11 12 13 |
{ bigtype: "0" // 暂时不知道什么意思 callback: <消息回调> content: <每个消息正文> icon: <消息图标url> nid: <消息id> processcallback: <处理消息的url> rmessagecallback: <移除消息的url> source: "196-4952220350" // 没看出来是怎么回事 time: <unix时间戳> unread: <是否读取,取值0或1> unreadcount: <未读数目> } |
其实比较重要的是content和time。time可以做标记,在content里有继续下一步提取消息对应内容的url。其他的可以都略过。
获取了content和time,下一步就可以继续研究获取正文了。