#1 - 2015-8-16 02:59
AWSL (AWSL)
新手刚学的网页抓取,之前一窍不通OTL
在磕磕盼盼中花了N长时间终于分析出了向 http://bgm.tv/FollowTheRabbit POST账号信息就可以验证账号并拿到cookie。
之后就快了,马上就把用户设置的post结构也搞出来了。
但问题来了,我发现,bangumi的很多操作,比如删除观看信息,小组发帖,发日志,注销,都是向相应网页POST、GET数据,可是网址结尾必定带有一个值,这个值随着每次登陆账号都是变化的。估计是验证用的?
比如,我现在账户要登出的话,就是向这个地址“http://bgm.tv/logout/1292e236” GET,并且在head中附上cookie。
虽然如果在网页中分析一下元素,看一下代码就能拿到这个值,但这样不太适合写脚本和程序啊
我想问一下,这个值有没有办法不通过html页面分析来获得?
在磕磕盼盼中花了N长时间终于分析出了向 http://bgm.tv/FollowTheRabbit POST账号信息就可以验证账号并拿到cookie。
之后就快了,马上就把用户设置的post结构也搞出来了。
但问题来了,我发现,bangumi的很多操作,比如删除观看信息,小组发帖,发日志,注销,都是向相应网页POST、GET数据,可是网址结尾必定带有一个值,这个值随着每次登陆账号都是变化的。估计是验证用的?
比如,我现在账户要登出的话,就是向这个地址“http://bgm.tv/logout/1292e236” GET,并且在head中附上cookie。
虽然如果在网页中分析一下元素,看一下代码就能拿到这个值,但这样不太适合写脚本和程序啊
我想问一下,这个值有没有办法不通过html页面分析来获得?
嘛,主要是想问一下有没有办法不通过抓网页拿到这个值,比如访问bgm的某个地址,在返回的head中会夹带这个值,这写代码的时候就不用费心去搜索了。。。。