在上一篇文章 一种隐藏document.referrer的方法中提到网站统计工具通过referrer判断来源,然后显示到后台,给管理看。比如:

百度统计后台referrer

当我点进去这两个网站,发现都是色情网站,而且并没有到我的页面的连接,应该是用程序添加referrer然后访问我的页面,欺骗了百度统计。相当于在统计后台加了一个链接,这种方法,适合小网站,一天没有几个流量的。对于大型网站,估计就被淹没了,小网站本身流量小,网站管理员很可能会点过去看看,就产生了一个PV。

还有一种更猥琐的应用。比如你想知道某个网站的管理页面。像这样的:http://op.bitauto.com/op/ 可能用扫描工具就能扫出来,但是有的很复杂,比如dedecms的dede目录一般都会被管理员重命名成一个变态的路径,直接扫不显示。有的管理后台,有统计功能,利用伪造referrer,管理员处于好奇,可能会从后台直接点进去看看这个来路路径,在我们构造的这个页面上加上统计功能,就获得了后台地址。

# 自动化

如果量小,手工处理当然可以。但是最好有个批量化的工具。思路有两个:

1.用curl、httpclient之类的模拟浏览器,请求百度统计代码,但是需要研究一下百度统计验证字段的加密方法。这样简洁高效,不需要浏览器。

2.直接用浏览器,模拟人。请求某个url的时候,给浏览器的头部加一个referrer字段,然后打开。程序实现简单,但是估计比较慢。而且明显的好处是对所有的统计代码都有效,不仅限于百度统计。