百度统计被刷广告的原理

想要斩草除根,就需要知己知彼,明白他们操作的原理以后,就可以有效的遏制他们无下限的刷广告。

他们是这样做的,先写一个机器爬虫,爬取页面内容,寻找「hm.baidu.com/hm.js」如果找到了就说明你使用了百度统计,然后再取后面的参数,就得到了你的百度统计ID,然后保存到数据库,拿到你的的百度统计ID以后,就可以进行下一步,使用程序批量的给百度统计接口发送数据,也就是说这些内容他们根本不是真的去你的网站,而是直接给百度统计的接口提交了数据,对你的网站流量没有任何贡献,你只有看广告的份。

我也是被刷广告刷的很严重,是在忍无可忍,必须解决一下他们了。

百度统计给我们的代码:

<script>
var _hmt = _hmt || [];
(function() {
  var hm = document.createElement("script");
  hm.src = "https://hm.baidu.com/hm.js?868e22cfca30f68b16f4c32562c7e649";
  var s = document.getElementsByTagName("script")[0]; 
  s.parentNode.insertBefore(hm, s);
})();
</script>

将百度统计的特征,也就是地址打散成数组,再组装使用:

var _hmt = _hmt || [];
(function() {
    var hm = document.createElement("script");
    var analytics_bd = '868e22cfca30f68b16f4c32562c7e649';
    hm.src = ['ht', 't', 'ps', ':/', '/h', 'm', '.', 'ba', 'i', 'd', 'u.c', 'o', 'm/', 'h', 'm', '.j', 's?', analytics_bd].join('');
    var s = document.getElementsByTagName("script")[0];
    s.parentNode.insertBefore(hm, s);})();

需要改动的就只有一行,注意「hm.src = "https://hm.baidu.com/hm.js?868e22cfca30f68b16f4c32562c7e649";」这行代码,被拆散为数组,然后再拼装起来使用。这样他们的爬虫程序就无法识别到你在使用百度统计了。

最后修改:2021 年 08 月 13 日 12 : 12 AM
对您有帮助的话,请赏包辣条吧 ^~^