统计数据为什么不准

小码短链接的用户经常反馈数据不准确,明明只扫了一次码/点了一次链接,为什么会产生多个访问,产生这个问题的原因很多,但是小码短链接的访问数据肯定是真实的,我们会如实的记录每次访问。

产生这个问题的主要原因是平台爬虫爬取产生的无效访问数据,此时的访问记录多为未知设备,如果查询 ip 多归属为数据中心(机房)。

目前暂时无法排除机器访问,预计在 2023 年下半年,我们会发布排除机器访问的功能,借助大数据、AI 识别等技术将机器访问识别出来,让短链接的数据统计报表更接近真实访客数据。

 

常见的爬虫访问访问情形如下:

1. 把短链接发在了QQ、微信、企业微信、TG、Whatsapp 等社交软件中

如果把短链接发在QQ、微信或其他国内外的社交软件中,社交软件往往会派出爬虫爬取链接内容,主要是为了验证链接安全性或者展示链接的预览缩略图(企业微信常见)。

2. 把短链接发在了知乎、微博等社区论坛上

同第一条一样,各类社区也会派出爬虫爬取链接内容。

3. 通过各类短信平台发短信

例如,阿里云的短信平台会爬取短信中的链接地址。

 

如果链接的访问次数很高,但访问 ip 数很低的话,大概率是平台爬虫产生了大量机器无效访问。这种情况下,建议使用访问人数或 ip 数排除高频 ip 的数量作为真实访问参考。