短链数据

过滤机器访问数据

周平
发布于 2024-06-11 15:50:05

什么是机器访问

将短链投放到各个互联网平台后,会有一定的概率被机器爬虫访问,这类机器爬虫通常是由于平台审核、搜索引擎公司、数据采集公司或其他自动化工具运行。例如将短链用于短信营销时,就会有大量的机器爬虫访问访问量。

对于这类非真人用户带来的访问量,我们将其称为“机器访问数据”,小码短链将会通过特别的技术手动识别出机器访问数据并将其排除,由此获得一个更加真实的短链访问数据。

小码短链如何识别机器访问

一、基础识别

识别机器访问有两种方式。第一种是根据访问者的 IP、操作系统等信息去识别,可以识别大部分的机器访问数据。

这种方式的好处是在创建短链时无需额外的设置,对已经产生的历史短链数据也能识别,但识别的精准度略逊于第二种的深度识别。

二、深度识别

第二种是通过中间页去判断访问者是否为真人,识别的精确度高于第一种的基础识别,同时访问者不会有任何感知。但需要手动为短链开启插件,只有在开启插件期间内产生的访问记录才能深度识别。

设置方式可以查看:深度识别机器访问插件

在短链列表中过滤机器访问

在短链列表页面,点击机器过滤开关后即可切换过滤前后的数据。

开关关闭时,短链列表展示的包含机器访问的所有数据。如果一条短链根据基础识别的方式,识别出超过 15%的机器访问数据,访问量的数字会变成橙色。

数据报表中过滤机器访问

在短链的数据报表页面,点击“过滤机器访问”的开关后,数据报表将过滤掉机器访问的数据,从而获得精准的真人访问数据。

而在访问记录中,会展示具体每一条访问记录是真人还是机器访问,同时会展示系统是通过哪一种方式识别的。

什么时候应该用深度过滤插件?

在大部分时候我们都推荐开启深度过滤插件。对于以下几种情况,我们强烈推荐使用“深度识别”来识别机器访问:

  1. 短信投放:是机器访问的重灾区,会有大量机器访问数据,且难以通过基础的方式识别
  2. 广告投放:真人访问数据可以让投放更精准,同时节省无效投放的费用
小码至营logo