短链接生成方法,原来这么简单

随着微博获得了高速发展,短链接服务也更加活跃。短链接在方便了人们在微博等平台上进行分享的同时也带来了诸多风险。由于短链接中不含有任何的目标网站信息,以至于人们将无从知晓该短链接究竟会带我们走向哪里。许多的网络钓鱼犯罪分子通过在用户界面张贴一个通向钓鱼网站的“短链接”,然后微博平台便自动将这恶意短链接分发给该用户所有的好友。由于这些社交网络平台用户间的信任关系,他们更容易点击这些恶意的短链接,最终引入这些钓鱼网站,被窃取个人敏感信息如身份证号、银行卡号、密码等,最终造成个人财产损失。
码人网mrw.so缩短网址文章图片
mrw.so一种新的短链接生成方法,通过在生成过程中分析目标网站的特征,并将其嵌入短网址中,建立起该短网址与目标网站URL之间的一种联系,使用户在点击短地址之前便能够知晓目的网址的部分信息,并提高对网络钓鱼的警惕性。这将有效的遏制网络钓鱼犯罪分子肆无忌惮的利用短网址欺骗用户的行为,对从源头减少恶意链接的生成、规范短链接生成服务提供有效借鉴。

1.短链接服务

短链接服务通常包含短地址生成过程和地址重定向两个过程。短链接服务提供商会提供一个包含脚本的界面,该脚本包含请求缩短的长地址,系统经过滥用预防、URL过滤、垃圾预防、URL验证等检查之后会生成一个随机字符串,并将该ID与目标地址以某种形式存储在数据库中,并返回与该ID相关的短地址。当用户访问该段地址时,系统就可以通过301、302或META转向等域名重定向技术将访问当前短链接的用户引导至目标网站。对于短地址980.so/11,980.so即是服务网站,11则为编码后的ID。

2、网络钓鱼新形式

由于生成后的短链接与目标网站在内容上不存在任何联系,导致用户无法根据该短链接猜测目的URL。因而,网络钓鱼分子便利用这一弱点实施网络诈骗。网络钓鱼分子会通过微博等平台发送一条包含指向钓鱼网站的短链接,并生成这是一条合法的地址,通过优惠、打折等相关词语吸引其他好友的点。其他用户收到该信息以后认为这是将指向一个合法的购物或银行网页如淘宝、当当、工商银行等,实际上这个网址却转向了仿冒的网站。目前,传统的黑白名单方法无法在第一时间发现并提示用户安全风险,而机器学习来检测钓鱼网站的方法也因短链接的随机性而无法提取出有效的特征。

3、内容相关短链接生成算法

基于内容的短链接生成算法通过构建目的网址与生成的短链接的一种联系,使得在地址得到缩短的同时,用户能够在短链接中猜测到目的网址的部分内容,从而达到防范网络诈骗的目的。算法主要思想来源于阿拉伯语中不包含短元音,却同样可以用于交流而不会产生障碍。因此,我们尝试将去掉元音的关键信息融合进短网址中,使得用户在去掉元音的时候仍能够猜测目的网址;同时添加一标志位用于存放对目标网址预处理的结果,便于其他组织对该链接进行自动化检测。

4、短链接生成算法

首先提取目的网址的站点名称。这里的站点名称指URL中排除了协议、顶级域名、路径等之后最能体现目标网站类型的部分。例如:‘'http://ganmall.com.cn/”这一链接,我们将首先提取域名部分‘'ganmall.com.cn”,然后提取站点名称‘''ganmall”,这一过程可以使用正则表达式直接实现。当用户使用长地址缩短服务时,将首先检查该目的URL是否已被注册。如果目的地址已被注册,则直接返回相应的短链接。如果目的地址或相关词未被注册,则对该相关词进行增量计数。生成的结果将包含相关词和计数两部分,确保不同站点的相关词得以区分。例如”980.so”将根据请求短链接服务的先后顺序生成。相同站点下的链接将通过对其内部ID进行编码区分。

5、短链接安全性检测

在提供短网址服务时同时将对目的链接进行简单的安全性检查,检测其是否含有钓鱼网站特征,并在短链接中添加一个标志位,既能便于用户了解更多的安全性信息,又能方便第三方组织根据该特征位实现自动化检测。首先将检测目的地址是已经是短链接,若是则进一步判定其是否为本站点提供的短链接,为本站点提供的短链接则提取标识位,否则还原其目的地址。