安全公司利用自然语言处理技术实时识别钓鱼网

摘要: 云安全技术公司OpenDNS近日宣布开发出了一款利用自然语言处理技术的工具原型NLPRank,该工具可实时自动识别出恶意域名(钓鱼网站)以及对高价值目标的攻击。 所谓的恶意(抢注)域

云安全技术公司OpenDNS近日宣布开发出了一款利用自然语言处理技术的工具原型NLPRank,该工具可实时自动识别出恶意域名(钓鱼网站)以及对高价值目标的攻击。

所谓的恶意(抢注)域名通常用于钓鱼网站,即域名的拼写往往跟我们熟悉的知名网站比较类似。网络罪犯抢注了这些域名后会把网站做得跟知名网站十分类似,一旦用户想访问那些知名网站时输错个别字母(如G00gle.com)就会进入到钓鱼网站,由于界面十分相似,有的用户并不会意识到,于是继续输入个人账户密码等敏感信息从而导致隐私泄露。有的网络黑客则利用用户注重安全的心理,通过各种方式发送一些进行安全更新的提示,而所提供的链接地址采用了跟知名网站貌似很有关系的域名(如adobeupdates[.]com),诱骗用户进入。

传统上,安全软件的解决方案是事后处理。因为域名太多了,恶意域名是无法事先收集完整的,所以通常只有在用户受害后报告才会识别出某些域名是有威胁的。不过OpenDNS的工程师正是利用了这类恶意域名起码刻意与知名网站类似的特点,采用了以往被应用于生物信息和数据挖掘的自然语言处理技术,结合ASN映射和赋权、WHOIS数据模式以及HTML标签分析再加上OpenDNS的全球网络数据,开发出了可实时识别恶意域名的工具原型NLPRank。

OpenDNS的研究人员Jeremiah O’Connor首先分析了DarkHotel以及Mandiant APT1两个网络犯罪集团的攻击手段和数据,发现他们的手段都比较类似,就是钓鱼攻击。而且在拿到这些犯罪集团的数据之后,他发现这些钓鱼网站采用的域名都遵循着某些类似的模式,于是萌生了做NLPRank的想法。

这种实时的检测模型包括了一个经常被用来参考做钓鱼网站的流行合法域名字典库(如“java”、“gmail”、“adobe”等),然后将其与钓鱼活动常见的英语单词(如“install”、“update”、“download”)进行比较。接着利用生物信息学里面的序列比对技术对“install-ad0be”这类的域名进行评级,然后评估其被用于钓鱼行动的可能性。比如,某个域名跟知名网站比较类似,NLPRank就会将这个域名的IP地址与知名网站域名对应的IP库进行对比,看看是否属于该知名网站的IP库范围,如果不属于,那么这个域名是钓鱼网站的可能性就比较高。

这种利用自然语言处理技术的实时检测方法应该是一种比较新颖的做法,这不仅在于其实时性,而且钓鱼网站会比较为难,因为如果钓鱼网站希望起名跟知名网站不那么类似来规避被软件识别的可能性的话,用户可能就不那么容易被那样的域名欺骗了。

时间: 2024-08-03 22:43:34

安全公司利用自然语言处理技术实时识别钓鱼网的相关文章

OpenDNS开发出了一款利用自然语言处理技术的工具原型NLPRank

摘要: 云安全技术公司OpenDNS近日宣布开发出了一款利用自然语言处理技术的工具原型NLPRank,该工具可实时自动识别出恶意域名(钓鱼网站)以及对高价值目标的攻击. 所谓的恶意(抢注)域 云安全技术公司OpenDNS近日宣布开发出了一款利用自然语言处理技术的工具原型NLPRank,该工具可实时自动识别出恶意域名(钓鱼网站)以及对高价值目标的攻击. 所谓的恶意(抢注)域名通常用于钓鱼网站,即域名的拼写往往跟我们熟悉的知名网站比较类似.网络罪犯抢注了这些域名后会把网站做得跟知名网站十分类似,一旦

NLP入门+实战必读:一文教会你最常见的10种自然语言处理技术(附代码)

自然语言处理(NLP)是一种艺术与科学的结合,旨在从文本数据中提取信息.在它的帮助下,我们从文本中提炼出适用于计算机算法的信息.从自动翻译.文本分类到情绪分析,自然语言处理成为所有数据科学家的必备技能之一. 在这篇文章中,你将学习到最常见的10个NLP任务,以及相关资源和代码. 为什么要写这篇文章? 对于处理NLP问题,我也研究了一段时日.这期间我需要翻阅大量资料,通过研究报告,博客和同类NLP问题的赛事内容学习该领域的最新发展成果,并应对NLP处理时遇到的各类状况. 因此,我决定将这些资源集中

谷歌公司利用机器学习技术帮助市场营销人员改善广告追踪能力与效果

这是每一家企业在市场营销方面面临着的重要问题.而在日前于旧金山举办的Marketing Next大会上,谷歌公司制定了新的目标,即通过一项新服务帮助营销人员了解其广告及其它营销性举措到底效果如何. 此次发布的新服务被谷歌公司命名为Google Attribution.尽管名称平淡无奇,但此项新服务承诺以更理想的方式对个人电脑.智能手机乃至从搜索到实体店面访问在内的多渠道状况进行追踪,从而准确把握宣传活动的具体成效. 作为一项免费服务,Attribtuion背后的基本思路在于着眼特定产品的买家在决

自然语言处理技术(NLP)在推荐系统中的应用

个性化推荐是大数据时代不可或缺的技术,在电商.信息分发.计算广告.互联网金融等领域都起着重要的作用.具体来讲,个性化推荐在流量高效利用.信息高效分发.提升用户体验.长尾物品挖掘等方面均起着核心作用.在推荐系统中经常需要处理各种文本类数据,例如商品描述.新闻资讯.用户留言等等.具体来讲,我们需要使用文本数据完成以下任务: 候选商品召回.候选商品召回是推荐流程的第一步,用来生成待推荐的物品集合.这部分的核心操作是根据各种不同的推荐算法来获取到对应的物品集合.而文本类数据就是很重要的一类召回算法,具有

解析监控头像是如何利用大数据从众人中识别“你的脸”

技术的日本GLORY公司是一家这是拥有脸部验证技术的公司,该项技术不仅可以从人群通过车站检票口的移动影像识别人的脸,还能同时自动推测性别和年龄.蓝色为男性,红色为女性,数字则显示人的年龄. GLORY的面部验证技术获得安全业界很高的评价.只要在系统登录面部照片,即便是从拥挤的图像中也能够轻松地认出本人.这项技术特别是在需要严密管理进出口的楼宇备受重视.它的特点是验证精确度超过99.99%,错认面部相似的"他人"的概率非常低.此项他人识别率是测量面部验证技术高低的一个晴雨表. 所谓&qu

《中国人工智能学会通讯》——7.25 利用自然语言语音绘制人体大脑皮层的语义地图

7.25 利用自然语言语音绘制人体大脑皮层的语义地图 此前的神经影像研究已经识别出大脑中的一组极有可能表示语义信息的区域.这些区域统称为语义系统(semantic system),相比非词汇(non-words). 音 韵 学 任 务(phonological tasks)和 随 机 无 序 的 语 言 语 音(temporally scrambledspeech),语义系统对单词(words).语义任务(semantic tasks) 和 自 然 语 言 语 音(naturalspeech)有

Twitter利用Storm系统处理实时大数据

Hadoop(大数据分析领域无可争辩的王者)专注于批处理.这种模型对许多情形(比如为网页建立索引)已经足够,但还存在其他一些使用模型,它们需要来自高度动态的来源的实时信息.为了解决这个问题,就得借助 Nathan Marz 推出的 Storm(现在在 Twitter 中称为 BackType).Storm 不处理静态数据,但它处理预计会连续的流数据.考虑到 Twitter 用户每天生成 1.4 亿条推文 (tweet),那么就很容易看到此技术的巨大用途. 但 Storm 不只是一个传统的大数据分

海底捞卫生问题后续,监管部门可否引入 AI 实时识别与监控?

前几天,海底捞被曝出严重卫生问题. 老鼠爬进食品柜.员工用漏勺掏下水道.洗碗池里洗簸箕--这是"海底捞"北京劲松店.太阳宫店后厨的"夜半实况". 与"上帝服务"相悖的"脏乱差"实景的较大出入让本次事件引发全民热议.人们讨论着海底捞公关.讨论着海底捞背后潜在的其他商家的卫生问题....当然,这些都是本次事件的核心内容,值得商讨,但也许除了这些之外,食品卫生背后的相关监管方案也值得被关注. 相信大家在外就餐时,在稍大的餐饮店内都会

IBM计划收购Weather公司的产品和技术业务;Watson将在物联网领域大展拳脚

IBM 今天宣布,该公司已经达成一项最终协议,将收购Weather公司的B2B.移动和基于云计算的web资产,其中包括 WSI.weather.com.Weather Underground 和The Weather Company 品牌.电视部门,即 The Weather Channel(天气频道),不会被IBM收购,但将根据一份长期合同,从IBM获得天气预报数据和分析能力的许可.两家公司技术和专业知识的结合将为新的Watson 物联网 设备以及Watson物联网云平台奠定基础,此次收购属于