第一篇:卡巴斯基实验室成功获得尖端反垃圾邮件技术专利
卡巴斯基实验室成功获得尖端反垃圾邮件技术专利
领先的信息安全解决方案提供商——卡巴斯基实验室宣布,已经成功地在俄罗斯注册了世界尖端的反垃圾邮件技术专利。该技术能够有效、深入地检测到图片中的垃圾信息。
当今的反垃圾邮件过滤器对于检测文本中的垃圾信息没有什么困难,所以现在很多垃圾邮件散布者经常使用隐匿技术将垃圾信息藏于图片中。而过滤图片中的垃圾信息比过滤文本中的要远远复杂得多。在反垃圾邮件过滤器判断一段文本中的信息是否为垃圾信息前,必须要能够检测到图片中隐藏的文本信息。而大部分用于检测图片中文本信息的方法都依靠于机器识别图片技术。但机器识别技术对于其中符号的大小、风格和布局都要求很高的统一性。垃圾邮件发布者正是利用机器识别技术这一局限性,故意在图片中进行扭曲并制造“干扰”,从而使得识别变得更困难。
卡巴斯基实验室该项领先技术能够有效地识别和检测光栅图像中的文本和垃圾信息,而不需要机器识别图片技术的辅助。该技术能实现高速检测,并且能识别几乎所有的文本语言。
卡巴斯基实验室的这项新的反垃圾邮件技术由Eugene Smirnov研发,并于2009年1月13日获得联邦知识产权、专利及商标处颁发的专利。
这项新的专利技术基于概率和数理统计方法。一个图片中是否包含文字信息,取决于图片中的图案的布局是否组成单词和句子,以及这些字母和单词组成的内容。专用的过滤器能够保证系统不受图片中干扰元素或者文本碎片的影响。而该技术中独特的文本行识别方法又能够有效地对付图片垃圾邮件中使用的干扰技术,如图形扭曲或者旋转等。同时,新的反垃圾邮件系统还能够通过比较其自身数据库中的垃圾邮件模板,从而有效地判定检测到的文本是否为垃圾信息。
卡巴斯基实验室的反垃圾邮件研发组经理、该技术的研发人员Eugene Smirnov说:“一方面,这项新技术能有效地检测图片中包含的几乎各种语言,另一方面,我们并没有尝试使用机器识别技术阅读文本,因此这项技术有效地降低了对系统资源的要求,它被应用于卡巴斯基实验室的高性能反垃圾邮件过滤模块。”
卡巴斯基实验室的专利法务组经理NadezhdaKashenko评论道:“该项发明对于反垃圾邮件产业非常重要。值得指出的是,虽然现在有很多不同的技术用于检测垃圾文本信息,但能够识别图片中的垃圾文本信息的技术寥寥无几。这些解决方案非常复杂和繁琐,因为要想确认邮件是否为垃圾邮件,必须先要识别出图片中的文字。Eugene Smirnov开发的技术非常独特,是新一代的技术,所以我们有理由为其申请专利。”目前,卡巴斯基实验室在美国和俄罗斯还有30多个专利申请正在等待通过,涉及一系列公司员工研发的技术。
众所周知,当今的很多反病毒技术都是由卡巴斯基实验室开发研究出来的,这些技术也被授权给许多厂商在世界范围内广泛使用,如微软、Bluecoat, Juniper Networks, Clearswift, Borderware, Checkpoint, Sonicwall, Websense, LanDesk, Alt-N, ZyXEL, ASUS and D-Link。
来自统计调查公司艾瑞咨询的最权威数据显示,2010年,在人们日常收集到的垃圾邮件中,垃圾邮件发送者将广告信息和文字信息以图片的形式发送的邮件从2009年初所占比例的10%已经飙升至25%。这些专业的广告邮件发送者越来越会隐蔽他们的这些广告信息,以免这些广告信息被反垃圾邮件网关过滤,他们以bmp,jpg,tiff,gif等不通的格式制成图片,将这些图片发送出去,取代以前的邮件文本格式。这些不同的图像之所以能够蒙蔽一些反垃圾邮件网关,是因为要解读这些图片需要占用服务器的大量CPU资源外,还要新的识别算法来读取这些图片,从加重邮件网关的负担。从而造成一般的邮件网关不能很好地识别这些垃圾邮件,让这些垃圾邮件发送者专了空子。这些图像垃圾邮件除了给我们带来了一般垃圾邮件的危害以外,同时也为图片邮件比常规邮件文本内容更大,也更占用邮件服务器的存储空间。
企业级邮件系统应用安全解决方案提供商梭子鱼公司于2009年初第一个宣布:梭子鱼反垃圾邮件网关将采用新的反垃圾邮件技术阻断不断增长的图片型垃圾邮件,全新的图片识别和图像行为分析技术将重点解决这些图片邮件。当前许多反垃圾邮件解决方案仅采用了基于文字内容评分的技术,因此图片型垃圾邮件日益增长。这也将是梭子鱼最近关注的重点。
“梭子鱼反垃圾邮件网关的分层过滤机制能够准确地过滤绝大部分的图片垃圾邮件。”梭子鱼公司市场产品经理副总StephenPao说,“即将推出的OCR和指纹识别技术向我们的用户表明梭子鱼公司将不断地提升邮件反垃圾技术用以阻断各种新型垃圾邮件。帮助我们用户解决垃圾邮件的危害问题。“
通过接近一年的数据统计和数据观察分析,梭子鱼公司发现在垃圾邮件中有28%含有图片,其中大部分图片中又包含着文字等广告信息。利用先进的OCR技术,梭子鱼反垃圾邮件网关能够识别这些图片中的文字,并根据特定算法和规则予以相应的评分和判断,再结合这封邮件的其他部分如信头、信体的各种特征,最终判断这封邮件是否是垃圾邮件,然后判断是否该阻断这封邮件。
此外,梭子鱼还采用了新的技术,提取这些垃圾邮件包括图片邮件中的指纹特征。然后梭子鱼公司的反垃圾邮件中心通过世界各地的邮件蜜罐集群以及我们收集到的数万梭子鱼用户的举报来的垃圾邮件并予统计分析,形成特有的垃圾邮件指纹库。梭子鱼设备连接反垃圾邮件中心,时时下载和更新这些反垃圾邮件规则库。采用新指纹分析技术分析邮件并与指纹库中的数据进行比较,自动地阻断、隔离、标记邮件这样,指纹分析就能够阻断图片垃圾邮件,即使图片不包含文本。
OCR技术已在梭子鱼反垃圾邮件网关的3.3.03以上版本中使用。新邮件指纹识别技术已经在梭子鱼
3.4.04以上版本中使用。梭子鱼的反垃圾邮件用户无需为这两种新的技术支付额外的费用,只要届时联网自动升级就可以使用这两项技术。