首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
朱怡  宁振虎  周艺华 《计算机应用》2020,40(8):2279-2285
近年来,僵尸网络、域名挟持、钓鱼网站等仿冒域名攻击越发频繁,严重威胁着社会和个人的安全,因此仿冒域名检测已经成为网络防护的重要组成部分。当前的仿冒域名检测主要面向公共域名,检测方法以编辑距离为主,难以充分体现域名的视觉特征;此外利用域名相关信息进行判定虽然有助于提高检测效率,却会引入较大的额外开销。为此,考虑采用仅基于域名字符串的轻量级检测策略,并综合考虑字符位置、字符相似度和操作类型对域名视觉的影响,提出基于视觉特征的编辑距离算法。该算法根据仿冒域名的特点,先对域名进行预处理,然后按照字符位置、字符相似度及操作类型对字符赋予不同的权重,最后通过计算编辑距离值进行仿冒域名判定。实验结果表明,基于视觉特征的仿冒域名轻量级检测方法与基于编辑距离的判定方法相比,在阈值取1和2时,F1值分别提高了5.98%和13.56%,验证了该方法具有良好的检测效果。  相似文献   

2.
僵尸网络广泛采用域名生成算法(Domain Generation Algorithm,DGA)生成大量的随机域名来躲避检测。针对僵尸网络DGA域名问题,本文设计实现了一种DGA域名检测系统。首先使用基于随机森林算法的轻量级分类分析检测模块,通过分析域名字符特征区分正常域名与疑似恶意域名,满足现网实际应用中快速检测的要求;然后使用基于X-means算法的聚类分析检测模块,在分类分析检测的基础上,根据DGA域名的字符相似性和查询行为相似性,通过聚类和集合分析方法对疑似恶意域名进一步检测,降低系统误检率。通过部署基于Spark的检测系统对某运营商现网真实DNS日志数据进行连续20天的处理和分析,检测系统平均每天挖掘出约250万DGA域名,经过正则匹配分析,其中约55%属于5类已知的DGA;在前两个实验日,共发现13,000个已知DGA域名分属于3个DGA类别。实验结果表明检测系统可有效检测出多种DGA域名,此外,检测系统也可满足现网实际应用中快速检测的要求。  相似文献   

3.
已有DGA检测方法已经获得了较高的检测精度,但在缩略域名上存在误报率高的问题。主要原因是缩略域名字符间随机性高,现有检测方法从随机性角度很难有效地区分缩略域名和DGA域名。在分析了缩略域名的字符特性后,基于自注意力机制实现了域名字符依赖性的检测;并采用LSTM改进了Transformer模型的编码方式,以更好地捕获域名中字符位置信息;基于Transformer模型构建了DGA域名检测方法(MHA)。实验结果表明,MHA可以有效地区分出DGA域名和缩略域名,得到了更高的精确率和更低的误报率。  相似文献   

4.
设计了根据车牌的彩色特征对车牌位置进行粗定位,再利用车牌字符二值化特征来精确定位的双重车牌定位方法。在中值滤波和二值化等预处理后,提取出车牌中的字母和数字字符并建立相应的模板,通过字符归一化在NIOSII中采用最大相似度算法较好的识别了车牌号码。实验结果表明,该方法具有良好的实时性和较高的识别率。  相似文献   

5.
啤酒瓶字符的圆周投影特征提取与识别   总被引:1,自引:0,他引:1       下载免费PDF全文
针对已分割完成的啤酒瓶凸性字符,提出了一种基于圆周投影变换的图像特征提取方法。以质心为极点将笛卡尔坐标系变换为极坐标系,进行圆周投影计算,将二维的字符图像变换为一维投影。利用小波变换(WT)和离散余弦变换(DCT),提取不同字符的有效特征。通过相同、相似字符特征提取实验,表明该方法具有较好的抗噪声能力和分类性能。  相似文献   

6.
改进的Sunday模式匹配算法   总被引:5,自引:1,他引:4       下载免费PDF全文
在基于模式匹配的检测方法中,匹配效率是检测技术的瓶颈,间接影响入侵检测系统的实时性能。该文对4种模式匹配算法进行分析后,选择最优的Sunday算法进行改进。该算法进行匹配前先找到模式串中的特征字符(出现概率最小的字符),进行特征字符与尾字符双重匹配,失败则移动尽可能远的距离。实验结果证明匹配效率比Sunday算法有一定的提高。  相似文献   

7.
分析了中文域名的仿冒攻击形式, 并且基于字符的点阵特性和贝叶斯分类原理, 提出了一种从单个字符的相似性到域名的整体相似性的中文域名仿冒检测方法, 并通过常用中文字库的实验对该方法的有效性进行了验证。实验结果表明了该方法可以对常见的中文域名仿冒方式进行准确检测, 并且其检测方法在未来可进一步适用于其他国际化域名的仿冒检测。  相似文献   

8.
当前僵尸网络大量采用DGA算法躲避检测,针对主流的基于人工规则的检测算法无法对最新产生的DGA域名进行识别检测和基于机器学习的检测算法缺乏演化的训练数据的问题,提出了一种基于Ascall编码方式定义域名编、解码器,并结合生成对抗网络构造域名字符生成器来预测生成DGA变体样本的方法。实验结果表明,在采用生成数据进行分类器训练和性能评估中,此方法生成的DGA域名变体样本可充当真实DGA样本,验证了生成数据的有效性并可用于DGA域名检测器的训练评估。  相似文献   

9.
网络流量中包含的域名数据给网络流量共享带来数据隐私的挑战。现有对域名的匿名化处理方法多采用文本泛化和替换等手段,隐私性处理效果较好,但破坏了域名原有的结构和文本特性,无法满足网络安全分析场景的需求。文章提出一种面向网络安全分析的域名匿名化方法,通过基于域名结构的分层匿名处理策略和基于字符空间构造的匿名化算法,在保留网络安全分析过程中所关注的域名结构和文本属性特征的前提下对域名文本进行重构,实现既保留研究人员所需的域名数据可用性,又去除域名数据中的隐私信息的目的。为抵御穷举攻击,文章采取按参数随机重构的方式,以减少不同批次下相同域名匿名结果发生重复的概率,并基于校园网真实网络流量数据对提出的方法进行了验证。实验结果表明,文章提出的方法能够有效提升匿名化后域名数据的不可识别和不可逆的特性,并保留其在结构和语义方面的效用。  相似文献   

10.
字符分割技术是车牌识别系统的关键技术之一。字符分割最主要的问题是字符粘连及车牌边框的影响。鉴于车牌字符具有布局规整,字符个数确定,字符大小一致、宽高存在规律等特征,文章提出一种将投影和字符间距相结合的基于字符综合特征的字符分割算法。实验证明该算法那对分割粘连字符具有较好效果。  相似文献   

11.
该文提出了一种字形相似度计算方法,旨在解决汉字中相似字形(称作形似字)的识别和查找问题。首先,提出了汉字拆分方法,并构建了偏旁部首知识图谱;然后,基于图谱和汉字的结构特点,提出2CTransE模型,学习汉字实体语义信息的表示;最后,将输出的实体向量用于汉字字形的相似度计算,得到目标汉字的形似字候选集。实验结果表明,该文所提出的方法对于不同结构汉字的字形相似度计算有一定效果,所形成的汉字部件组成库,为之后字形计算的相关研究提供了行之有效的数据集。同时,也拓宽了日语等类汉语语言文字字体相似度计算的研究思路。  相似文献   

12.
Human motion indexing and retrieval are important for animators due to the need to search for motions in the database which can be blended and concatenated. Most of the previous researches of human motion indexing and retrieval compute the Euclidean distance of joint angles or joint positions. Such approaches are difficult to apply for cases in which multiple characters are closely interacting with each other, as the relationships of the characters are not encoded in the representation. In this research, we propose a topology-based approach to index the motions of two human characters in close contact. We compute and encode how the two bodies are tangled based on the concept of rational tangles. The encoded relationships, which we define as {it TangleList}, are used to determine the similarity of the pairs of postures. Using our method, we can index and retrieve motions such as one person piggy-backing another, one person assisting another in walking, and two persons dancing / wrestling. Our method is useful to manage a motion database of multiple characters. We can also produce motion graph structures of two characters closely interacting with each other by interpolating and concatenating topologically similar postures and motion clips, which are applicable to 3D computer games and computer animation.  相似文献   

13.
谢锐  郝志峰  刘波  徐圣兵 《计算机应用》2018,38(6):1698-1702
针对基于节点相似性的链接关系预测中因未考虑非对称信息导致预测准确度降低的问题,提出一种新的增加非对称信息的节点相似性度量方法。首先,分析了基于共同邻居(CN)的相似性度量算法的缺陷在于仅考虑CN的数量而未考虑各自节点的所有邻居的数量;然后,将节点之间的相似性度量定义为共同节点与所有邻居节点的比值,融合节点间对称相似信息和非对称相似信息,对节点间的相似程度进行深入细致的刻画;最后,将该方法应用到复杂网络中进行链接关系的预测。在真实数据集上的实验结果表明,与目前多种基于共邻的相似性度量方法——CN、AA、资源分配(RA)相比,所提方法提升了节点相似性度量的准确性,并且可以提高复杂网络中链接关系预测的准确度。  相似文献   

14.
字符串近似匹配在网络安全中有广泛的应用。本文从中文字符串相似度角度出发,提出了通过单个汉字的细分来提高字符相似度的想法,并从汉字"成簇性"方面进行分析,引出了汉字的Key表示方法,将汉字与Key的映射关系归结为规则,讨论了规则的获取方法。设计了基于规则的中文字符串近似匹配的框架,提出了新的相似度计算模型,并通过实验对整个流程加以验证,证明基于规则的中文字符串近似匹配的优越性。  相似文献   

15.
基于海明距离的直觉模糊粗糙集相似度量方法   总被引:1,自引:0,他引:1  
针对直觉模糊粗糙集的相似度量问题,提出了一种基于海明距离的直觉模糊粗糙集相似度量方法。首先给出了两个直觉模糊粗糙值问的相似度量方法,并揭示了它的若干重要性质。然后,在此基础上,又提出了一种基于海明距离的直觉模糊粗糙集相似度量方法,并证明它也具有同样的性质。最后用数值算例验证了这种方法的有效性。  相似文献   

16.
为了解决安全数码卡(SD卡,secure digital card)表面字符人工验证效率差、准确率低的问题,提出了一种基于中心化Jaccard匹配的SD卡光学字符验证方法,能够实现SD卡表面字符的精密检测与自动验证。首先,提出了一种基于HSV三通道直方图分析的快速验证方法,实现特征显著SD卡图像的准确验证;其次,针对SD卡字符验证精度受光照变化和微小旋转影响的问题,提取V通道图像和变化角度特征,提高HOG特征对光照和旋转变化的抵抗能力;最后,针对相似SD卡字符的验证问题,提出了一种中心化广义Jaccard系数,增强了相似度指标的辨别力,实现了特征相似图像的精密检测。以实际场景采集的数据对所提方法进行验证分析,试验结果表明,该算法准确率达到99.15%,具有很好的实用性和鲁棒性。  相似文献   

17.
应用主动业务探测模式和被动测量相结合的方法测量IPv6F的DNS,从用户感知角度反映DNS业务的性能状况,克服了传统DNS测量侧重于DNS服务器或DNS分布式系统性能的局限性。在此基础上开发出测量工具dnsScape,实现了对IPv6下DNS业务的有效监测。  相似文献   

18.
基于模糊簇的个性化推荐方法   总被引:3,自引:0,他引:3  
提出了一种运用模糊聚类方法将项目属性特征的相似性与协同过滤推荐算法相融合的推荐方法,此方法将用户对单个项目的偏好转化为对相似群组的偏好,目的是构造密集的用户-模糊簇的偏好信息,同时利用项目之间在相似群组的相似性来初步预测用户对未评价项目的评分,在此基础之上再完成基于用户的协同过滤推荐算法。实验结果表明,该方法确实可提高协同过滤推荐算法的推荐精度。  相似文献   

19.
一种新颖的汉字字形相似度计算方法   总被引:1,自引:0,他引:1  
为了利用字形描述技术识别相似汉字, 提出了三元组递归表示的汉字字形相似度计算方法。该算法把汉字表示为汉字结构、字首部件和字尾部件三元组, 以部件为运算对象, 字型结构为运算符, 将汉字描述为前缀表达式。通过建立汉字字形相似度计算递归模型, 使计算过程被逐层分解为原子部件间的相似性比较, 从而更好地降低了计算的复杂性。然后将其用于计算汉字的最佳相似字。实验结果表明, 该方法与人的认知结果吻合度很好, 算法是有效可行的。  相似文献   

20.
刘建明  史一民  张俊  陈存衡 《计算机工程》2013,39(3):223-228,235
在资源描述框架(RDF)图的语义相似性度量过程中,结构相似性和语义相似性计算不精确。针对该问题,提出结构语义(SAS)方法。结合改进的基于网络距离模型的语义距离公式、基于信息量模型的权重度量机制,计算概念节点的语义相似度,完善RDF图语义相似度算法,分析结构、深度和密度对RDF图语义相似性度量的影响。设计并实现原型系统,实验结果表明,该方法可有效保证RDF图的语义相似度与实际相符。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号