共查询到20条相似文献,搜索用时 234 毫秒
1.
近年来,僵尸网络、域名挟持、钓鱼网站等仿冒域名攻击越发频繁,严重威胁着社会和个人的安全,因此仿冒域名检测已经成为网络防护的重要组成部分。当前的仿冒域名检测主要面向公共域名,检测方法以编辑距离为主,难以充分体现域名的视觉特征;此外利用域名相关信息进行判定虽然有助于提高检测效率,却会引入较大的额外开销。为此,考虑采用仅基于域名字符串的轻量级检测策略,并综合考虑字符位置、字符相似度和操作类型对域名视觉的影响,提出基于视觉特征的编辑距离算法。该算法根据仿冒域名的特点,先对域名进行预处理,然后按照字符位置、字符相似度及操作类型对字符赋予不同的权重,最后通过计算编辑距离值进行仿冒域名判定。实验结果表明,基于视觉特征的仿冒域名轻量级检测方法与基于编辑距离的判定方法相比,在阈值取1和2时,F1值分别提高了5.98%和13.56%,验证了该方法具有良好的检测效果。 相似文献
2.
僵尸网络广泛采用域名生成算法(Domain Generation Algorithm,DGA)生成大量的随机域名来躲避检测。针对僵尸网络DGA域名问题,本文设计实现了一种DGA域名检测系统。首先使用基于随机森林算法的轻量级分类分析检测模块,通过分析域名字符特征区分正常域名与疑似恶意域名,满足现网实际应用中快速检测的要求;然后使用基于X-means算法的聚类分析检测模块,在分类分析检测的基础上,根据DGA域名的字符相似性和查询行为相似性,通过聚类和集合分析方法对疑似恶意域名进一步检测,降低系统误检率。通过部署基于Spark的检测系统对某运营商现网真实DNS日志数据进行连续20天的处理和分析,检测系统平均每天挖掘出约250万DGA域名,经过正则匹配分析,其中约55%属于5类已知的DGA;在前两个实验日,共发现13,000个已知DGA域名分属于3个DGA类别。实验结果表明检测系统可有效检测出多种DGA域名,此外,检测系统也可满足现网实际应用中快速检测的要求。 相似文献
3.
已有DGA检测方法已经获得了较高的检测精度,但在缩略域名上存在误报率高的问题。主要原因是缩略域名字符间随机性高,现有检测方法从随机性角度很难有效地区分缩略域名和DGA域名。在分析了缩略域名的字符特性后,基于自注意力机制实现了域名字符依赖性的检测;并采用LSTM改进了Transformer模型的编码方式,以更好地捕获域名中字符位置信息;基于Transformer模型构建了DGA域名检测方法(MHA)。实验结果表明,MHA可以有效地区分出DGA域名和缩略域名,得到了更高的精确率和更低的误报率。 相似文献
4.
设计了根据车牌的彩色特征对车牌位置进行粗定位,再利用车牌字符二值化特征来精确定位的双重车牌定位方法。在中值滤波和二值化等预处理后,提取出车牌中的字母和数字字符并建立相应的模板,通过字符归一化在NIOSII中采用最大相似度算法较好的识别了车牌号码。实验结果表明,该方法具有良好的实时性和较高的识别率。 相似文献
5.
针对已分割完成的啤酒瓶凸性字符,提出了一种基于圆周投影变换的图像特征提取方法。以质心为极点将笛卡尔坐标系变换为极坐标系,进行圆周投影计算,将二维的字符图像变换为一维投影。利用小波变换(WT)和离散余弦变换(DCT),提取不同字符的有效特征。通过相同、相似字符特征提取实验,表明该方法具有较好的抗噪声能力和分类性能。 相似文献
6.
7.
8.
9.
网络流量中包含的域名数据给网络流量共享带来数据隐私的挑战。现有对域名的匿名化处理方法多采用文本泛化和替换等手段,隐私性处理效果较好,但破坏了域名原有的结构和文本特性,无法满足网络安全分析场景的需求。文章提出一种面向网络安全分析的域名匿名化方法,通过基于域名结构的分层匿名处理策略和基于字符空间构造的匿名化算法,在保留网络安全分析过程中所关注的域名结构和文本属性特征的前提下对域名文本进行重构,实现既保留研究人员所需的域名数据可用性,又去除域名数据中的隐私信息的目的。为抵御穷举攻击,文章采取按参数随机重构的方式,以减少不同批次下相同域名匿名结果发生重复的概率,并基于校园网真实网络流量数据对提出的方法进行了验证。实验结果表明,文章提出的方法能够有效提升匿名化后域名数据的不可识别和不可逆的特性,并保留其在结构和语义方面的效用。 相似文献
10.
张美璟 《数字社区&智能家居》2010,(3):701-702
字符分割技术是车牌识别系统的关键技术之一。字符分割最主要的问题是字符粘连及车牌边框的影响。鉴于车牌字符具有布局规整,字符个数确定,字符大小一致、宽高存在规律等特征,文章提出一种将投影和字符间距相结合的基于字符综合特征的字符分割算法。实验证明该算法那对分割粘连字符具有较好效果。 相似文献
11.
该文提出了一种字形相似度计算方法,旨在解决汉字中相似字形(称作形似字)的识别和查找问题。首先,提出了汉字拆分方法,并构建了偏旁部首知识图谱;然后,基于图谱和汉字的结构特点,提出2CTransE模型,学习汉字实体语义信息的表示;最后,将输出的实体向量用于汉字字形的相似度计算,得到目标汉字的形似字候选集。实验结果表明,该文所提出的方法对于不同结构汉字的字形相似度计算有一定效果,所形成的汉字部件组成库,为之后字形计算的相关研究提供了行之有效的数据集。同时,也拓宽了日语等类汉语语言文字字体相似度计算的研究思路。 相似文献
12.
Ho Edmond S.L. Komura Taku 《IEEE transactions on visualization and computer graphics》2009,15(3):481-492
Human motion indexing and retrieval are important for animators due to the need to search for motions in the database which can be blended and concatenated. Most of the previous researches of human motion indexing and retrieval compute the Euclidean distance of joint angles or joint positions. Such approaches are difficult to apply for cases in which multiple characters are closely interacting with each other, as the relationships of the characters are not encoded in the representation. In this research, we propose a topology-based approach to index the motions of two human characters in close contact. We compute and encode how the two bodies are tangled based on the concept of rational tangles. The encoded relationships, which we define as {it TangleList}, are used to determine the similarity of the pairs of postures. Using our method, we can index and retrieve motions such as one person piggy-backing another, one person assisting another in walking, and two persons dancing / wrestling. Our method is useful to manage a motion database of multiple characters. We can also produce motion graph structures of two characters closely interacting with each other by interpolating and concatenating topologically similar postures and motion clips, which are applicable to 3D computer games and computer animation. 相似文献
13.
针对基于节点相似性的链接关系预测中因未考虑非对称信息导致预测准确度降低的问题,提出一种新的增加非对称信息的节点相似性度量方法。首先,分析了基于共同邻居(CN)的相似性度量算法的缺陷在于仅考虑CN的数量而未考虑各自节点的所有邻居的数量;然后,将节点之间的相似性度量定义为共同节点与所有邻居节点的比值,融合节点间对称相似信息和非对称相似信息,对节点间的相似程度进行深入细致的刻画;最后,将该方法应用到复杂网络中进行链接关系的预测。在真实数据集上的实验结果表明,与目前多种基于共邻的相似性度量方法——CN、AA、资源分配(RA)相比,所提方法提升了节点相似性度量的准确性,并且可以提高复杂网络中链接关系预测的准确度。 相似文献
14.
王静婷 《网络安全技术与应用》2010,(12):41-44,40
字符串近似匹配在网络安全中有广泛的应用。本文从中文字符串相似度角度出发,提出了通过单个汉字的细分来提高字符相似度的想法,并从汉字"成簇性"方面进行分析,引出了汉字的Key表示方法,将汉字与Key的映射关系归结为规则,讨论了规则的获取方法。设计了基于规则的中文字符串近似匹配的框架,提出了新的相似度计算模型,并通过实验对整个流程加以验证,证明基于规则的中文字符串近似匹配的优越性。 相似文献
15.
基于海明距离的直觉模糊粗糙集相似度量方法 总被引:1,自引:0,他引:1
针对直觉模糊粗糙集的相似度量问题,提出了一种基于海明距离的直觉模糊粗糙集相似度量方法。首先给出了两个直觉模糊粗糙值问的相似度量方法,并揭示了它的若干重要性质。然后,在此基础上,又提出了一种基于海明距离的直觉模糊粗糙集相似度量方法,并证明它也具有同样的性质。最后用数值算例验证了这种方法的有效性。 相似文献
16.
为了解决安全数码卡(SD卡,secure digital card)表面字符人工验证效率差、准确率低的问题,提出了一种基于中心化Jaccard匹配的SD卡光学字符验证方法,能够实现SD卡表面字符的精密检测与自动验证。首先,提出了一种基于HSV三通道直方图分析的快速验证方法,实现特征显著SD卡图像的准确验证;其次,针对SD卡字符验证精度受光照变化和微小旋转影响的问题,提取V通道图像和变化角度特征,提高HOG特征对光照和旋转变化的抵抗能力;最后,针对相似SD卡字符的验证问题,提出了一种中心化广义Jaccard系数,增强了相似度指标的辨别力,实现了特征相似图像的精密检测。以实际场景采集的数据对所提方法进行验证分析,试验结果表明,该算法准确率达到99.15%,具有很好的实用性和鲁棒性。 相似文献
17.
18.
19.
一种新颖的汉字字形相似度计算方法 总被引:1,自引:0,他引:1
为了利用字形描述技术识别相似汉字, 提出了三元组递归表示的汉字字形相似度计算方法。该算法把汉字表示为汉字结构、字首部件和字尾部件三元组, 以部件为运算对象, 字型结构为运算符, 将汉字描述为前缀表达式。通过建立汉字字形相似度计算递归模型, 使计算过程被逐层分解为原子部件间的相似性比较, 从而更好地降低了计算的复杂性。然后将其用于计算汉字的最佳相似字。实验结果表明, 该方法与人的认知结果吻合度很好, 算法是有效可行的。 相似文献