首页 | 官方网站   微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   6篇
  完全免费   2篇
工业技术   8篇
  2012年   1篇
  2011年   2篇
  2008年   1篇
  2007年   2篇
  2005年   1篇
  2003年   1篇
排序方式: 共有8条查询结果,搜索用时 31 毫秒
1
1.
一种中文分词词典新机制--双字哈希机制   总被引:40,自引:2,他引:38  
汉语自动分词是汉语信息处理的前提,词典是汉语自动分词的基础,分词词典机制的优劣直接影响到中文分词的速度和效率。本文首先分析了分词词典机制在中文分词中的重要性及已有的三种典型词典机制,并在此基础上根据汉语中双字词语较多的特点提出了一种新的分词词典机制——双字哈希机制,在不提升已有典型词典机制空间复杂度与维护复杂度的情况下,提高了中文分词的速度和效率。  相似文献   
2.
一种基于大规模语料的新词识别方法   总被引:1,自引:0,他引:1       下载免费PDF全文
提出了一种基于大规模语料的新词识别方法,在重复串统计的基础上,结合分析不同串的外部环境和内部构成,依次判断上下文邻接种类,首尾单字位置成词概率以及双字耦合度等语言特征,分别过滤得到新词。通过在不同规模的语料上实验发现,此方法可行有效,能够应用到词典编撰,术语提取等领域。  相似文献   
3.
BM算法是一类效率较高的单模式匹配算法,通常改进的BM算法往往从提高字符首次不匹配概率和匹配窗口的最大移动距离入手,但为实现此目的所带来的高访存开销使算法实际效率受到影响。DCSBM算法以适当减小关键步长为代价,在利用双字符序检测提高首次匹配失败概率的同时,对匹配窗口移动关键步长字符距离所需的查表次数和访存次数进行优化。经测试,DCSBM算法显著提高了匹配窗口的平均移动距离。在文本或模式串相对较长情况下,该算法实际测试效率优于BM、BMHS、BMN等算法。  相似文献   
4.
强噪声中的未知非线性调频信号检测一直是实际检测领域中的一个难点问题.非线性调频信号的相位历史是关于时间的未知平滑函数,并且该函数不能或者很难用少量参数来建模.由于相位模型的缺失,我们提出一种基于接连分数阶Fourier变换和双特征检测的非参数化检测方法.检测方案包含3部分:首先,计算一个周期内接连角度的分数阶Fourier变换,将这些不同角度的变换结果构造成二维图像;然后,利用硬阈值处理获得二值图像,并利用多重中值滤波来去除该二值图像中的孤立噪声点,从而获得精炼的二值图像;最后,根据精炼图像提取2个互补的检测统计量,并通过双特征检测器判决目标是否存在.本文针对3类不同阶的多项式相位信号以及正弦相位信号的对比实验结果表明,提出的方法是有效且鲁棒的,并且获得了满意的检测性能.  相似文献   
5.
In many practical applications,signals to be detected are unknown nonlinear frequency modulated (FM)and are corrupted by strong noise.The phase histories of the nonlinear FM signals are assumed to be unknown smooth functions of time,which are usually poorly modeled or cannot be modeled at all by a small number of parameters.Because of the lack of phase model,a nonparametric detection method is proposed based on successive fractional Fourier transform and double-characters detection.The detection process goe...  相似文献   
6.
一种基于Lucene的影片搜索引擎的研究和应用   总被引:1,自引:0,他引:1       下载免费PDF全文
Lucene是一个优秀的开源搜索引擎框架,已经广泛应用于信息搜索领域。分析点播门户中现有的搜索引擎存在的不足,设计一种基于双字哈希算法支持中文的分词器,并利用该分词器和Lucene工具包,设计并实现了一个视频点播影片快速搜索引擎,它不仅支持中文检索,还具有搜索速度快、易于扩展等优点。仿真实验证明提出的基于Lucene的影片搜索引擎具有良好的性能。  相似文献   
7.
王思力  王斌 《中文信息学报》2007,21(5):14-17,30
本文提出了一种利用双字耦合度和t-测试差解决中文分词中交叉歧义的方法:首先利用词典找出所有的交叉歧义,然后用双字耦合度和t-测试差的线性叠加值来判断各歧义位置是否该切分。实验结果表明,双字耦合度和t-测试差的结合要优于互信息和t-测试差的结合,因此,用双字耦合度和t-测试差的线性叠加值来消除交叉歧义是一种简单有效的方法。  相似文献   
8.
张四维  齐康 《新建筑》2005,(4):49-51
通过介绍广东东莞市东江纵队纪念馆的设计思考过程,提出纪念性建筑构思应植根于历史,从具体遗存环境中取得灵感并反映其内在气质。同时,设计中高度关注形体空间的使用。  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号