首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
为提供准确且更贴近日常用语的关键词,针对视频弹幕内容提出一种基于TI-RANK(TTF-ICDF-DWText Rank)的词频词义相结合的关键词提取模型。将标题内容进行分类得到标题的关键信息,将该信息用于词频提取构建TTF算法;进一步考虑词频与篇章数对提取效果的影响,通过分段函数构建ICDF算法;引入语义维度信息并利用中文拼音作为编辑距离的计算单元构建DWText Rank模型。实验结果表明,TI-RANK模型提取关键词的F1值达到0.8以上,相较传统TF-IDF和Text Rank算法提高了约20%。为更合理评价关键词提取的准确率,按照关键词重要程度降序排列定义三级梯度评价标准,该标准能够更好体现出排序靠前关键词的正确性对准确率的影响。  相似文献   

2.
语言作为交流最基本的方式,在民族的发展过程中起着举足轻重的作用.哈萨克语作为语言的一种,对哈萨克民族的发展起着其应有的作用.但是由于历史的原因,哈萨克语在世界范围内形成了基于同一语言的两种文字形式这种特殊情况.这两种文字形式分别是以阿拉伯文字母为基础的哈萨克阿拉伯文字和以斯拉夫文字母为基础的哈萨克斯拉夫文字.这种特例,为哈萨克族科学技术的发展和文化的交流带来了不便,因此开发和完善哈萨克语这两种文字形式之间的计算机转换系统具有重要意义.本文将介绍用C#编写的哈萨克语的两种文字形式间的计算机自动转换程序,采用机器翻译的方法并在Windows环境下实现哈萨克语的两种文字形式间的智能转换.  相似文献   

3.
新疆是个多民族聚居的地区,但是支持哈萨克文信息处理的手机却一直都是市场的空白。通过研究哈萨克文手机输入法,哈族用户可以很方便地操作手机的方寸键盘,快速、高效地输入文本信息,实现和家人、朋友的交流与沟通;同时这对发展少数民族地区通讯和经济也有着非常重要的意义。文中结合手机中多种文字输入的基本技术和方法,对哈萨克文手机输入法进行了研究。文章首先介绍了哈萨克语言的特点、手机输入法设计中的关键技术和根据哈萨克文的特征设计的哈萨克文手机键盘,接下来研究了词频的动态调整和词库的动态更新,并给出了实现其关键模块功能的程序流程图,最终实现了支持哈文和数字混合显示的智能手机输入法。  相似文献   

4.
针对传统使用频数挖掘热点关键词不能保证有效完整地挖掘出数据库中的热点关键词,提出基于项目、专家对应的关键词数据,分析不同项目关键词之间的相关度,从而建立项目与专家网络关系。其创新点在于用双层结构来连接专家、网络、关键词,计算关键词的热度值,挖掘出热点关键词及热点项目。实验结果表明,该方法更能准确地挖掘出项目中的热点关键词,避免了单纯频数计算热点关键词带来的片面化问题。  相似文献   

5.
语言资源库是对各种语言信息进行深入研究的重要语料基础,阐述了哈萨克文语言资源库的研究和设计思路,介绍了语言资源库系统的总体框架、基本结构、功能模块以及实现方法等若干问题.  相似文献   

6.
针对英文短文本的内容精悍、格式多变的特点,提出了基于多线程多重因子加权的文本关键词提取算法.该算法利用词频-逆向文档频率(TF-IDF)算法计算文本集中单词的词频因子,及代表单词出现位置、长度和同现关系的位置因子、词长因子和同现因子,采用基于Future模式多线程并发计算4个因子的权值.再计算单词的4个因子累积权值并排序提取关键词.实验结果表明,基于多线程多重因子加权的关键词提取算法能够有效提高短文本关键词提取的准确率和召回率.  相似文献   

7.
OpenType字形技术研究与哈萨克文字库设计   总被引:1,自引:1,他引:0  
在研究了OpenType字形技术基础上,结合哈萨克文字变形显现特点,总结出了哈萨克文字组合规律及变形显现替换规则,编写了哈萨克文OpenType字形描述脚本,通过连字替换表(SUB)和字型置位表(GPOS)控制实现哈萨克文字连字替换和字符复合,利用字模编辑软件与脚本编辑软件生成哈萨克文OpenType字库.经在WindowsXP等操作系统上安装测试,字形变形及组合完全符合哈萨克文文字变形规范.  相似文献   

8.
该文介绍了哈萨克文专用字母的特殊书写习惯,以及哈萨克文编码字符处理现状。指出当前广泛使用的字母替换法不符合国际和国家相关标准,并且会导致哈萨克文排序错误,增加文字转换、语音合成等功能的实现难度。为解决上述不足,对字母替换法进行了三个改进,包括用专用字母与符号“”结合表示它们自己;专用字母各种书写形式带符号的字形中,仅将独立字符形式带符号“”的字形包含在OpenType字体中;用字形替换规则识别专用字母与哈萨克文字母不相邻的上下文环境。为便于改进方法的应用,该文介绍了与改进方法一致的OpenType字体字形替换规则设置方法。  相似文献   

9.
目前,对少数民族语言信息检索的研究处于初步阶段,创建一个高查准率和查全率的哈萨克文信息检索平台是十分必要的。该文对哈萨克文的语法和构词进行分析,介绍哈萨克文检索停用词表统计的几种方法。  相似文献   

10.
通过信息领域术语的规范化及翻译、文字输入法原则和键盘布局、语料库建设与语料管理、机器翻译以及文字转换等方面的信息化建设的现状和进展为例,就目前开发和研究哈萨克文信息处理中存在的若干问题进行探讨.  相似文献   

11.
噪声数据在一定程度上影响了网络断层扫描的准确性。针对之前网络断层扫描方法大都忽略噪声影响的不足,提出SAK算法。基于卡茨马尔兹算法和SA算法的SAK算法更具有一般性和实时性,SAK算法模仿了原始Kaczmarz算法的特性。实验结果显示,通过用SAK算法处理估计的初始值,使其估计值能够收敛到真实值,在很大程度上能达到去除噪声的目的。  相似文献   

12.
基于粗糙集的神经网络建模方法研究   总被引:29,自引:0,他引:29  
提出了一种基于粗糙集的神经网络模型,该方法利用粗糙集数据分析方法,从数据中提取出规则将输入映射到输出的子空间上,而后在这个子空间上用神经网络进行逼近.利用这种方法对岩石边坡工程中边坡稳定性进行分析建模,并和传统的神经网络建模方法进行比较,说明了该方法的有效性.  相似文献   

13.
传统的TextRank算法进行关键词提取时词语之间的连接边采用权值均分的形式进行加权,未考虑词语的语义信息。针对这种情况,提出结合拓扑势与TextRank算法的关键词提取方法。方法使用词频和词语在文中的分布情况对词语加权作为词语的全局影响;使用拓扑势的思想结合词语全局影响计算词语间的转移概率作为词语的局部影响;将转移概率矩阵应用于传统TextRank算法中。实验表明,考虑词语全局及局部重要性等语义信息可有效提升TextRank算法的准确率和召回率。  相似文献   

14.
使用仿射变换网络对遥感图像进行空间变换,批量生成训练图像,将特征提取和匹配放在卷积神经网络的端到端架构中,直接预测仿射变换参数;通过采用校正网络对卷积神经网络的结果进行改进,实现遥感图像更加精确的配准.通过与SIFT算法、SURF算法和其他深度学习方法相比,该方法对遥感图像配准的速度和精度均有显著提升.  相似文献   

15.
为从车辆复杂噪声背景下实时提取双轴倾角计的有效信号,在分析弱信号特征提取方法的基础上,针对LMS算法在处理相关信号时收敛速度降低的缺点,提出一种对噪声敏感度较低的变步长LMS算法,基于FPGA平台设计实现一种采用一阶滤波单元重用方式实现多阶LMS滤波器的可扩展滤波器结构.试验首先通过收敛速度评价指标验证算法的优越性;其次利用滤波后的双轴倾角计信号的频谱分析证明算法对其自身噪声与车载环境噪声有较好抑制;最后对比5种不同硬件平台实现结果的差异,试验表明FPGA实现方案在执行时间、功耗和硬件占用率方面具有明显的优势.  相似文献   

16.
针对如何提高基于统计的哈萨克语句法分析算法的处理性能问题,提出一种通过人机交互来构建哈萨克语树库的方法。在自动句法标注阶段,采用层叠条件随机场模型实现,并在其低层与高层模型之间加入改进的基于转换的错误驱动学习算法来进行简单句的自动句法标注及自动校正。最后对特殊的整体标记错误进行人工校对,形成基于短语结构的哈萨克语树库。实验结果表明,该方法在很大程度上减少了人力及物力的投入,提高了分析精度及整体处理效率,并为后期基于哈萨克语的句法机器翻译及文本挖掘奠定了一定的基础。  相似文献   

17.
词性标注在自然语言信息处理领域中扮演着重要角色,是句法分析、信息抽取、机器翻译等自然语言处理的基础,对于哈萨克语同样如此。在基于词典静态标注的基础上分析了隐马尔科夫模型HMM(H idden M arkovModel)模型参数的选取、数据平滑以及未登录词的处理方法,利用基于统计的方法对哈萨克语熟语料进行训练,然后用V iterb i算法实现词性标注。实验结果表明利用HMM进行词性标注的准确率有所提高。  相似文献   

18.
服务可扩展性是网络研究中一种非常重要的属性,它的优劣决定着网络系统未来的可用性。综合现有的网络服务可扩展性及其分析方法所面临的问题,用统一的描述方式将不同的网络系统的服务行为抽象为服务拓扑模型,用统一的评价模型进行服务可扩展性分析,以便能够对不同的网络系统进行比较全面而正确的可扩展性评价。利用该可扩展性分析方法对网络路由系统进行实验建模,使用NS2对实验模型进行仿真实验,验证其适用性和优越性,为进一步研究新型网络及其扩展性提供可靠依据。  相似文献   

19.
模糊神经网络技术的新近发展   总被引:33,自引:0,他引:33  
本文从模糊系统与神经网络作为自适应模型无关估计器时智能特性的研究,模糊控制器的神经网络实现技术,改善神经网络学习性能的模糊控制技术,面向对象的模糊神经网络开发平台的研究等方面介绍了模糊神经网络技术的研究现状,并针对目前的模糊逻辑,神经网络,子波变换,遗传算法等的集成化技术进行了探讨,并融入了作者关于定性与定量知识有机集成的柔性核理论的基本思想。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号