首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 140 毫秒
1.
张磊  褚昆  郭黎利 《应用科技》2009,36(4):28-31
针对二元模型,提出了一种基于互信息的回退(MI Back-off)平滑算法.从互信息的角度,分析词之间的搭配关系,根据模型中每个二元对的互信息对其概率进行不同程度的折扣,并利用低阶模型对零概率事件进行补偿,通过极小化困惑度的原则体现新算法的合理性.在不同类别测试集下,该平滑算法与传统Katz平滑算法相比,模型困惑度下降均超过20%。  相似文献   

2.
数据平滑技术主要是用来解决统计语言模型在实际应用中数据稀疏问题,它是语言建模的核心技术,Katz平滑方法是应用最广泛的方法之一.本文对Katz平滑算法作了改进,使之应用于trigger对的平滑,并在汉语-蒙古语机器翻译系统实现了该算法,实验结果表明该技术可以提高翻译效果.  相似文献   

3.
以深度学习为代表的人工智能技术迅速发展,庞大的数据、模型,更大的计算量和更复杂的计算都对模型的执行提出了挑战.在实际应用中,资源和应用的动态特征以及用户的动态需求,需要模型执行的动态性来保证.而稀疏化是在资源受限、用户需求调整情况下动态模型的执行重要手段.目前主流的稀疏化技术主要是针对特定问题的稀疏化,且针对推理的多,针对训练的少,缺乏在训练执行阶段进行动态调整和稀疏化的手段.本文在对深度学习领域的基本计算单元进行可稀疏性分析的基础上,进一步分析了模型执行的不同层面、不同组成部分的稀疏化能力;经过对动态需求、模型稀疏化策略的建模后,提出了基于动态指导的深度学习模型稀疏化执行方法,并进行了基本实验;最后从量化建模与量化实验的角度对今后的研究工作提出了展望.  相似文献   

4.
深度神经网络技术在汉语语音识别声学建模中的优化策略   总被引:1,自引:1,他引:0  
将深度神经网络作为声学模型引入面向汉语电话自然口语交谈语音识别系统。针对自然口语中识别字错误率较高的问题,从语音的声学特征类型选择、模型训练时元参数调节以及改善模型泛化能力等方面出发,对基于深度神经网络的声学模型建模技术进行了一系列的优化。针对训练样本中状态先验概率分布稀疏的情况,提出了一种状态先验概率平滑算法,在一定程度上缓解了这种数据稀疏问题,经平滑后,字错误率下降超过1%。在所采用的3个电话自然口语交谈测试集上,相对于优化前的深度神经网络模型,经过优化后的模型取得了性能的一致提升,字错误率平均相对降低15%。实验结果表明,所采用优化策略可以有效地改善深度神经网络声学模型性能。  相似文献   

5.
基于随机游走和聚类平滑的协同过滤推荐算法   总被引:1,自引:0,他引:1  
协同过滤是电子商务推荐系统中被广泛采用的技术,然而数据稀疏性会影响协同过滤的推荐质量.本文针对数据稀疏问题提出一种基于随机游走和聚类平滑的两阶段协同过滤推荐算法.离线阶段:计算项目间相关性,提出了一个新的方法即通过加权累加各步转移概率对项目间相关性进行描述.根据得到的项目相关性矩阵对项目聚类,利用聚类信息对未评分数据进...  相似文献   

6.
从视觉信息解码的层次、数学模型和数据预处理的关键步骤对基于功能磁共振成像数据的神经解码技术进行综述。根据解码的最终目标,将视觉信息的神经解码分为类别(如不同客体类别)与内容解码(如重构被试看到的字母刺激)两个层次。分析了神经解码数学模型中的多体元模式分析技术,将其分为线性与非线性模型两类,其中以线性支持向量机、稀疏性算法应用较多。比较了数据预处理中平滑处理、特征选择与特征空间转换对解码模型的影响,结果表明,结合非平滑处理的基于信息的多变量特征选择方法对解码影响较大。未来的研究重点集中在视觉信息的内容解码,并由二维图像扩展到对三维图像信息的解码。  相似文献   

7.
稀疏表示已被证明是高光谱图像(HSI)分类中的有力工具,同时利用多种特征信息进行联合分类的优点在HSI图像分类领域受到关注,但多特征数据的稀疏策略以及数据的非线性是两个棘手的问题.为此提出了自适应稀疏模式的核联合稀疏模型对高光谱图像进行分类.对于几个互补特征(梯度,文理和形状),该模型同时获取每种特征的表示向量,并且通过施加自适应稀疏策略ladaptive,0来有效利用多特征信息.自适应稀疏策略,不仅限制不同特征空间的像素通过来自特定类的原子表示,而且允许这些像素选定的原子不同,从而提供更好的表示方法.此外,提出的核联合稀疏表示模型用于处理数据的非线性问题.核模型将数据投影到高维空间以提高可分离性,实现比线性模型更好的性能.在数据集Indian Pines和University of Pavia的实验结果表明,所提出的算法表现出更高的分类精度.  相似文献   

8.
研究了带稀疏相关结构的二元复合泊松风险模型的生存概率,利用斯科罗霍德拓扑对二元复合稀疏二项模型的生存概率取极限,得到二元复合稀疏泊松模型生存概率的递推表达式.  相似文献   

9.
陈红梅  周俊祥 《河南科学》2009,27(9):1108-1110
针对profile—profile方法中profile中出现的数据稀疏问题所采用的数据平滑技术以及对于生成排列过程中对于新的计分体系所采用的动态规划算法,并且在HOMSTRAD数据库上进行的排列精度实验,结果证明采用profile—profile方法并结合数据平滑和动态规划技术可以有效地提高查询序列和目标序列的排列精度.  相似文献   

10.
基于信息扩散的稀疏数据插值算法   总被引:3,自引:1,他引:2       下载免费PDF全文
为了解决实际海洋观测资料中存在的零散、稀疏问题,提出了一种基于信息扩散思想的插值方法——正态扩散插值模型。该方法基于模糊映射思想,通过对稀疏数据点的信息进行模糊扩散和插值映射,进而实现有限数据点信息向其邻近区域点的概率插值。运用该算法思想和途径,建立了信息扩散插值正态模型。通过对海温资料的插值试验和对比分析,验证了该方法的合理性和有效性,可为海洋观测资料的客观分析和标准化处理应用提供实用方法和技术参考。  相似文献   

11.
基于多种知识的盲文翻译的研究   总被引:1,自引:0,他引:1  
盲文到汉字的转换研究 ,分为盲文到拼音和拼音到汉字的转换研究。论文通过引入音码表 ,很好地解决了盲文到拼音转换中的歧义问题。对于拼音到汉字的转换 ,采用Markov模型 ,使用平滑算法解决此模型中的数据稀疏问题 ,并且对通常使用的字级别二元模型的平滑算法进行了改进以适应词级别二元模型。为每一个拼音句子建立一个拼音到汉字转换多部图 ,并在此转换多部图中使用 Viterbi算法搜索一条具有最大似然度的汉语句子 ,或使用 N - Best算法搜索具有头 N大似然度的 N个汉语句子。同时研究了从 1选到 N选的转换判据 ,以进行自动的 N - Best转换。实验表明 ,盲文到汉字转换系统的转换正确率为 94.38% ,若剔除专有名词 ,转换正确率还可上升 2个百分点。对 N - Best搜索算法的测试表明 5选正确率比 1选正确率提高了 3个百分点  相似文献   

12.
 求解大型稀疏线性方程组是许多科学和工程计算中最重要的问题之一,Krylov子空间方法是求解这类线性方程组的一个研究热点.本文介绍了Krylov子空间方法及其分类,例如正交投影方法(或Ritz-Galerkin方法),正交化方法(或极小残差方法),双正交化方法(或Petrov-Galerkin方法),解法方程组的CGNE和CGNR方法等,指出了这些方法在算法设计方面国内外研究现状和存在问题,着重考虑稀疏矩阵向量乘积与内积计算方法的并行处理问题;讨论了预条件与并行预条件技术,残差磨光技术及其并行实现,数据的合理分布问题,内积瓶颈问题等方面研究的发展趋势,希望有更多学者了解和研究这些方法.  相似文献   

13.
基于ARMA提出了一个美国人均GDP预测模型,首先对数据进行平稳化处理,然后识别与建立模型.根据模型预测2014年的数据并与真实数据进行比对,实验结果表明该模型能够准确地预测美国人均GDP数值,说明了该模型设计的合理性.进而预测2015—2017年的美国人均GDP的数值.  相似文献   

14.
稳健PCA是从稀疏粗差的测量矩阵中恢复低秩矩阵,在计算机视觉中有许多应用.文中提出一种稳健PCA求解的快速交替方向乘子法,即利用平滑技术对目标函数中非平滑项进行光滑处理,采用快速操作算子改善算法收敛速率.数据仿真和视频背景建模实验表明,文中算法在精度和效率上优于其它算法,适用于大规模问题的有效求解.  相似文献   

15.
提高RBF网络推广能力的一种新方法   总被引:1,自引:0,他引:1  
用RBF网络为非线性映建模,其学习算法对应于求解线性问题,因而学习速度快。然而在样本数据含有加性噪声的情况下,拟合函数会出现迅速振荡,使推广能力受取限制。  相似文献   

16.
考虑出行环境不确定性和出行者有限理性的特点,应用行为经济学中的前景理论分析出行决策行为,引入拥堵收费和票价折扣作为变量,建立改进的出行决策模型。将出行方式划分为公共交通和私人交通两类,引入政府参与管理因素,探讨不同交通需求管理政策干预下出行者的决策行为,通过算例分析了不同政策标准对出行决策行为的影响程度。结果表明:同时引进拥堵收费和票价折扣政策,拥堵收费超过22元时,出行者的决策结果发生改变。合理设置拥堵收费和票价折扣标准可以促进更多出行者选择公共交通出行。  相似文献   

17.
针对在分段线性删失分位数回归模型中的变点问题,该文通过引入光滑化方法得到了变点位置及模型系数的估计,推导了参数估计的大样本性质.光滑化方法解决了在变点估计方法中常用的格点搜索法存在计算烦琐、解释意义不强的问题,弥补了线性化技术无法证明渐近性的不足,提高了估计的有效性和稳健性.蒙特卡罗模拟结果验证了在同方差和异方差、固定和随机删失下在不同分位点时的估计效果都具有有效性和稳健性.药物滥用数据的实证分析表明:复发时间间隔与治疗时间存在正向影响,且复发时间在0.498处存在变点(0.5分位数),治疗时间在0.498之前的复发时间间隔比在0.498之后的更长,即大约前一半时间的治疗更加有效.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号