排序方式: 共有30条查询结果,搜索用时 15 毫秒
1.
针对朴素贝叶斯算法应用于反垃圾邮件过滤时,其有效性十分依赖于对邮件内容的有效建模,而邮件内容建模方面研究尚不成熟限制了贝叶斯方法在垃圾邮件过滤中的性能.采用了三种概率分布对邮件内容进行建模,据此提出了3种概率分布下的朴素贝叶斯算法.为了提高训练效率,算法采用了一种增量式的垃圾邮件过滤方法.在trec05p-1、trec06p两个公开数据集上对这3种贝叶斯算法进行了实验对比,分析出三种贝叶斯分布的适用范围.从不同分布的邮件内容建模角度出发,为过滤垃圾邮件的方法选择提供了有效依据. 相似文献
2.
经过数十年的发展语音识别取得了长足进步,但各种语音识别系统的性能仍然难以满足现实应用的需求.造成这种情况的一个重要原因在于目前的系统仍然难以适应各种噪声环境.因此,增强语音识别系统的噪声鲁棒性是推动其走向现实应用的关键.系统地阐述了特征增强类方法的国内外研究现状,介绍了信号增强、从听觉层面或可区分层面的提取特征、特征归正和特征补偿等方法,分析了他们存在的局限性.在此基础上,分析了稀疏编码与语音特征增强的基本问题和研究现状,提出了稀疏编码在语音特征增强方面的需要解决的问题,为从事鲁棒语音识别的研究者提供参考. 相似文献
3.
如何在视角对齐关系错位时有效进行非对齐多视角学习是一类新的挑战性问题。针对这一问题,提出面向视角非对齐数据的多视角聚类方法。一方面,为了捕获多视角异构特征的跨视角相似度信息,基于多视角非负矩阵分解进行表示学习,将原始特征嵌入一个可度量的低维同构空间。另一方面,在低维同构空间中,以二部图最优匹配模型建模视角对齐关系,并提出参考视角概念将模型推广至多视角情形。将表示学习和视角对齐关系学习整合到统一的Bi-level优化框架,使其在迭代中相互促进,进一步提高模型对视角非对齐数据的学习能力。在视角非对齐数据聚类应用上的大量实验结果表明,相比于8种先进的多视角聚类方法,所提方法在3个数据集上的多项性能指标均取得了较优的性能。 相似文献
4.
特征子空间学习是图像识别及分类任务的关键技术之一,传统的特征子空间学习模型面临两个主要的问题。一方面是如何使样本在投影到特征空间后有效地保持其局部结构和判别性。另一方面是当样本含噪时传统学习模型所发生的失效问题。针对上述两个问题,该文提出一种基于低秩表示(LRR)的判别特征子空间学习模型,该模型的主要贡献包括:通过低秩表示探究样本的局部结构,并利用表示系数作为样本在投影空间的相似性约束,使投影子空间能够更好地保持样本的局部近邻关系;为提高模型的抗噪能力,构造了一种利用低秩重构样本的判别特征学习约束项,同时增强模型的判别性和鲁棒性;设计了一种基于交替优化技术的迭代数值求解方案来保证算法的收敛性。该文在多个视觉数据集上进行分类任务的对比实验,实验结果表明所提算法在分类准确度和鲁棒性方面均优于传统特征学习方法。 相似文献
5.
6.
为解决绝大多数研究未充分考虑位置对隐私预算的敏感程度以及轨迹形状带来的影响,使发布的轨迹可用性较差的问题,提出了基于相对熵和K-means的形状相似差分隐私轨迹保护机制。首先,根据地理空间的拓扑关系,利用相对熵计算真实位置对隐私预算的敏感程度,设计了位置敏感的隐私级别实时计算算法,并与差分隐私预算结合建立了一个新的隐私模型。其次,通过K-means算法对发布位置进行聚类,得到与真实位置方向最相似的发布位置集合,并引入Fréchet距离衡量发布轨迹与真实轨迹的相似性,提升发布轨迹的可用性。通过对真实数据集的实验表明,所提轨迹保护机制与其他方法相比在轨迹可用性方面有明显的优势。 相似文献
7.
8.
认知网络是解决复杂异构网络系统自我管理的一个新途径,其模型与分析方法研究是亟待解决的关键问题.提出一种基于多元π演算的认知网络形式化建模方法,首先分析认知网络的基本特征,然后结合认知问题本质,构建认知网络理论参考模型,并将多元π演算为描述语言建立认知网络系统形式化模型,把自感知、上下文感知和动作调用的过程抽象成一系列进程,利用进程动作及其运算分别严格地刻画认知单元和系统全局认知过程,最后以自配置为例说明了模型应用.该方法以逻辑精确性为特色,能够应用于系统实现的任何阶段,为认知网络的设计提供理论指导. 相似文献
9.
现有多视角图学习方法主要建立在数据具有较好完备性的前提假设下,没有充分地考虑由于特征缺失引起的不完备数据的学习问题.针对此问题,提出一种不完备数据的多视角图学习方法.一方面,从局部视角内将数据重建和图学习放入同一框架,通过不完备数据补偿,实现从重建数据中学习视角专属的近邻关系,弥补特征缺失对数据分布的影响.另一方面,为了保持近邻图的二维结构,引入张量分析,从全局角度构造基于多视角的融合图学习约束,捕获缺失数据下视角间图结构的高阶潜在关联性.框架交替的优化数据重建、视角专属图学习和融合张量图结构学习,使其在迭代中相互促进,有效提高模型对不完备多视角数据的学习能力.将所提出的方法应用于两类不完备数据的多视角聚类实验,其结果表明所提出方法在多项性能指标和鲁棒性方面均优于当前主流的多视角聚类方法. 相似文献
10.
为了解决中文组块分析精度不高和未利用词的语义信息的问题,提出了一种基于条件随机域模型和语义类的中文组块分析方法.该方法通过研究中文组块分析任务及其序列化特性,采用条件随机域模型融合不同类型特征,克服标记偏置问题,将语义词典中抽取的语义类特征应用到中文组块分析中,提高分析精度.实验表明,该方法取得了F值为92.77%的中... 相似文献