首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
不良语音识别技术是在高清音视频业务中监测不良信息的有效手段。本文提出了一个基于声学模型的不良语音识别框架。并针对框架中特征提取、声学模型构建、不良语音判定模型三个重要部分的实现方法进行分析描述。并列举了各种方法的优缺点。对构建高效的不良语音识别系统具有较高的参考价值。  相似文献   

2.
随着我国广播事业的不断发展,对广播监测的要求也在不断提高,工作量也越来越大,原有的人工识别为主的工作模式已经无法满足现在的业务需求。广播监测网语音综合处理系统很好地解决了这一问题,将监测工作从人工识别转变为计算机识别,提高了语言和节目的识别率,从而提高了广播监测的工作效率。  相似文献   

3.
针对“黑广播”智能监测技术的研究,本文通过对判断“黑广播”的主要维度进行梳理分析,运用数据库比对和信号特征多维度综合分析,提出了一种基于多属性分析的“黑广播”智能分析方法并结合应用实例进行阐述。基于该方法开发的“黑广播”智能监测平台,可进一步提高异常信号的输出置信度结果,有效提高系统判别准确度。  相似文献   

4.
当前,语音识别、自然语言处理、图像识别、深度学习等为代表的人工智能技术飞速发展,推动着广电行业新技术、新产品、新业态的不断迭代.江苏有线通过融合人工智能及语音识别等技术,聚焦用户痛点,持续创新,建设了一套人工智能语音能力系统,利用智能语音能力为各类传统电视业务赋能.  相似文献   

5.
韩丽丽  潘炜  刘丰威 《电子测试》2020,(15):118-119+95
目前对于客户服务的稽查仍然停留在人工进行录音核查,工单记录核查,由于听读录音的效率远不如直接观看文字来的高效,如何提高效率对客服的质量进行把关,是亟需研究的问题。目前兴起的人工智能技术可以进行图像识别、语音识别、语义识别等,可以较好的解决需要人工进行录音核查的问题。可以很好的用于对于客服的稽查工作中,对于用户的诉求可以较好的识别,同时跟客服人员记录的诉求进行比对,对于相差较大的则可以判定为异常。  相似文献   

6.
“黑广播”查处统计数据是各地无线电管理机构常态化收集的统计数据。本文研究了该统计数据的地域与时间特性,分析了“黑广播”与地理位置、地区常住人口和生产总值、工作监测时长的相关性。通过对“黑广播”查处统计数据周期性、趋势性的分析,总结了引起该数据明显变化的一些因素。  相似文献   

7.
8.
本文论述了基于神经网络模型的非特定人汉语语音识别。我们采用24人(12人用于训练,12人用于测试)的语音数据对汉语十个数字和十个孤立字进行了实验,取得了96.3%(10个数字)和97.2%(十个汉字)的识别率。  相似文献   

9.
10.
分析黑广播具体特点、危害和打击黑广播一般的通行方法,提出一种基于分布式频谱快速识别方案。该方案通过小型化分布式频谱检测探针实现对黑广播的快速识别及定位,具有更高的识别准确率和更快的发现速度。后期该系统将开发射频指纹特征识别算法,以期获得更好更快的识别黑广播效果。  相似文献   

11.
人工智能与语音识别技术   总被引:1,自引:0,他引:1  
随着深度神经网络在大规模语音识别任务上获得显著效果提升,大数据的不断完善和涟漪效应的提出,在近十年,中国的人工智能也得到了快速发展。作为国内智能语音与人工智能产业领导者的科大讯飞率先将递归神经网络和卷积神经网络应用到真实在线系统中,并提出了全新的深度神经网络结构FSMN——讯飞构型。  相似文献   

12.
Internet attacks pose a severe threat to most of the online resources and are a prime concern of security administrators these days. In spite of many efforts, the security techniques are unable to detect the intrusions accurately. Most of the methods suffer from the limitations of a high false positive rate, low detection rate and provide one solution which lacks the classification trade-offs. In this work, an effective two-stage method is proposed to produce a pool of non-dominating solutions or Pareto optimal solutions as base models and their ensembles for detecting the intrusions accurately. It generates Pareto optimal solutions to a chromosome structure in stage 1 formulating Pareto front. Whereas, another approximation to the Pareto front of optimal solutions is made to obtain non-dominating ensembles in the second stage. The final prediction ensemble solutions are computed from individual predictions using majority voting approach. Applicability of the suggested method is validated using benchmark dataset NSL-KDD dataset. The experimental results show that the recommended method provides better results than conventional ensemble techniques. The recommended method is also adequate to generate Pareto optimal solutions that address the issue of improving detection accuracy for minority as well as majority attack classes along with handling classification tradeoff problem. The proposed method resulted detection accuracy of 97% with FPR of 2% for KDD dataset respectively. The most attractive feature of the proposed method is that both generation of base classifier and their ensemble thereof are multi-objective in nature addressing the issue of low detection accuracy and classification tradeoffs.  相似文献   

13.
随着无线通信技术的迅猛发展,一对一、一对多的近距离通信需求不断增长,对讲机市场的竞争日益激烈。在我国无线电通信技术高速发展的20多年间,对讲机得到了广泛的应用,在边防哨所、公安、消防、工地、工厂、商场、车队、宾馆、饭店、小区等多领域内都能看到它的身影。  相似文献   

14.
《现代电子技术》2017,(23):59-63
情感识别技术是智能人机交互的重要基础,它涉及计算机科学、语言学、心理学等多个研究领域,是模式识别和图像处理领域的研究热点。鉴于此,基于Boosting框架提出两种有效的视觉语音多模态融合情感识别方法:第一种方法将耦合HMM(coupled HMM)作为音频流和视频流的模型层融合技术,使用改进的期望最大化算法对其进行训练,着重学习难于识别的(即含有更多信息的)样本,并将Ada Boost框架应用于耦合HMM的训练过程,从而得到Ada Boost-CHMM总体分类器;第二种方法构建了多层Boosted HMM(MBHMM)分类器,将脸部表情、肩部运动和语音三种模态的数据流分别应用于分类器的某一层,当前层的总体分类器在训练时会聚焦于前一层总体分类器难于识别的样本,充分利用各模态特征数据间的互补特性。实验结果验证了两种方法的有效性。  相似文献   

15.
通过对话音识别中的模板匹配技术DTW算法的研究和改进,实现了一种应用于判别骚扰电话录音的话音识别系统。实验结果表明,该系统具有较高的识别精度,是一种有效的应用于判别骚扰电话的话音识别系统,能显著提高骚扰电话人工审核的效率,进一步完善骚扰电话治理工作。  相似文献   

16.
发音字典是语音识别系统的重要组成部分,字典词汇量不足将导致高集外词率,降低语音识别性能。提出一种自动扩展字典的新方法,该方法不需要大量文本数据来获取新词,而是利用单词发音恢复集外词。首先,利用字典有限状态转换器(FST)表示的互补形式和P2G转换获取新的词-发音对。然后采用一种两步确认策略,即发音确认和单词确认,滤除错误词条。最后,采用语言模型线性内插将生成的新词添加进语言模型中。该方法在英语和捷克语的连续语音识别任务中进行了测试。实验表明,字典扩展有效降低系统集外词(OOV)率;英语大词汇量连续语音识别(LVCSR)系统的连续语音识别性能相对基线系统提升约9%,关键词检索性能约提升9.7%;捷克语系统性能分别提升了2.3%和10.0%。  相似文献   

17.
18.
实际的研究表明,语音情感识别方法有多种.介绍了一种基于GMM的语音情感识别方法,包括该方法的优点、存在的问题或不足等,并对此进行了思考,给出了一些处理办法.  相似文献   

19.
基于CNN的连续语音说话人声纹识别   总被引:1,自引:0,他引:1  
近年来,随着社会生活水平的不断提高,人们对机器智能人声识别的要求越来越高.高斯混合—隐马尔可夫模型(Gaussian of mixture-hidden Markov model,GMM-HMM)是说话人识别研究领域中最重要的模型.由于该模型对大语音数据的建模能力不是很好,对噪声的顽健性也比较差,模型的发展遇到了瓶颈.为了解决该问题,研究者开始关注深度学习技术.引入了CNN深度学习模型研究连续语音说话人识别问题,并提出了CNN连续说话人识别(continuous speaker recognition of convolutional neural network,CSR-CNN)算法.模型提取固定长度、符合语序的语音片段,形成时间线上的有序语谱图,通过CNN提取特征序列,经过奖惩函数对特征序列组合进行连续测量.实验结果表明,CSR-CNN算法在连续—片段说话人识别领域取得了比GMM-HMM更好的识别效果.  相似文献   

20.
王民  许娟  要趁红  赵渊 《液晶与显示》2018,33(7):615-623
小波神经网络(WNN)具有高度的非线性映射功能及强大的自适应能力,但是WNN算法存在易陷入局部极小值,收敛速度慢。而人工蜂群算法(ABC)具有很强的全局搜索能力及较快的收敛速度。两者优势互补,已结合应用于语音识别中。本文对ABC算法做出改进,在采蜜蜂和观察蜂阶段各提出一个新的解搜索方程,采取自适应的双搜索方式(Adaptive Double Search)求解,从而提高算法的收敛速度和收敛精度。并将其和WNN算法进行结合,组成一种训练神经网络的新算法ADSABC-WNN,该算法既能克服WNN算法的缺点,又能保存双方的优点。实验结果表明,与传统ABC算法优化小波神经网络相比,识别率提高均有所提高,其中在词汇量为50时识别率提高了4.51%。将实验结果与其他方法优化的小波神经网络模型进行比较,在噪声环境下,该混合模型可以有效地减少识别时间,而且可以明显提高网络的训练速度和语音识别的识别率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号