首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
由于传统语料标注方法耗时耗力,已经难以适应大数据语料的处理,该文提出了大数据语音语料库的社会标注策略。引入了针对语音数据标注的六元组模型,将语音资源的自身特征考虑进去,并将标签对象扩展为更为广义的标记。提出基于"兴趣+收获+报酬"的标注模式,并建立标注质量的3层检验机制。通过工程实现和应用,验证了本文方法在标注效率、质量和成本等方面都具有明显优势。同时,该标注策略可以推广到其他语料的标注,特别是对主观性较强的翻译语料和评价型语料的标注。  相似文献   

2.
规范的重音标注将对重音研究和语音合成技术产生积极影响。该文通过对大规模语料进行语流中词重音和句重音标注,总结出了重音标注的规则。重音标注包括标注训练、正式标注、语料库建立3个步骤。通过标注训练明确重音概念和标注方法,词重音采取词内对比法,所谓"重"主要指突显度和饱满度;句重音采取呼吸句群单位标注法,注重标注的层级性,不跨句群进行重音知觉对比。重音标注完成后,重音语料库也随之建立起来。这个大规模的重音语料库具备词重音和句重音信息,适用于语音合成领域,能较好地提高合成语音的自然度。  相似文献   

3.
数据标注是Deep Web数据集成系统的重要组成部分.建立了领域标注模型,描述数据标注的思想,根据不同的数据,使用领域知识和决策树两种标注方法,给出标注算法描述,最后以图书领域作为标注对象进行实验.实验结果表明该方法可高效、准确地对Deep Web数据进行标注.  相似文献   

4.
阐述了利用AUTOCAD绘制机械工程图时,如何使图纸上的标洼符合《机械制图》国家标准,介绍了文字标注、尺寸标注和尺寸公差标注的实现方法.  相似文献   

5.
图像自动标注是图像理解与模式识别等领域中具有挑战性的关键研究问题.目前图像自动标注领域存在着一些问题,如未标注数据规模要远大于标注数据规模,只能单独使用某种图像分割策略与某类图像表示方法.针对上述问题,提出了基于Co-training的图像自动标注方法,通过构建4个独立的特征属性进而建立4个子分类器,将不同的图像分割方法与特征表示方法整合到一个统一框架中,利用提出的基于投票与一致性相结合的自适应算法扩展原始训练集.该方法通过使用Co-training算法,利用大量未标注数据来提升图像自动标注的性能.通过在Corel 5K数据库上进行实验,验证了提出方法的有效性.  相似文献   

6.
零件图中的尺寸是零件图的主要内容之一,是零件加工制造的主要依据。在零件图中标注尺寸,除了满足正确,齐全、清晰的要求外,还需满足合理的要求。该文从正确选择尺寸基准和合理标注尺寸的原则方法两方面论述了零件图尺寸的合理标注。  相似文献   

7.
该文提出了一种基于Viterbi解码的中文合成音库韵律短语边界自动标注方法,以降低大语料库单元拼接合成系统的构建成本。该方法分为模型训练和韵律标注两阶段:模型训练阶段得到频谱、基频和音素时长的上下文相关隐Markov模型(hidden Markov model,HMM);标注阶段借助训练得到的模型采用Viterbi解码完成韵律短语自动标注。实验结果表明:该方法进行韵律短语边界标注时的F-score值达到77.64%,超过了人工标注时不同标注人员之间的一致性水平;另外该方法可以方便地增加待标注韵律属性,具有良好的扩展性。  相似文献   

8.
在ActiveX Automation规范下,通过编程实现了自动提取AutoCAD的标注对象,如尺寸、引线和公差标注的内部属性信息,解决了协同设计时,不能完整获取标注对象数据的问题。根据上述三种标注对象所含属性组合方式的不同,给出了不同的查寻和提取属性信息的具体方法。  相似文献   

9.
利用多资源转化方法进行词性标注研究, 旨在将源端资源的标注进行转化, 以符合目标端标注规范, 进而将转化后的资源与目标资源合并, 增大训练数据规模。做了两方面创新: 在转化过程中, 额外利用指导特征的置信度信息; 在转化后的资源中, 用模糊标注表示方法减少错误标注。实验表明, 利用置信度信息能有效帮助转化, 而模糊标注表示方法的影响不大。  相似文献   

10.
针对当前标注系统的不足,设计了一种高效的标注模型,其标注步骤包括标注和标注改善,标注算法采用加权的正反例标志向量法,标注改善采用NGD方法。实验表明,标注效率远优于经典的标注模型,标注质量优于大多数标注模型。  相似文献   

11.
该文对于制图课程教学中组合体的尺寸标注问题进行探讨,提出应该重视正确进行尺寸标注的基础工作、做好注重尺寸标注的完整性工作、达到尺寸标注清晰、注重标注尺寸中合理性要求等,希望对于今后的组合体尺寸标注教学具有一定帮助。  相似文献   

12.
语义标注所用标签数目众多,训练数据更为稀疏,用HMM作语义标注面临参数估计不准的难题。不同于传统的解决数据稀疏方法,以《同义词词林》的层次式结构为依据,提出了利用语义层次的提升来改善HMM(hidden Markov model)中参数的估计质量;在算法实现中,采用选择受限策略来解决因语义提升而引起的模型辨别力下降问题。测试表明,在训练数据相对稀疏的情况下,适度调整模型的语义层次可大幅提高语义标注的精度,该方法表现出较好的可塑性。  相似文献   

13.
针对词性标中单独使用概率方法或规则方法的缺陷,将概率方法和规则方法有机结结合起来,并引入了部分句法分析除分歧义和标注歧义,利用机器学习得到的规则对输出结果进行修正,实现了一个自学习结合部分句法分析的汉语词性标注系统。  相似文献   

14.
吴石  李志军 《科技信息》2012,(36):15-15
《机械制图》是装备制造业的一门专业基础课。组合体的尺寸标注是机械图样的重要组成部分,也是教学中的重点和难点内容。如何使组合体尺寸标注达到“正确、完整、清晰”的基本要求,防止出现错标、漏标或重复标注的现象,需要在教学上不断研究,改进教学方法。  相似文献   

15.
基于转换的无指导词义标注方法   总被引:5,自引:0,他引:5  
词义标注是自然语言处理的难题之一。该文提出用于文本词义标注的转换规则自动获取算法及相应的词义排歧算法。该算法用可能的句法关系对语境进行限制,减少了训练数据中的噪音; 为提高学习算法的速度,提出利用预排序方法减少规则搜索次数,以及只调整变化部分数据的计算方法; 并给了改善召回率的词义排歧算法。在近5 万词的语料库上对本算法进行了实验,开放测试的词义排歧正确率为743% 。  相似文献   

16.
在标注尺寸时,我们不仅要重视尺寸标注的正确性、完整性和清晰性,而且也要重视尺寸标注的合理性。所标尺寸要符合加工工艺要求,便于零件的制造和检验测量。在标注尺寸时,不能贪图标注的方便,在保证标注符合国家标准的前提下,近可能多地考虑加工者读图的方便、加工测量的方便。  相似文献   

17.
传统的自动图像标注假设图像相对独立,在训练和标注阶段,图像之间的联系都被忽略.然而在实际应用中,用户往往倾向于将来自同源(如同一次旅行,同一次庆典等)的图像存储在一起,组成一个图像子集,来自同一个图片子集的图像享有共同的"风格".以传统的基于PLSA模型的自动图像标注为基础,提出为图像集的"风格"建模,在风格模型的基础上进行自动图像标注.不同数据集上的实验证明,提出的风格化图像自动标注可以为传统的基于PLSA模型的自动图像标注带来80%左右的性能提升.  相似文献   

18.
如何更好地标注物理量下标   总被引:1,自引:0,他引:1  
对物理量下标的标注是科技期刊编辑工作中经常遇到的问题。由于国标只给出了少数的下标标注爷号,因而编辑及作者在对国标中没有规定的下标标注时往往很随意甚至混乱。笔者根据编辑工作过程中所遇到的各种情况,提出了采用英文缩写标注下角的方法,这种标注方法具有简单清晰、易于标注、通用性强等特点。  相似文献   

19.
在标注尺寸时,我们不仅要重视尺寸标注的正确性、完整性和清晰性,而且也要重视尺寸标注的合理性。所标尺寸要符合加工工艺要求,便于零件的制造和检验测量。在标注尺寸时,不能贪图标注的方便,在保证标注符合国家标准的前提下,近可能多地考虑加工者读图的方便、加工测量的方便。  相似文献   

20.
以中文分词为应用目标, 将大规模语料库上存在的自然标注信息分为显性标注信息与隐性标注信息, 分别考察了它们的分布和对大数据集上语言计算的影响。结果表明, 两者都直接或间接地表达了作者对语言的分割意志, 因而对分词具有积极的影响。通过词语抽取测试, 发现在缺乏丰富显性标注信息的文本中, 来自语言固有规律的自然标注信息对字符串有着强大的分割性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号