排序方式: 共有56条查询结果,搜索用时 281 毫秒
41.
答案自动抽取是答案融合任务的关键技术,其效果直接影响答案融合任务结果的准确性.为了捕捉问题与答案之间的联系,提高答案自动抽取的准确性,本文引入句内注意力机制用来捕捉问题与答案之间的联系,进而提高答案自动抽取的准确性.实验结果表明,句内注意力机制能够有效发现问句与答案的关系,提升答案自动抽取效果. 相似文献
42.
针对无线射频识别(Radio Frequency Identification,RFID)系统在识别标签的过程中出现标签碰撞识别效率不高的问题,在传统的自适应多叉树的基础上,提出了一种新型的自适应多叉树(NAMS)的防碰撞算法,该算法在计算碰撞因子选择叉数之前先估算碰撞标签数目N和统计碰撞位数m,直接识别满足N=2m的关系的叶子节点,节省了部分叶子节点的搜索时间;同时引入自动休眠计数机制,平均节省了一半的执行命令数,从而缩短了通信时间.最后对NAMS算法所需总时隙进行理论分析并将该算法用于实验,结果表明,NAMS算法较AMS算法在识别速度和系统吞吐率方面有较大提高. 相似文献
43.
44.
45.
文本匹配是自然语言理解的关键技术之一, 其任务是判断两段文本的相似程度. 近年来随着预训练模型的发展, 基于预训练语言模型的文本匹配技术得到了广泛的应用. 然而, 这类文本匹配模型仍然面临着在某一特定领域泛化能力不佳、语义匹配时鲁棒性较弱这两个挑战. 为此, 本文提出了基于低频词的增量预训练及对抗训练方法来提高文本匹配模型的效果. 本文通过针对领域内低频词的增量预训练, 帮助模型向目标领域迁移, 增强模型的泛化能力; 同时本文尝试多种针对低频词的对抗训练方法, 提升模型对词级别扰动的适应能力, 提高模型的鲁棒性. 本文在LCQMC数据集和房产领域文本匹配数据集上的实验结果表明, 增量预训练、对抗训练以及这两种方式的结合使用均可明显改善文本匹配结果. 相似文献
46.
一种基于SVM/RS的中文机构名称自动识别方法 总被引:4,自引:0,他引:4
该文提出一种支持向量机(Support Vector Machines,SVM)和粗糙集(Rough Set, RS)相结合的中文机构名称短语识别方法。该方法借助词的基本语义搭配关系表示短语的构成规则,并通过粗糙集属性约简的方法自动学习到机构名称构成规则的无冗余集。识别时,首先寻找到与这些规则匹配的词串作为候选机构名,然后结合候选机构名以及其上下文词的语义特征,利用SVM分类器判断该候选是否是真正的机构名称。这种方法对1617万字人民日报语料开放测试的F值分别达到82.06%。 相似文献
47.
基于“编码—解码”结构的端到端生成式对话模型所生成的回复多样性差、信息量少,这在很大程度上阻碍了对话的进一步扩展和深入。而知识图谱作为一种高度结构化的知识,能够为对话提供相关知识以及话题转移关系,可以用来提升对话质量。因此,该文提出了一种基于知识拷贝机制的生成式对话模型,首先使用基于知识图谱的映射机制对对话内容进行处理,随后使用知识拷贝机制直接将知识图谱中的知识引入到生成的回复中,并使用注意力机制选择知识图谱中的信息来指导回复的生成。在“2019语言与智能技术竞赛”中的“知识驱动对话”数据集上,相较竞赛举办方提供的生成式基线模型,该文所提出模型生成的回复在字符级别的F1和多样性指标DISTINCT-1上分别有10.47%和4.6%的提升。 相似文献
48.
一种多知识源汉语语言模型的研究与实现 总被引:7,自引:0,他引:7
针对汉语语言模型中知识获取不足的问题,提出了一种统计与多种形式规则信息结合的机制,将规则的表示量化,提出语法语义规则的概念,通过扩充词网络,对其于最大可能性的n元概率值合理调整,将短语构成规则,二元语法语义规则,最少分词原则等融入统计模型框架,构成多知识源语言模型,模型应用于智能拼音汉字转换系统,明显提高了音字转换正确率,并适于处理长距离和递归语言现象。 相似文献
49.
50.
为了在面向旅游领域的文本分类系统中选择有效的分类特征,提高分类性能,本文根据系统采用的训练集、训练过程及分类算法等因素重新对各常用的特征选择方法进行了综合实验评测,比较了五种常用的特征选择方法,对于评测结果最好的三种函数:期望交叉熵、信息增益和互信息,通过理论分析和科学实验,分别提出了不同的改进方法.实验结果表明改进的期望交叉熵方法在本应用中能够最有效地提高系统的分类性能. 相似文献