排序方式: 共有40条查询结果,搜索用时 23 毫秒
1.
2.
通过对维吾尔文网站的词干应用状况调查,进而对现代维吾尔文词干的提取和应用进行研究。陈述调查使用的语料媒体来源、应用领域、采集的语料时间跨度与统计方法;介绍词干概念;讨论现代维吾尔语词干提取系统;研究词干在网络媒体语料中应用形式;介绍和讨论词干分布结果,最后总结以上内容。 相似文献
3.
乌孜别克语名词词干识别是自然语言处理领域的基础研究,主要方法是从句子中提取名词词干,提高名词标注效率和准确性。该文首先陈述形态分析、形态特征对识别其词性的作用,然后讨论乌孜别克语的词类划分标准、名词的形态特征,乌孜别克语西尔里文转换拉丁文,乌孜别克语词汇翻译、标注技术,总结词缀歧义及消解规则。该文提出利用形态规则、词典、最大熵融合策略,设计现代乌孜别克语新词中名词词干识别算法,其中包括特征选择及参数估计、词内部特征、前后依存词特征等。最后以乌孜别克语网站文本作为验证对象,对名词词干进行统计与分析。 相似文献
4.
5.
目的 提取新疆胀果甘草中的总黄酮, 分离纯化甘草查耳酮B, 合成三甲氧查耳酮B, 对比研究其体外抗宫颈癌活性。方法 采用超声辅助乙醇提取法提取总黄酮; 结合聚酰胺与大孔吸附树脂法纯化总黄酮; 通过薄层法从总黄酮中分离纯化单体查耳酮B(化合物I); 同时, 以取代苯乙酮和取代苯甲醛为原料, Claisen-Schmidt碱催化方法合成三甲氧查尔酮B(化合物II); 以人宫颈癌SiHa和HeLa细胞为体外药理实验模型, 以顺铂为阳性对照, 用噻唑蓝比色法对比测定2个单体化合物对宫颈癌细胞增殖的抑制活性。结果 在浓度为1~100 μg/mL时, 化合物I对SiHa和HeLa细胞作用24、48、72 h时的抑制率为2.99%~75.39%; 而化合物II在此浓度范围内的抑制率为0.76%~86.14%。结论 超声辅助乙醇回流提取法联用聚酰胺和大孔树脂柱层析法是制备含量较高的胀果甘草总黄酮的可行方法; 甘草查尔酮B的甲氧基化修饰可显著提高其抗宫颈癌活性。 相似文献
6.
通过对维语的场景文字检测与识别研究发现,人工采集标注自然场景文字图像是耗时耗力的,因此人工合成的数据是作为训练数据的主要来源。为获得更加真实的数据,本文提出一种基于生成对抗网络的维语场景文字修改网络,利用高效的Transformer模块构建网络,充分提取图像全局与局部特征来完成维语场景文字图像修改,并添加微调模块,对最终结果进行微调。采用WGAN思想策略训练模型,可有效应对模型崩溃以及梯度爆炸等问题。通过在英文-英文,英文-维文的文字修改实验来验证模型的泛化能力和鲁棒性,无论在客观评价指标(SSIM、PSNR)还是视觉上均取得不错效果,并在真实场景数据集SVT以及ICDAR 2013上进行了验证。 相似文献
7.
阐述了研究与制定"现代维吾尔语词干词类标注标记集"必要性,讨论只靠语法角度提出的一类词干"现代维吾尔语词干词类标注标记集"有限性;论述了通过吸收国内外英语、汉语层次分析研究的最新成果,结合现代维吾尔语词干的本身特点研究现代维吾尔语词干语法语义分类体系迫切性;讨论信息处理用现代维吾尔语一类、二类、三类和四类词干词类标记规范。 相似文献
8.
9.
命名实体识别(NER)是自然语言处理领域的一个重要任务,用于在文本中识别实体并将其分类为预定义的类型。乌兹别克语(简称乌语)命名实体识别在国内外相关研究中处于初级阶段,目前为止尚没有公开、通用的乌语命名实体识别数据集,导致了乌语命名实体识别的进展受到了限制。该文旨在构建一个基于乌兹别克语新闻文本的NER数据集,收集了500篇乌兹别克语新闻文章,并人工标注了其中的人名、地名和组织机构名。随后,利用实体命名识别的主流深度学习模型在该数据集上进行了实验与比较分析。实验结果表明,主流深度学习模型的F1值均在90%以上,证明了该文构建的数据集的有效性和可用性。该文旨在推动乌语命名实体识别领域的研究发展,为该领域提供数据集和基线模型,以扩展相关研究。 相似文献
10.
为解决现今情感分析方法多利用单通道浅层的文本情感因素,不能获取词与词之间更深层语义联系的问题,提出一种基于注意力机制的多通道特征融合情感分析模型(triple channel BIGRU and attention model,Tri-Bi GRU-Atten)。结合词性特征、依存句法、位置信息3种不同语义特征混合建模,将Bi GRU与注意力机制相结合,充分挖掘上下文中更深层次的情感信息,引入特征图扰动技术(feature map distortion,Disout)提高模型泛化性能。实验结果表明,与传统的注意力机制、LSTM、Bi-LSTM等模型相比,该模型情感分类效果更有效。 相似文献