首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
中文电子病历数据专业性强,语法结构复杂,用于自然语言处理(NLP)的命名实体识别(NER)难度大。为了从电子病历数据中精确识别出医疗实体,提出了一种融合语义及边界信息的命名实体识别算法。首先,利用卷积神经网络(CNN)结构提取汉字图形信息,并与五笔特征拼接来丰富汉字的语义信息;然后,利用FLAT模型中的Lattice将医学词典作为字符潜在词组匹配文本信息;最后,将融入语义信息的Lattice模型用于中文电子病历命名实体识别。实验结果表明,该方法在Yidu-S4K数据集上的识别性能超过现有多种算法,且在Resume数据集上F1值可达到96.06%。  相似文献   

2.
以“公司人事变动”领域为例,针对实体关系抽取课题,从知识自动获取角度出发,基于Bootstrapping思想提出了层次知识获取模型,利用内外两层模块相互嵌套自动获取知识,获得了实体关系分析所需要的领域专用词典和模板规则。结合全信息理论,对模板添加语义和语用标注,生成全信息知识库。在此基础上,完成关系抽取实验和评测。  相似文献   

3.
基于知识语义权重特征的朴素贝叶斯情感分类算法   总被引:1,自引:0,他引:1  
针对文档级情感分类的准确率低于普通文本分类的问题,提出一种基于知识语义权重特征的朴素贝叶斯情感分类算法.首先,通过特征选择的方法,对情感词典中的词进行重要度评分并赋予不同权重.然后,基于词典极性的分布信息与文档情感分类的相关性,将情感词的语义权重特征融合到朴素贝叶斯分类中,实现了新算法.在标准中文数据集上的实验结果表明,提出的算法在准确率、召回率和F1测度值上都优于已有的一些算法.  相似文献   

4.
提出了一种统计与规则相结合的算法,即优先合并算法,通过计算词语相关度来合并短语,并在句法和语义上利用短语规则和语义词典进行校验,按照层次分析的方式实现了对汉语短诏的机器识别.  相似文献   

5.
提出了一种统计与规则相结合的算法,即优先合并算法,通过计算词语相关度来合并短语,并在句法和语义上利用短语规则和语义词典进行校验,按照层次分析的方式实现了对汉语短语的机器识别.  相似文献   

6.
为了改善通用预训练模型不适应医疗领域的命名实体识别任务这一不足,提出了一种融合医疗领域知识图谱的神经网络架构,该架构利用弹性位置和遮盖矩阵使预训练模型计算自注意力时避免语义混淆和语义干扰,在微调时使用多任务学习的思想,利用回忆学习的优化算法使预训练模型均衡通用语义表达和目标任务的学习,最终得到更为高效的向量表示并进行标签预测。实验结果表明:本文提出的命名实体识别架构在医疗领域上取得了优于主流预训练模型的效果,在通用领域也有较为良好的效果。该架构避免了重新训练针对某个领域的预训练模型和引入额外的编码结构从而精简了计算代价和模型大小。此外,通过消融实验对比,医疗领域对于知识图谱的依赖程度较通用领域依赖程度更大,这说明在医疗领域中融合知识图谱方法的有效性。通过参数分析,证明本文使用回忆学习的优化算法可以有效控制模型参数的更新,使模型可以保留更多的通用语义信息并得到更符合语义的向量表达。本文也通过实验分析说明了所提方法在实体数量少的种类上具有更优的表现。  相似文献   

7.
为了避免问句理解阶段过度依赖命名实体,通过语义关系理解中文自然语言问句中关键信息的逻辑关系,提出基于依赖结构的语义关系识别方法,从问句的依赖结构集中识别出对生成语义关系有价值的三类依赖结构集,将三类依赖结构集组合或转换得到语义关系。在中文标准问答数据集上的试验结果验证了本语义关系识别方法的有效性和可扩展性,本方法在命名实体识别失败时也可以理解中文自然语言问句。  相似文献   

8.
提出了一种基于多特征的中文文本蕴含识别方法,首先对文本进行预处理、中文分词、词性标注、命名实体识别、依存分析等处理;然后提取字符串特征、句法特征、语义特征等,使用贝叶斯逻辑回归模型进行预测;最后再使用规则进行修正,得到最终的识别结果.该方法在2014年RITE-VAL 评测任务的CS 数据上的MacroF1为0.625,超过目前最好的研究现状(MacroF1:0.615, BUPTTeam-CS-SVBC-05).  相似文献   

9.
在传统基于统计的中文分词系统基础上加以总结和改进,通过向量空间建立字典模型,改进了倒排字典设计,引入了改进的字典自我学习的功能,优化了字典排序的算法,提高了查询的速度.  相似文献   

10.
为了实现三维模型语义检索,描述了一种基于本体来构建三维模型库语义网的方法,并在此基础上实现基于语义的三维模型检索。该方法首先建立三维模型库本体描述,根据模型库中的内容提取类,对象和属性。其次利用Word-Net英文本体查找本体原始结点的语义扩展结点,包括同义词,上位词,下位词和整体部分关系词,从而构建语义网络。在语义网的基础上实现基于SPARQL的三维模型检索。结果表明,该方法能有效地扩充一个分类粒度较粗的三维模型库的语义内容,扩大语义覆盖面,同时扩充词汇之间的语义相关性,从而提高基于关键词语义检索的准确性。  相似文献   

11.
针对散射中心重叠的情况,利用散射中心空域及其散射机理的稀疏特性,提出一种基于全极化属性散射中心模型的合成孔径雷达目标属性特征提取算法.根据散射中心空域与散射机理的稀疏特性,对目标的极化分解系数矩阵分别施加行稀疏约束与矩阵稀疏约束.由于极化散射机理字典包含未知参数,在此采用坐标轮回下降法分别估计极化分解系数矩阵与极化散射机理字典,同时提取属性散射中心及其极化特征等属性特征.基于电磁计算数据的实验结果,验证了该算法能够利用极化信息提取散射中心的属性特征.  相似文献   

12.
基于图像的超完备字典稀疏表示是一种新的图像表示理论,利用字典的冗余性可以有效地得到图像的几何结构特征,从而实现图像的表示.当前稀疏表示的理论研究主要集中在稀疏分解算法和字典构造算法两方面.基于此稀疏特性,本文提出了一种新的基于冗余字典的数字水印方法.此方法利用图像在超完备字典上的自适应稀疏分解,通过在字典域实现数字水印算法.实验结果证实了本文所提方法的有效性.  相似文献   

13.
针对水稻病虫害知识图谱构建所需实体和关系,提出了一种基于FastBert模型的中文实体关系抽取方法. 首先,在中文语料收集的基础上,使用Hanlp工具和农业词典提取了与水稻病虫害相关的领域实体,并依据实体间关系的特点定义了病虫害别名、为害部位、为害地区、防治方法等7种类型. 然后,在词嵌入和句子嵌入的基础上通过FastBert模型实现水稻病虫害关系的抽取. 该模型与Robert、Electra、Distilbert等其它Bert相关模型的关系抽取结果比较显示,基于FastBert模型的中文水稻病虫害关系抽取效果更好,模型获得的实体间关系F1值达0.72,模型精度达0.69. 该方法为中文农业病虫害知识图谱的自动化构建提供了参考.  相似文献   

14.
针对低秩稀疏表示的高光谱异常检测算法中背景字典易被污染、空间信息利用不足的问题,提出基于分数阶傅里叶变换(FrFT)和全变分正则化约束的高光谱图像异常检测算法. 通过聚类算法,将图像高维数据映射至多个子空间;构造FrFT-RX算子,增大背景和异常的可分性,得到较纯净的背景字典. 为了表示FrFT变换后中间域内背景与异常的空间特征,在低秩稀疏表示模型中引入全变分正则化项约束. 采用交替方向乘子法对模型进行优化求解,得到异常检测的结果. 在3个真实高光谱数据上开展目标检测实验,实验结果表明,与其他5种异常检测算法相比,本文算法具有更高的检测率和较低的虚警率.  相似文献   

15.
A novel microblog summarization approach via enriching contextual features on sentencelevel semantic analysis is proposed in this paper.At first,a Chinese sentential semantic model (CSM) is employed to analyze the semantic structure of each microblog sentence.Then,a combination of sentence-level semantic analysis and latent dirichlet allocation is utilized to acquire extra features and related words to enrich the collection of microblog messages.The simlilarites between the two sentences are calculated based on the enriched features.Finally,the semantic weight and relation weight are calculated to select the most informative sentences,which form the final summary for microblog messages.Experimental results demonstrate the advantages of our proposed approach.The results indicate that introducing sentence-level semantic analysis for context enrichment can better represent sentential semantic.The proposed criteria,namely,semantic weight and relation weight enhance summary result.Furthermore,CSM is a useful framework for sentence-level semantic analysis.  相似文献   

16.
一种基于语义体系的同义词识别研究   总被引:6,自引:0,他引:6  
针对基于字面和词素相似度识别同义词的不足之处,首次引入《同义词词林》(以下简称《词林》),作为语义体系,提出了基于《词林》语义体系的同义词识别算法,并进行了词汇问的语义相似度度量,实现了同义词识别。实验结果表明,此方法在效率上远高于基于字面、词素相似度识别方法。  相似文献   

17.
为解决现有个性化推荐系统中缺乏对语义信息处理能力的问题,建立了语义推荐系统模型,使用描述逻辑实现了该模型,并给出了推荐算法。在实现模型的过程中引入了两条规则实现了概念层次关系在兴趣程度和关联程度上的传递。实验证明,通过将用户的兴趣和待选资源的相关概念在语义层面进行适当扩展,语义推荐系统模型能产生更多符合用户兴趣的推荐项目。  相似文献   

18.
针对RDF生物信息数据库,结合领域知识,研究了在本体指导下的RDF数据库资源链接策略。同时,对所涉及的资源匹配、基于本体的语义相似度计算等具体问题进行算法设计及开发。实验结果验证了本文所阐述的语义生物信息数据库资源链接算法模型的有效性。  相似文献   

19.
针对电子邮件系统中垃圾邮件引起的安全性问题,设计了一种邮件过滤系统模型。该模型采用CORBA/IIOP体系结构,在服务器端进行基于地址、内容的邮件过滤,其中内容过滤采用先进的潜在语义索引算法,并通过构建用户个性词典的方法解决了该算法中文档集用户兴趣有效性问题。  相似文献   

20.
针对在线中文评论中用户主观意见的不确定性,提出一种基于不确定理论的情感分析模型,并结合情感分析模型设计了个性化推荐算法。采用分词工具ICTCLAS和IKAnalyzer预处理在线中文评论,并基于情感词典(HowNet)计算特征词的点互信息值;应用不确定变量与不确定集设计情感分析模型;根据情感分析模型设计新的最近邻居搜索方法并产生推荐。在两个真实数据集上进行试验,试验结果表明,该方法能够有效改进推荐结果的准确率,缓解数据稀疏问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号