排序方式: 共有45条查询结果,搜索用时 15 毫秒
1.
一种文本讨论线索的自动获取方法 总被引:1,自引:0,他引:1
介绍了一种基于知识库的方式获取文本中讨论线索的方法.该方法根据文本出现的控制词与概念网中各个概念的关联,找出文本以及文本中各个段落的主题概念,并通过对概念网中的概念进行关系计算,获取文本的讨论线索,较好地避免了因文本叙述方式的不同以及指代的存在而带来的影响.实验结果显示,该方法对文本主题识别的准确率达82%,对段落主题识别的准确率达70%. 相似文献
2.
提出一种基于Ultra Search的桌面搜索设计和实现方案,简要介绍了Ultra Search体系架构和各个组件的功能,然后给出该桌面搜索的框架和各个组件的实现细节,并和多个桌面搜索工具在相同的数据源上进行测试,结果表明,该桌面搜索有不错的搜索性能。 相似文献
3.
近年来基于字的词位标注汉语分词方法极大地提高了分词的性能,该方法将汉语分词转化为字的词位标注问题,借助于优秀的序列标注模型,词位标注汉语分词逐渐成为汉语分词的主要技术路线.该方法中特征模板集设定和词位标注集的选择至关重要,采用不同的词位标注集,使用最大熵模型进一步研究了词位标注汉语分词技术.在国际汉语分词评测Bakeoff2005的语料上进行了封闭测试,并对比了不同词位标注集对分词性能的影响.实验表明所采用的六词位标注集配合相应的特征模板集TMPT-6较其他词位标注集分词性能要好. 相似文献
4.
网络广播作为电化教育的新媒在现代网络教学中异军突起 ,其虚拟现实的逼真的教学效果及良好的交互性已引起有关教育技术专家们的高度重视。但网络广播的技术还不成熟 ,其具体实现还有待商榷。本文论述了网络广播的现状、网络广播的相关协议、网络广播软件技术、网络广播的实现、网络广播的技术难点与解决措施 ,特别是针对网络广播实现中的技术难点 ,提出了较为可行而又新颖的解决措施 ,如针对网络广播中的带宽瓶颈问题 ,本文提出了“改进压缩编码方法”、“采用镜像服务器”、“采用边缘服务器”、“采用缓冲服务器”等措施 ,这些措施经过反复实验被证明能从根本上解决问题。 相似文献
5.
动态语义知识网络构建研究 总被引:1,自引:0,他引:1
分析了目前语义知识库研究现状,提出了一种新的语义知识结构模型--以Ontology(本体)概念为理论基础,将现有的中文信息库和离散型神经元网络结构相结合,构建了一个具有自学习、自适应能力的神经语义知识网络模型. 相似文献
6.
为了获取压缩中文文本的高压缩比,变长编码集合扩展的中文文本压缩算法依据中文语言文字的特点,以不等长高概率汉字串为单位,定义固定字典集,同时寻求高压缩率的匹配方式进行编码,算的编码转换过程适应了自然语言中的部分马尔可夫过程,相对于不同文本长度及文体风格压缩比分布均衡,此算法能够获得较高的压缩比。 相似文献
7.
通过对一组规模随网络环路规模呈指数增长的非线性方程组的求解,实现对非线性多环管路网络系统的仿真、评估和优化。以模式理论为基础,使用遗传算法求解非线性方程与方程组,可利用其呈指数增长的求解能力进行求解。能够在一阶空间和时间复杂度内求解方程组的数值解,同时能够在可行的时间内解决网络结构优化问题。求解过程和结果能够验证模式理论的正确性。 相似文献
8.
提出了一种中文问句语义相似度计算的新方法.该方法分为两步:第一步采用基于问句句型模板规则匹配的方法提取问句语义表征;第二步根据问句语义表征计算问句语义相似度.采用该方法开发了一个面向常问问题集(FAQ)的问答系统.实验结果表明,采用该方法获得的相似度计算的准确率约为85%. 相似文献
9.
近年来基于字的词位标注的方法极大地提高了汉语分词的性能,该方法将汉语分词转化为字的词位标注问题,借助于优秀的序列数据标注模型,基于字的词位标注汉语分词方法逐渐成为汉语分词的主要技术路线.针对一些领域文本中含有较多的英文词汇、缩写、数字等非汉字子串,提出了一种基于字和子串联合标注的汉语分词方法,该方法将子串看作和汉字等同的一个整体,采用四词位标注集,使用条件随机场模型深入研究了基于字和子串联合标注的汉语分词技术.在CIPS-SIGHAN2010汉语分词评测所提供的文学、计算机、医药、金融四个领域语料上进行了封闭测试,实验结果表明此方法比传统的字标注分词方法性能更好. 相似文献
10.
指出基于TfIdf的常用文本特征提取方法在文本分类问题中的缺陷,进而提出使用特征词的分布状态、词频和文本频三者相结合的方式提取文本特征的观点,给出了计算特征词权重的新方法,提出了新的文本分类方法. 试验表明,该方法能够最大限度保留文本的特征,并且可有效避免向量空间模型中的维数灾难问题,能应用于大规模文本分类. 相似文献