排序方式: 共有80条查询结果,搜索用时 10 毫秒
61.
62.
63.
基于语义扩展的短问题分类 总被引:1,自引:0,他引:1
问题分类是问答系统任务之一。特别是语音交互方式中,用户的提问较短,具有口语化特征,利用传统文本分类方法对问题进行分类的效果不佳。为此提出一种基于语义扩展的短问题分类方法,该方法使用搜索引擎对问题进行知识扩展;然后,使用主题模型进行特征词选择;最后,利用词语相似度计算获取问题的类别。实验结果表明,所提方法在1365条真实问题集上平均F-measure值达到0.713,其值高于支持向量机(SVM)、K近邻(KNN)算法和最大熵方法。因此,该方法在问答系统中可以帮助系统提升问题分类的准确率。 相似文献
64.
65.
66.
67.
弱监督关系抽取利用已有关系实体对从文本集中自动获取训练数据,有效解决了训练数据不足的问题。针对弱监督训练数据存在噪声、特征不足和不平衡,导致关系抽取性能不高的问题,文中提出NF-Tri-training(Tri-training with Noise Filtering)弱监督关系抽取算法。它利用欠采样解决样本不平衡问题,基于Tri-training从未标注数据中迭代学习新的样本,提高分类器的泛化能力,采用数据编辑技术识别并移除初始训练数据和每次迭代产生的错标样本。在互动百科采集数据集上实验结果表明NF-Tri-training算法能够有效提升关系分类器的性能。 相似文献
68.
信息抽取是数据挖掘的一个重要领域,文本信息抽取是指从一段自由文本中抽取出指定的信息并将其结构化数
据存入知识库供用户查询或下一步处理所用。人物属性信息抽取是智能人物类搜索引擎构建的重要基础,同时结构化信
息也是计算机所能理解的一种数据格式。作者提出了一种自动获取百科人物属性的方法,该方法利用各属性值的词性信
息来定位到百科自由文本中,通过统计的方法发现规则,再根据规则匹配从百科文本中获取人物属性信息。实验表明该
方法从百科文本中抽取人物属性信息是有效的。抽取的结果可以用来构建人物属性知识库。 相似文献
69.
70.
无线ECG心电采集和分析系统是一种新兴的、有广阔发展前景的医疗器械.基于CC2530 ZigBee模块和Cortex M3处理器,设计并实现了远距离无线心电采集分析系统.该系统采集人体心电信号,通过CC2530模块建立ZigBee网络,将采集节点采到的信号发送到协调器.协调器再将信号送至Cortex M3高性能处理器显示和处理,供医疗人员初步分析诊断,系统还可将ECG信号送至上位机作进一步处理和分析.本系统具有抗干扰能力强、可靠性好、功耗低、体积小等特点,可以广泛应用于医院和社区医疗站等. 相似文献