排序方式: 共有85条查询结果,搜索用时 281 毫秒
31.
[目的/意义] 本文旨在提出一种从大量在线商品评论数据中挖掘影响读者满意度的关键因素的方法,并深入探讨各个影响因素对消费者满意度的影响模式和影响程度,进而为图书出版企业、电商平台持续改善读者满意度提供理论基础。[方法/过程] 一方面利用朴素贝叶斯分类器将读者的情感进行分类。另一方面对评价文本中的高频名词进行聚类,发现影响读者满意度的主要因素。在此基础上基于最大程度减少不确定性的原则对各个影响因素的影响模式和影响程度进行分析。[结果/结论] 以京东人工智能类图书评论为例进行了实证研究,发现包括内容、价格在内的六个因素可以极大地反映出读者的满意度(83.2%)。因此对于图书类商品,可以通过对大量历史评论数据的学习,找出影响读者满意度的主要因素,据此设计出简化的读者评论框架,以增强读者参与评论的积极性,提高评论的质量。"图书内容"是影响读者满意度的最主要因素。当读者对图书内容表达出不同的情感时,其他因素对读者满意度的影响模式和程度是完全不同的。当读者对图书内容表示满意时,89.2%的总体评论是好评,其他因素的影响较小,价格是导致中评和差评的最主要因素;当读者认为图书内容一般时,评论趋向于中性,读者对服务和物流更为关注;当读者认为图书内容不令人满意时,影响读者满意的因素依次是包装、服务质量和价格。基于不同影响因素对读者满意度的影响模式和影响程度,图书出版企业和电商平台可以更加有针对性地对其加以改善,以提高读者满意度。 相似文献
32.
33.
在数字化学术图书馆中,对海量非结构化读者相关知识的管理问题开始成为学者感兴趣的研究领域.提出一种基于文本挖掘技术,对读者知识进行管理的具体方案.实验结果表明,该方案能够将读者知识进行有效提取、组织和共享,从而推动数字学术图书馆的知识管理水平和能力. 相似文献
34.
[目的/意义]在大数据时代,基于客观数据构建行之有效的社交网络舆情生态评价方法对网络生态治理和健康发展具有重要的意义。[方法/过程]本文以信息生态理论为基础,采用机器学习、敏感判断、关键词抽取等自然语言处理技术构建了社交网络舆情生态性评价算法。在数据处理过程中,采用基于Adaboost的集成学习方法,利用差异方法、特征集合构造分类器之间的互补效应,通过有效聚合多个基于统计和基于规则的情绪分析器,构建出情感分析模型,为评价指标体系提供支撑。实践层面,本文选出东北、沿海以及西部几个代表性区域运用所构建的评价算法对区域生态性进行评价和分析。[结果/结论]该评价方法的构建为政府、网站、网民携手净化社交网络空间具有重要的指导意义,并为社交网络舆情主题图谱的构建及调控策略的研究提供了重要的理论和实践基础。 相似文献
35.
36.
37.
机器学习是人工智能的重要分支,TensorFlow是谷歌第二代开源人工智能机器学习平台。此文重点介绍机器学习(主要是深度神经网络)的基本原理和利用TensorFlow进行机器学习的基本方法,探讨在图书馆领域应用的可能和场景。以《全国报刊索引》的自动分类问题作为实验对象,利用两台图形工作站,建立了TensorFlow深度学习模型,通过设定参数和阈值、系统调优等工作,实践了应用TensorFlow的完整过程,论证了其可行性。实验通过对170万余条题录数据进行训练和测试,克服了报刊索引数据过于简单与中国图书馆分类法的类目过于细致之间的矛盾,实现了大类近80%和四级分类总体近70%的准确率(其中TP类达到91%),得出基本可代替人工分类流程的结论,为全国报刊索引的分类流程的半自动化提供有力工具,从而可望大大节省人力成本。下一步将继续利用TensorFlow的优化功能,结合更多的字段属性,进行系统调优,力争做到自动分类90%以上的准确率。 相似文献
38.
Web文本分类技术研究现状述评 总被引:1,自引:0,他引:1
本文在分析国内外Web文本分类方法研究现状的基础上,对新近出现的基于群的分类方法、基于模糊—粗糙集的文本分类模型、多分类器融合的方法、基于RBF网络的文本分类模型、潜在语义分类模型等新方法,以及K—近邻算法和支持向量机的新发展等进行了深入探讨;并对Web文本分类过程的几个关键技术:文本预处理、文本表示、特征降维、训练方法和分类算法进行了分析;最后总结了Web文本分类技术存在着新分类方法不断涌现、传统分类方法的进一步发展、文本、语音和图像分类技术的融合等几种发展趋势,以及存在着分词问题、目前还没有发现"最佳"的特征选择等研究的不足之处。 相似文献
39.
利用条件随机场模型进行自动标引研究,对文本分词性能、训练集的规模、特征的个数、模型本身的参数设置等影响模型标引性能的因素进行实验和分析。 相似文献
40.
数据库本身即是一种资源的整合,库与库的整合是另一种扩大化的整合。整合有利于知识生产的延续,有利于营造知识自我发展的生态环境。数字资源整合的层次呈现多样性,有粗放性,亦有精细性。整合可以促进学术研究公平竞争,为学术研究避免重复劳动提供环境。互联网是给整合提供条件的“核心竞争力”,资源的整合依托互联网而发挥重要效益。国内引进的学术数据库已经达近百个,文献学术研究环境几乎达到了国内外的平衡。利用整合资源,学会数字化自主学习是一种新的能力。 相似文献