排序方式: 共有85条查询结果,搜索用时 421 毫秒
61.
目录是组织与利用古籍资源的重要工具,也是图书情报学科的重点研究对象。互著与别裁作为古典目录学中的两种辅助方法,能在深入剖析文献内容特征的基础上,根据内容的多元性将文献准确、完整地记载于目录体系中,达到“类例既分,学术自明”的效果。将互著与别裁映射为文本挖掘中的文本分类问题,提出基于机器学习以实现互著与别裁的方法框架,为古籍在目录体系中的多类目记载提供方法。首先利用TextCNN与BERT两种机器学习模型对先秦诸子六家十部典籍文本进行分类训练,结果显示BERT优于TextCNN,可以达到9164%的分类准确率;之后用微调训练后的BERT模型对《荀子》与《管子》进行篇、章粒度的分类判断,最终得出这两部图书各篇章互著与别裁的结果。本研究展现了在数字人文视域下,数字技术对古典目录学、古典文献学以及学术史研究的应用价值。图5。表7。参考文献43。 相似文献
62.
本文主要研究了从不同类型的html页面中根据需要抽取指定文本的技术.首先分析了目前主流的文本抽取技术的优点及缺点,并针对传统文本抽取技术的不足提出了基于机器学习的网页文本抽取技术;然后重点分析了此技术的实现原理,并在最后以案例方式介绍了使用java语言构建基于此技术的文本抽取系统. 相似文献
63.
《新闻界》2018,(1):28-34
与新闻相关的人工智能技术包括机器人、视觉信息处理、语音处理、自然语言处理和机器学习等技术。本文通过梳理美、德、英、中等国对这些人工智能技术在新闻生产中的实际运用,发现技术本身和技术商业化一道,将新闻线索发掘、新闻文本写作、评论策展、标题制作、网页编辑、新闻分发渠道的诸多流程推向了"黑箱"——即新闻生产的幕后的幕后,人类现有认知水平对其真实度、可信度、透明度难以判断。又由于人工智能技术有"科学"、"客观"光环的加持,黑箱化的过程不令改变了新闻的样态、新闻生产的格局,而且带来了"流量工厂"驱逐优质新闻、定制推送回化社会分层、技术平台反收编新闻机构等社会格局变化。 相似文献
64.
[目的/意义]在线问答社区成为互联网用户获取高质量知识的重要途径,探索中文问答社区答案质量对知识传播具有重要意义。[方法/过程]以规模最大的中文问答社区之一"知乎"为研究对象,采用数据挖掘和机器学习方法,选取逻辑回归、支持向量机和随机森林三种分类模型,进行三层递进式训练和检验。从结构化特征、文本特征以及用户社交属性三个维度构建答案质量的特征体系。[结果/结论]实验结果显示,随着特征体系的不断丰富,三种分类模型的性能逐步提升;而随机森林作为一种组合分类模型,在全量特征的情况下,取得出色的分类性能。对特征组合分析发现,包含用户社交属性的随机森林总是比同等级的其它模型更加出色,表明社会化网络在答案质量评价中的地位。研究结论表明从答案本身和答案编写者两个角度能够评价答案质量,构建的特征体系和模型可以较为全面地预测答案质量。 相似文献
65.
66.
67.
68.
69.