首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 265 毫秒
1.
针对当前电力营业厅等服务型场所缺乏领域特有的情感分析数据集这一问题,构建了一个可应用于电力营业厅等服务型场所的情感分析数据集。该数据集可对用户话语进行情感极性分类,并可对用户情感来源进行归因分类。数据集共包含2 080条数据,首先从电力系统营业厅客户的交互、反馈中收集原始语音、文本数据,然后对这些数据进行清洗、脱敏和增广,最后进行情感极性分类和情感指向分类两类文本分类任务的标签标注和校对。在得到的数据集上使用多种特征提取方法和分类器模型进行多次交叉验证实验,其中基于BERT作为编码器的神经网络分类器模型最高可在数据集两类任务上取得95.31%和92.07%的准确率,充分验证了所提出的情感分析数据集的有效性和实用性。实验结果表明该数据集可用于对话系统的实际应用及相关领域的情感分析中,帮助营业厅等服务类场所更有针对性地提升服务质量和用户体验。  相似文献   

2.
用户意图识别是基于用户对话用语识别用户的真实对话意图,是人机对话研究中的一项关键任务。针对现有用户意图识别方法的不足,提出融合敏感词规则和字符级RCNN模型的用户意图识别方法。构建敏感句子与敏感词词典,并通过规则及相似度匹配策略对特征明显的对话进行意图识别。针对类别特征不明显的对话提出深层语义分类模型,该模型以单字符串作为输入序列,利用RCNN模型构建意图分类框架,既可以避免分词结果不准确带来的错误传导问题,同时利用字符的分布向量表示方法还可以获取句子的深层语义信息。实验结果表明,该方法在两个数据集上都取得了较好的结果,明显优于传统的意图识别方法。  相似文献   

3.
《微型机与应用》2019,(11):67-72
回答用户问询是电力营业厅的重要业务,使用智能系统识别用户意图可以大量减少人力成本、简化工作流程。真实的电力用户文本规模小、获取困难,从而导致智能系统深度学习效果仍待提升。为了解决语料不足的问题,提出一种基于对抗式生成网络的用户问询文本生成方法。实验通过将生成的文本加入训练集,使得RNN意图识别网络在测试集上的准确率由79. 6%提升到82. 1%。实验采用BLEU算法为评价方法,验证生成文本和真实文本的高相似度。由此证明使用用户问询文本生成模型可以生成符合实际需求的电力用户问询文本。  相似文献   

4.
该文针对非任务导向型对话的回复质量构建了一个大规模的人工标注中文数据集,该数据集包含了从社交媒体收集到的超过27 000个对话问题以及超过82 000个对话问题的回复。为了产生高质量的标注数据,邀请了专业人员根据对话回复的相关性、连贯性、信息性、趣味性,以及是否潜在地具有让对话继续延续的特性进行标注,在标注中定义了一个五级评分方法,分别是: 极差的、较差的、一般的、较好的、极好的。为了测试标注产生的数据集是否具有有效性和实用性,以对话回复选择为任务,在标注数据集上测试了多种无监督和有监督模型。实验结果表明,该数据集对于提升对话回复选择的质量有显著效果。  相似文献   

5.
意图分类是一种特殊的短文本分类方法,其从传统的模板匹配方法发展到深度学习方法,基于BERT模型的提出,使得大规模的预训练语言模型成为自然语言处理领域的主流方法。然而预训练模型十分庞大,且需要大量的数据和设备资源才能完成训练过程。提出一种知识蒸馏意图分类方法,以预训练后的BERT作为教师模型,文本卷积神经网络Text-CNN等小规模模型作为学生模型,通过生成对抗网络得到的大量无标签数据将教师模型中的知识迁移到学生模型中。实验数据包括基于真实场景下的电力业务意图分类数据集,以及通过生成对抗网络模型生成的大量无标签文本作为扩充数据。在真实数据和生成数据上的实验结果表明,用教师模型来指导学生模型训练,该方法可以在原有数据资源和计算资源的条件下将学生模型的意图分类准确率最高提升3.8个百分点。  相似文献   

6.
我国是全球糖尿病患病人数最多的国家,患病人数仍在持续快速增长,糖尿病已成为我国重大公共卫生问题。该文关注的糖尿病健康管理对话系统服务于糖尿病患者,为患者解答日常生活中糖尿病相关问题,而目前缺乏用于训练对话系统模型的糖尿病相关数据。基于此,该文构建了首个标注体系完整的糖尿病健康管理中文对话数据集“Diachat”,以支持健康管理对话系统研究。Diachat收集了来自线上聊天平台糖尿病患者与医生的693段对话(Dialogue),共4 686句语料(Sentence),完成了6 594条对话动作(Dialogue act)标注。Diachat数据集采用基于对话动作的表示方式进行意图表示并定义了15个对话动作标签(Act label)。同时,Diachat定义了6个领域(Domain)涵盖语料涉及的领域,分别为:问题(Problem)、饮食(Diet)、行为(Behavior)、运动(Sport)、治疗(Treatment)、基本信息(Profile)。为了支持构建完整的对话系统,Diachat为用户端和系统端分别构造了对话状态,并为每段对话构造了对话目标。基于Diachat数据集,该课题进...  相似文献   

7.
在口语翻译中,如何融入语义及语用信息一直是目前研究的难点之一。对话行为作为浅层话语结构描述的特征,近年来陆续应用于不同类型的翻译系统中。该文在介绍对话行为理论和口语标注语料的基础上,以基于短语的统计翻译系统为应用对象,提出了对话行为应用于翻译过程的三种方式。该方法通过对对话行为的自动分类,使训练语料—测试语料、开发集—测试集、源语言—目标语言的一致性得到提高,提高了翻译系统的性能,使最终的翻译结果可以更准确地反映源语言所要表达的对话意图。在汉英口语翻译评测数据上的实验证明,对话行为信息的加入使翻译系统的性能得到了有效的提高。  相似文献   

8.
为提高多分类器系统的分类精度,提出了一种基于粗糙集属性约简的分类器集成方法 MCS_ARS。该方法利用粗糙集属性约简和数据子集划分方法获得若干个特征约简子集和数据子集,并据此训练基分类器;然后利用分类结果相似性得到验证集的若干个预测类别;最后利用多数投票法得到验证集的最终类别。利用UCI标准数据集对方法 MCS_ARS的性能进行测试。实验结果表明,相较于经典的集成方法,方法 MCS_ARS可以获得更高的分类准确率和稳定性。  相似文献   

9.
命名实体识别的目的是识别文本中的实体指称的边界和类别。在进行命名实体识别模型训练的过程中,通常需要大量的标注样本。本文通过实现有效的选择算法,从大量样本中选择适合模型更新的样本,减少对样本的标注工作。通过5组对比实验,验证使用有效的选择算法能够获得更好的样本集,实现具有针对性的标注样本。通过设计在微博网络数据集上的实验,验证本文提出的基于流的主动学习算法可以针对大量互联网文本数据选择出更合适的样本集,能够有效减少人工标注的成本。本文通过2个模型分别实现实体的边界提取和类别区分。序列标注模型提取出实体在序列中的位置,实体分类模型实现对标注结果的分类,并利用主动学习的方法实现在无标注数据集上的训练。使用本文的训练方法在2个数据集上进行实验。在Weibo数据集上的实验展示算法能从无标签数据集中学习到文本特征。在MSRA数据集上的实验结果显示,在预训练数据集的比例达到40%以上时,模型在测试数据集上的F1值稳定在90%左右,与使用全部数据集的结果接近,说明模型在无标签数据集上具有一定的特征提取能力。  相似文献   

10.
为了方便人们在就餐前选择餐厅,提高就餐效率,文中提出一种基于双向长短时记忆网络的智能语音餐厅推荐方法。首先利用长短时记忆网络进行意图识别,再利用BiLSTM实现餐厅推荐系统中的实体提取,便于系统根据用户所提供的实体信息结合用户意图做出相应反馈。根据意图识别在餐厅推荐系统中的实际应用情况,准备充分的意图识别数据,确定意图识别方案。同时,文中采用基于Rasa_Core的对话管理机制制定对话场景来训练对话管理模型,在用户意图的指引下利用训练好的模型可以选择最优的反馈动作,达到机器与人的有效沟通。  相似文献   

11.
In the era of digital web services, composition of features on the fly is inevitable. The Long-term Composed Service (LCS) entertains the composition of features to any extent, since it has an open-ended lifetime. In the proposed research work, we have intended to provide service support to run the business toward a long time commitment. Structure-based recommended system for LCSs (RS-LCSs) is proposed, where user queries and recent updation/requirements are considered for exhibiting the response through the system. In the proposed system, business has been regulated according to the time constraints. We have tested our proposed system on the standard benchmark dataset and quantitative metrics show our proposed method has performed well against the compared methods. The forecasting of business has been done through our model to address the recent queries and new requirements issues to provide an adaptive web service for the business development.  相似文献   

12.
针对传统供电服务督检现场检查仪优化方法缺少对数据的分类融合处理,导致方法准确性较差的问题,提出基于大数据信息融合和物联网组网节点的供电服务督检现场检查仪优化设计,采用传感器融合识别方法,实现供电服务督检现场检查仪的大数据采集,通过对采集大数据的关联规则特征挖掘和信息识别,提取检查信息的关联特征量,采用物联网技术实现信息的分类检测和信息融合处理,基于嵌入式的物联网组网技术设计供电服务督检现场检查系统,结合模糊控制方法,实现供电服务督检现场检查仪优化设计,提高供电服务督检现场检查的自动化水平。仿真测试结果表明,采用该方法能有效检测到电压或电流谐波含量,检测有效性为97.65%,证明所提方法供电服务督检现场检查的智能性较好,能够应用在供电服务督检现场检查仪中,更好地实现供电服务督检现场检查仪的优化。  相似文献   

13.
自然语言理解作为医疗对话中的关键组成部分,包含意图识别和槽位填充两个重要的子任务。为建立意图和槽位的相互促进关系,实现语义层次上的建模,提出了基于意图—槽位注意机制的医疗咨询意图理解与实体抽取算法。首先,收集医疗信息网站上用户的医疗健康提问文本,基于医学知识归纳总结了24类医疗意图和5种槽位,构建了中文医疗健康咨询数据集(CMISD-UQS);然后,引入槽位选通机制来建模意图和槽位向量之间的显式关系,设计了意图—槽位注意机制层,构建了意图上下文信息以意图标签向量方式嵌入到槽位的方式。在公共数据集ATIS和SNIPS上与八种代表性算法的对比实验结果表明,所提算法优于所比较的八种算法;在CMISD-UQS数据集上的测试结果表明,所提算法的医疗意图识别准确率、语义槽填充F1值、句子级语义框架准确率分别为78.1%、94.9%和73.2%,均优于其他对比算法。  相似文献   

14.
当前,供电企业在计划停电前,只能通过报纸等媒体对停电线路覆盖的全部电力客户发布相应的停电通知,这种粗放性的通知方式,已经无法满足客户服务日益精细化管理的要求。国家电网公司主持的营配数据贯通工作,在各省级电力公司取得了显著的成效,并在各系统数据融合的基础上取得了应用上的突破。营配数据贯通实现了电网设备与用户信息的融合,从电网设备数据到用户数据实现了“一张图”的布局,从而为停电影响范围分析到具体用户提供了数据和技术支撑。本文探讨了在营配贯通的基础上,加快推进供电服务平台建设,通过大数据分析实现计划停电和故障停电影响范围拓扑、停电信息分析到户和停电信息主动通知的等业务功能,进而实现客户服务管理的精细化要求和电力优质服务水平的提升。  相似文献   

15.
张启辰  王帅  李静梅 《软件学报》2024,35(4):1885-1898
口语理解(spoken language understanding, SLU)是面向任务的对话系统的核心组成部分,旨在提取用户查询的语义框架.在对话系统中,口语理解组件(SLU)负责识别用户的请求,并创建总结用户需求的语义框架, SLU通常包括两个子任务:意图检测(intent detection, ID)和槽位填充(slot filling, SF).意图检测是一个语义话语分类问题,在句子层面分析话语的语义;槽位填充是一个序列标注任务,在词级层面分析话语的语义.由于意图和槽之间的密切相关性,主流的工作采用联合模型来利用跨任务的共享知识.但是ID和SF是两个具有强相关性的不同任务,它们分别表征了话语的句级语义信息和词级信息,这意味着两个任务的信息是异构的,同时具有不同的粒度.提出一种用于联合意图检测和槽位填充的异构交互结构,采用自注意力和图注意力网络的联合形式充分地捕捉两个相关任务中异构信息的句级语义信息和词级信息之间的关系.不同于普通的同构结构,所提模型是一个包含不同类型节点和连接的异构图架构,因为异构图涉及更全面的信息和丰富的语义,同时可以更好地交互表征不同粒度节点之间的信息.此...  相似文献   

16.
基于人工智能技术的人机对话系统在人机交互、智能助手、智能客服、问答咨询等多个领域应用日益广泛,这极大地促进了自然语言理解及生成、对话状态追踪和端到端的深度学习模型构建等相关理论与技术的发展,并成为目前工业界与学术界共同关注的研究热点之一。该文聚焦特定场景下的任务型对话系统,在对其基本概念进行形式化定义的基础上,围绕着以最少的对话轮次来获得最佳用户需求相匹配的对话内容为目标,针对目前存在的复杂业务场景下基于自然语言的用户意图的准确理解和识别、针对训练数据的标注依赖及模型结果的可解释性不足,以及多模态条件下对话内容的个性化生成这三个重大的技术问题和挑战,对当前的技术与研究进展进行系统地对比分析和综述,为进一步的研究工作奠定基础。同时,对新一代的面向任务型的人机对话系统未来的关键研究方向与任务进行总结。  相似文献   

17.
提出一种针对电力业务系统功能优化算法.首先,从Web服务器和客户端采集用户日志数据;然后,对用户日志数据进行预处理,并将事务数据集转换为序列数据库;最后,采用改进的Apriori-based算法发现紧耦合的功能模块,进行功能之间的优化组合,提升业务人员的工作效率.实验表明该方法在揭示业务功能模块的耦合性方面的有效性.  相似文献   

18.
用户分类是用能分析的一种重要方法, 而智能电表的广泛应用为用户用能分析提供了大量的可用数据. 为进一步提高用户分类精度与用能特征的提取能力, 本文提出了一种自学习边权重的图卷积网络. 所提出的网络通过具有注意力机制的特殊初始化层将原始能耗数据转换为图, 并从生成的图中提取能耗特征, 最终根据图的学习特征输出用户类. 为证明所提出方法的有效性, 本文在实际用能数据集上进行了对比实验. 实验结果表明, 本文方法不仅能够更好地提取用户特征, 而且取得了更好的分类性能.  相似文献   

19.
谢琪  崔梦天 《计算机应用》2016,36(6):1579-1582
针对Web服务推荐中服务用户调用Web服务的服务质量数据稀疏性导致的低推荐质量问题,提出了一种面向用户群体并基于协同过滤的Web服务推荐算法(WRUG)。首先,为每个服务用户根据用户相似性矩阵构建其个性化的相似用户群体;其次,以相似用户群体中心点代替群体从而计算用户群体相似性矩阵;最后,构造面向群体的Web服务推荐公式并为目标用户预测缺失的Web服务质量。通过对197万条真实Web服务质量调用记录的数据集进行对比实验,与传统基于协同过滤的推荐算法(TCF)和基于用户群体影响的协同过滤推荐算法(CFBUGI)相比,WRUG的平均绝对误差下降幅度分别为28.9%和4.57%;并且WRUG的覆盖率上升幅度分别为110%和22.5%。实验结果表明,在相同实验条件下WRUG不仅能提高Web服务推荐系统的预测准确性,而且能显著地提高其有效预测服务质量的百分比。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号