首页 | 官方网站   微博 | 高级检索  
     

数据库中文查询对偶学习式生成SQL语句研究
引用本文:赵志超,游进国,何培蕾,李晓武.数据库中文查询对偶学习式生成SQL语句研究[J].中文信息学报,2023(3):164-172.
作者姓名:赵志超  游进国  何培蕾  李晓武
作者单位:1. 昆明理工大学信息工程与自动化学院;2. 云南省人工智能重点实验室
基金项目:国家自然科学基金(62062046);
摘    要:针对当前中文NL2SQL (Natural language to SQL)监督学习中需要大量标注数据问题,该文提出基于对偶学习的方式在少量训练数据集上进行弱监督学习,将中文查询生成SQL语句。该文同时使用两个任务来训练自然语言转化到SQL,再从SQL转化到自然语言,让模型学习到任务之间的对偶约束性,获取更多相关的语义信息。同时在训练时使用不同比例带有无标签的数据进行训练,验证对偶学习在NL2SQL解析任务上的有效性。实验表明,在不同中英文数据集ATIS、GEO以及TableQA中,本文模型与基准模型Seq2Seq、Seq2Tree、Seq2SQL、以及-dual等相比,百分比准确率至少增加2.1%,其中在中文TableQA数据集上采用对偶学习执行准确率(Execution Accuracy)至少提升5.3%,只使用60%的标签数据就能取得和监督学习使用90%的标签数据相似的效果。

关 键 词:NL2SQL  对偶学习  语义解析  半监督学习
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号