首页 | 官方网站   微博 | 高级检索  
     

面向司法大数据的文本主题OLAP系统
引用本文:王玲,刘晓清,何震瀛,奚军庆,项焱.面向司法大数据的文本主题OLAP系统[J].智能计算机与应用,2021,11(9):28-34,41.
作者姓名:王玲  刘晓清  何震瀛  奚军庆  项焱
作者单位:复旦大学 软件学院,上海200438;复旦大学 计算机科学技术学院,上海200438;司法部信息中心,北京100020;武汉大学 法学院,武汉430000
摘    要:随着大数据技术的发展,加强司法大数据应用成为推进司法现代化建设的重要手段,如何处理司法大数据中的非结构化数据亟待解决.为此,本文提出了面向司法大数据的文本主题OLAP系统.在离线数据处理模块中,设计了Span数据模型,并定义了多种针对该模型的操作符;设计了基于规则的文本行政区划归类方法,并构建了主题立方体.在线上查询模块中,实现了基于倒排索引的关键词搜索方法和最大独特主题范围查询,提供了上卷、下钻、切片等功能.通过在大规模的真实数据集上对系统进行测试,实验结果证明了该系统的合理性和实用性.

关 键 词:大数据处理  OLAP  行政区划归类  独特主题

Big data oriented text topic OLAP system
WANG Ling,LIU Xiaoqing,HE Zhenying,XI Junqing,XIANG Yan.Big data oriented text topic OLAP system[J].INTELLIGENT COMPUTER AND APPLICATIONS,2021,11(9):28-34,41.
Authors:WANG Ling  LIU Xiaoqing  HE Zhenying  XI Junqing  XIANG Yan
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号