排序方式: 共有78条查询结果,搜索用时 15 毫秒
11.
12.
互联网的高速发展催生了海量网络文本,这对传统的串行文本校对算法提出了新的性能挑战。尽管近年来文本自动校对任务受到了较多关注,但相关研究工作多集中于串行算法,鲜有涉及校对的并行化。文中首先对串行校对算法进行泛化,给出一种串行校对的通用框架,然后针对串行校对算法处理大规模文本存在的耗时长的不足,提出3种通用的文本校对并行化方法:1)基于多线程的线程并行校对,它基于线程池的方式实现段落和校对功能的同时并行;2)基于Spark MapReduce的批处理并行校对,它通过RDD并行计算的方式实现段落的并行校对;3)基于Spark Streaming流式计算框架的流式并行校对,它通过将文本流的实时计算转为一系列小规模的基于时间分片的批处理作业,有效避免了固定开销,显著缩短了校对时延。由于流式计算兼有低时延和高吞吐的优势,文中最后选用流式校对来构建并行校对系统。性能对比实验表明,线程并行适合校对小规模文本,批处理并行适合大规模文本的离线校对,流式并行校对有效减少了约110s的固定时延,相比批处理校对,采用Streaming计算框架的流式校对取得了极大的性能提升。 相似文献
13.
14.
针对目前汉语兼类词标注的准确率不高的问题,提出了规则与统计模型相结合的兼类词标注方法。首先,利用隐马尔可夫、最大熵和条件随机场3种统计模型进行兼类词标注;然后,将改进的互信息算法应用到词性(POS)标注规则的获取上,通过计算目标词前后词单元与目标词的相关性获得词性标注规则;最后,将获取的规则与基于统计模型的词性标注算法结合起来进行兼类词标注。实验结果表明加入规则算法之后,平均词性标注准确率提升了5%左右。 相似文献
15.
上海庙矿业公司榆树井煤矿因地处西北沙漠,气候恶劣,造成矿区尘土飞扬。特别是储煤场,风大时煤尘被刮起,严重影响了矿区职工的工作、生活以及周边环境。为改变这种"灰头土脸"的境况,近日,榆树井煤矿洗煤厂在储煤场周围增设了高度为8米、总长度达583米、挡风抑尘面积达2.8公顷的挡风抑尘网,有效解决了这一问题。 相似文献
16.
提出了气动乳化液自动配比仪的构想,该配比仪以井下压风为动力,利用综合控制器(PLC)作为控制单元,实现乳化液浓度的自动配比。其配液方式可分为自动调节和人工调节两种。该装置不仅能够更好地实现乳化液的全封闭式管理,保持乳化液系统的清洁,降低液压支架液压元件的损坏,也大大减少了乳化油的浪费。 相似文献
17.
升压站作为光伏发电场站的重要组成部分,其顺利稳定运转是影响发电是否安全稳定运营的关键因素。智能巡检机器人在升压站中的科学规划应用,打破了传统人工巡检模式下的局限性,提升了智能化、数字化巡检的效率和质量,极大地推动了升压站无人值守场景智能化需求的实践应用。智能巡检机器人代替人工巡视,是未来电力行业融合人工智能和大数据分析等核心技术在智能巡检的主要发展方向。为此,文章主要针对当前升压站无人值守巡检的场景需求进行分析并提出解决对策,为行业今后的发展提供借鉴和参考。 相似文献
18.
国家标准《测量、控制和实验室用电气设备的安全要求 第1部分:通用要求》目前已完成编制工作,现正处于报批阶段。该标准是对GB4793.1-1995版标准的修订,等同采用了国际标准IEC 61010-1:2001,并加入了2002年对标准修正的内容。 相似文献
19.
针对水电站工程项目特点,确定水土保持防治责任范围面积,根据水土流失分区原则,确定此类项目的防治分区。通过对水电站项目的水土流失预测,确定工程建设区是水土流失的重点预测区,施工期是水土流失重点预测时段,分析水电站项目建设过程中可能造成的水土流失危害,针对性地提出水土流失防治措施并对方案编制中的问题进行了讨论。 相似文献
20.
问句实体链接不仅需要大量的数据处理和特征选择工作,而且容易形成错误累积,降低链接效果.针对这种情况,文中提出基于注意力机制的编码器-解码器问句实体链接模型.模型使用双向的长短期记忆网络编码问句,经过注意力机制解码,生成对应的实体指称和消歧信息输出,最后链接到知识库实体.在有关汽车领域车系产品问句和实体数据集上的实验表明,文中模型仅利用较少的上下文信息便可取得良好效果. 相似文献