首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
基于启发式规则的网页主题信息精确定位方法*   总被引:3,自引:0,他引:3  
目前大部分的信息抽取方法都是针对主题信息块的提取,没有进一步深入到各个单独主题信息的抽取。针对这一问题,提出了一种基于启发式规则的网页主题信息精确定位方法。首先针对各个单独的主题,分析其多方面的特征,制定出对应的启发式规则;然后利用不同的规则对定位主题重要度不同的这一特点,得到启发式规则的权值矩阵;最后利用基于启发式规则的定位算法精确定位各个主题。将该方法用于网页主题信息抽取系统中,抽取系统能够有效地对各个单独的主题进行定位和抽取。实验结果表明,该方法具有很好的有效性和准确性。  相似文献   

2.
随着Internet的发展,Web挖掘技术越来越重要,其中的Web信息抽取技术逐渐成为热点,逐渐成为Web挖掘技术的关键技术之一,对Web信息抽取技术的深入研究也为构建更好的面向主题的搜索引擎提供了思路.文中对Web信息抽取的现有技术以及现有技术存在的问题进行了详细的论述.根据Web信息抽取的原理,依据软件工程的观点对Web信息抽取技术提出了具有指导意义的8条启发式规则.在这些规则的指导下,着重阐述了Web信息抽取中的基于结构和内容的信息抽取.通过理论分析及相应的实验说明所提出的8条规则对Web信息抽取具有良好的指导意义.  相似文献   

3.
龙珑  宁德鹏  宁葵 《微机发展》2011,(10):226-228,236
随着Internet的迅猛发展,我国网民的数量激增。为了能快速地过滤网上的不良信息的传播,绿色网络软件就必须能快速地抽取网页的信息才能完成这个项目设计任务。这绿色网络软件要求提取信息抽取速率非常快速。传统的绿色网络信息抽取的方法无法适应绿色网络网页信息抽取在速率上的需求。文中提出启发式规则网页主题提取方法,去解决绿色网络中网页信息快速抽取这一问题,从而有效地解决快速抽取任务。给出了结合绿色网络实际情况实现一个可以快速定位主题的模块系统。  相似文献   

4.
自动变速器换档规则的粒子群优化提取方法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对神经网络“黑箱”模型的缺陷,利用粒子群优化的换档规则提取算法,将规则编码为粒子的方法,通过粒子群优化算法的“位置-速度”搜索模型生成换档规则集。实验分析了标准粒子群与惯性递减粒子群在最优解搜索过程中的性能差异,并验证了该方法的有效性。  相似文献   

5.
李岩  吴智铭 《控制与决策》1999,14(11):561-564
采用基于遗传算法的启发式规则的新型调度方法来处理可变工艺路径的调度问题,同时建立起启发式调度规则库和用于选择规则的知识库,并利用机器学习和模糊推理机制进行样本与知识库的匹配,实现高效实用的调度。计算实例表明了该算法的优越性能。  相似文献   

6.
基于规则模型的网页主题文本提取方法   总被引:1,自引:1,他引:0  
通过对网页结构化和半结构化信息的分析,提出了一种基于规则模型的网页正文提取方法.该方法在总结HTML标签的不同应用特征和网页布局的结构特征的基础上,通过定义一系列过滤、提取和合并规则来建立一个通用的网页正文抽取模型,以达到有效提取网页主题文本的目的.实验结果表明,该方法对于各类型网页主题文本的提取均具有较高的准确卒,通用性强.  相似文献   

7.
关联规则的启发式发现方法   总被引:3,自引:0,他引:3  
文章分析并阐述了数据挖掘技术领域中关联规则,通过使用启发式方法-“规则模板”(rule tempate)的简单机制描述用户感兴趣的规则结构。最后,提出了一种规则可视化与规则模板相结合的方法。  相似文献   

8.
基于改进PSO的规则提取方法   总被引:1,自引:0,他引:1       下载免费PDF全文
王新亮  倪世宏 《计算机工程》2008,34(20):221-223
为解决飞行动作识别规则的自动提取问题,提出一种基于改进粒子群优化算法的飞行动作规则提取方法。在对关键飞行参数特征量进行符号化的基础上,利用基于改进的动态惯性权重策略的离散二进制粒子群算法对符号化的各飞行参数特征量进行组合寻优,以找到能够完全表达飞行动作的识别规则。仿真实验表明,应用该方法得到的飞行动作识别规则简洁、有效,在实践中有良好的应用前景。  相似文献   

9.
采用属性的重要性作为启发式属性约简规则比较普遍。选择几种研究较多的属性重要性启发式规则,如属性依赖度、区分矩阵频率、信息熵等,进行简要介绍。通过编程实现规则和算法、采用经典数据集的运算比较作了汇总,从运算结果分析中获取了不同启发式规则对属性约简影响的几个基本结论。  相似文献   

10.
基于规则的网页处理方法是将企业网站适配到移动办公应用的一种方法.从代理服务器获取网页,对网页进行规范化处理;然后根据规则优先级对规范化的网页逐条应用规则,对网页做净化处理或组织结构调整;最后,将处理好的网页返回给代理服务器,由代理服务器将网页推送到移动终端.这种基于规则的方法可以用模块化的方式处理网页,使该方法具有通用性,可以通过改变或加入部分规则适用于不同的企业网站.  相似文献   

11.
比较是人们常用的评估不同事物优劣、异同的表达方式,利用机器识别比较句并进一步抽取比较要素是语言信息处理领域一项新颖又有实用价值的课题。该文依据比较句与比较要素之间是一种“你中有我,我中有你”的共生关系,将比较句识别与比较要素抽取两个任务合二为一完成;根据词意分类,构建由领域词典、情感词典、标记词典、普通词典构成的词典系统;根据汉语比较句句义分类,构建比较句识别与比较要素抽取规则库。以第四届中文倾向性评测(COAE2012)发布的测试语料为实验对象,该系统取得了较好的实验(评测)结果。  相似文献   

12.
欧阳佳  林丕源 《计算机工程》2011,37(3):64-66,69
针对网页正文提取问题,提出一种基于分段因子的方法对网页源文件进行过滤得到纯文本段,将每段看作二维空间中的一个点,利用DBSCAN聚类算法对这些点进行聚类得到正文内容。该方法复杂度低,并且不依赖于网站布局风格,适应性强。对各大国内外新闻类网站进行实验,结果表明,该方法对中英文新闻类网站的正文提取效果明显,具有较高的平均准确率。  相似文献   

13.
本文认为在网页设计中,可用ASP技术来实现B/S系统,ASP技术与数据库技术结合,用户在浏览器端可以随意查询自己需要的标本,而数据的后台操作则由服务器端处理。这样提高了网页的互动性,使整个系统能更好的为用户服务。  相似文献   

14.
URL是用于完整描述Internet上网页和其他资源地址的一种标识方法,URL访问日志能记录用户的上网痕迹。针对该特点,提出一种基于访问日志的网页内容监控挖掘系统,实现网页内容抓取、监控、分析、报表生成等一系列过程的自动化。系统运行测试结果表明,该系统的准确率较高,能有效解决运营商和互联网监管部门的网络监管问题。  相似文献   

15.
随着Internet的不断发展,越来越多的企事业单位通过建立自己的门户网站来宣传自己,但很多单位的网站却常常成为黑客攻击的对象,黑客通过各种手段攻击网站服务器系统,从而获取、破坏、篡改网站重要信息,严重影响企事业单位的形象。该文设计了一种基于数字水印技术的网页保护系统,该系统由页面保护子系统、自动发布子系统和监控管理子系统3部分构成。  相似文献   

16.
针对网页信息自动抽取问题,提出一种将网页按标记分块并根据朴素贝叶斯理论从中识别新闻正文的方法。该方法将各分块的标记信息、文本相似度以及字长特征作为机器学习的特征属性。为提高标记属性的表征作用,减少相关标记之间的干扰,算法采用χ2检验法来检验标记属性之间以及标记属性与类别之间的相关性并实现属性约减。新闻正文抽取过程中同时考虑正文与非正文分块的后验概率,以提高抽取准确率。实验结果表明,选取适当的参数值,抽取新闻正文的准确率达到85%。   相似文献   

17.
介绍用Dreamweaver工具实现"把课程内容带回家"的教学网站,提高教师和学生的工作和学习效率,为专业课程提供网络教育平台。  相似文献   

18.
html 网页水印技术是信息隐藏技术的分支,目前虽已提出了一些方法,但相较其它水印技术,仍存在着水印的嵌入困难、容量有限和鲁棒性不强。针对于目前采用网页中单个标签或某个符号来表示单个水印位而使得嵌入容量有限的问题,提出了利用网页标签id来表示水印的思路,而网页标签id可用来表示多位水印值。方法中,首先是把网页中重要内容形成消息并和表示版权的二值图像异或运算后,作为水印信息,然后经 Shamir 门限方案后分解,把其作为网页标签id值的方法来分存嵌入网页。经实验验证,该方案有较好的嵌入容量、鲁棒性和隐蔽性。  相似文献   

19.
《Ergonomics》2012,55(6):631-643
The primary objectives of this research are to identify the underlying clusters of design variables affecting the perceived usability of a webpage and to examine the effects of webpage design variables on webpage performance. Fifty-seven design variables and 10 underlying clusters that conceptualise the structure of user webpage judgement are identified through content analysis on literature and structured interviews, balanced incomplete block user survey administration and cluster analysis. Five clusters are selected to conduct three experiments that quantify the change in user aesthetic preference, perceived ease of interaction and interaction speed as a function of loading speed, image colour, image size, font size, link style, and column width. Results show that user performance alone is not a good indicator of aesthetic judgement and overall effectiveness of a webpage. The value of integrating global construct analysis processes and local controlled experimentation processes in ergonomic interface research is illustrated. Fifty-seven webpage design variables are defined, ranked and clustered according to perceived importance and overall preference. Experimental results illustrate that both technical performance and aesthetic factors are important webpage design considerations.  相似文献   

20.
层是Web2.0的重要标志性技术之一,是网页设计的得力工具,但是,层的定位一直困扰很多程序员。由于对层定位的基本原理掌握不够,使很多基于层的网页在浏览时出现了页面凌乱的情况。并探讨总结了层技术的相关理论和应用技巧,对提高程序员网页设计水平有一定帮助。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号