【摘 要】
:
在Web结构挖掘中,传统的HITS(hyperlinkinducedtopics search)算法被广泛应用来寻找搜索引擎返回页面中的Auto-rity页面和Hub页面.但是在网站中除了有价值的页面内容外,还有很
【机 构】
:
重庆教育学院计算机与现代教育技术系
论文部分内容阅读
在Web结构挖掘中,传统的HITS(hyperlinkinducedtopics search)算法被广泛应用来寻找搜索引擎返回页面中的Auto-rity页面和Hub页面.但是在网站中除了有价值的页面内容外,还有很多与页面内容无关的链接,如广告、链接导航等.由于这些链接的存在,应用HITS算法时就会导致某些广告网页或无关网页获得较高的Authority值和Hub值.为了解决这个问题,在原有HITS算法的基础上,引入了香农信息熵的概念,提出了基于熵的网页链接分析方法来挖掘网页结构.该算法的核心思想是用信息熵
其他文献
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
针对某船用管壳式离心通风机扩散筒流动损失大、静压回收偏低的问题,采用CFD方法对该风机内流场进行了数值模拟,研究扩散筒扩散比 A e/ A in 、长径比 l/D in 对风机性能与扩
针对分布式光伏发电系统接入配电网对电压分布带来的影响,提出一种参与配电网电压调节的分布式光伏发电并网控制策略。该策略的功率外环综合考虑了分布式光伏发电系统出力波
针对企业现存对外交流的信息平台所存在的不足,提出了将计算机电话集成技术系统与客户关系管理系统进行集成的方案,阐述了计算机电话集成技术系统与客户关系管理系统的原理及
网络仿真是一种全新的网络规划、设计和分析技术,它能够验证实际方案的有效性和比较多个不同的设计方案,为网络的规划设计提供可靠的定量依据。针对网络仿真中的关键问题——流