基于XML的网页数据挖掘

来源 :科技广场 | 被引量 : 0次 | 上传用户:liujun87654
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的迅速发展,使得“数据丰富而信息贫乏”这对矛盾显得日益突出,数据挖掘技术正是应了这一需求而结合了机器学习、模式识别、统计学、人工智能、神经网络等多学科而出现的一项新技术,基于Web的数据挖掘是数据挖掘技术在网络信息处理中的应用。本文叙述了Web数据挖掘的概念、分类、技术等,重点讨论了基于XML语言的Web数据挖掘技术,解决了Internet上绝大多数非结构化甚至是无结构的、Web信息的组织结构性差而导致的Web数据挖掘困难的问题。
其他文献
本文介绍了江西联通经营分析系统及数据仓库的基本概念,数据仓库模型的建立,以及ELT设计和实现。实践证明,本文采用的数据仓库模型设计和实现都有良好的性能指标,有着很高的
建设鄱阳湖生态经济区的战鼓已经隆重擂响,当务之急就是要紧紧围绕实施科技创新"六个一"工程,强化"认识一步到位"的理念,强化"规划全省一盘棋"的理念,强化"政策一视同仁"的理念,强化"
目的:了解本院静脉输注药物使用的合理性,提高临床合理用药水平。方法:随机抽取本院2004年8月-2005年8月静脉药物配置中心的处方进行分析和干预。结果:PIVAS先进的静脉药物配置技
本文就B/S模式下,对ASP网络应用程序中数据导出至EXCEL生成报表的方法进行了探讨与实践,解决了ASP编写网络应用程序对有关数据输出至EXCEL生成报表的问题。参照本方法可以很
目的:研究复方电解质葡萄糖MG3注射液与临床常用8种抗菌药物的配伍情况。方法:将8种抗菌药物分别溶解于水和复方电解质葡萄糖MG3注射液中,放置0、0.5、1、2h,分别用药品标准规定的
内皮型一氧化氮和酶(eNOS)是已知最重要的内源性血管舒张因子,其竞争性抑制剂非对称性二甲基精氨酸(ADMA),可抑制一氧化氮(NO)的合成,使NO/NOS通路发生障碍,NO合成减少。2型糖尿病(T2DM)内
期刊
本文介绍了基于Domino的四个邮件系统互联的设计和实现方法,实现了邮件系统之间的用户可以互相发送邮件的目标。
问题 求3/cosx+2/sinx(0〈x〈π/2)的最小值。文[1]利用柯西不等式的一个推广将此问题得到解决,文[2]利用导数也将此问题获解.经笔者研究发现,此类问题用基本不等式也能很好的解决,
例1 将7个相同的小球分装到3个不同的盒子中,每个盒了举少分到1个小球,共有多少种不同的分法?
在设计数据库应用程序时,往往需要处理大量的报表。而这些报表的制作,我们会遇到各种各样的问题,要么报表的数据不能动态更新,要么显示的字体有所限制。Microsoft公司推出的V