【摘 要】
:
该文主要讲述了将HTML格式转化成XML格式,以及不同XML标准格式之间转换的基本工作过程与关键技术.我们以新浪网新闻HTML作为测试数据,研究将其转化的具体工作方法.在此基础上
论文部分内容阅读
该文主要讲述了将HTML格式转化成XML格式,以及不同XML标准格式之间转换的基本工作过程与关键技术.我们以新浪网新闻HTML作为测试数据,研究将其转化的具体工作方法.在此基础上,总结出把一般的HTML转换到XML格式的基本方法.具体的工作分别为制定相应网上新闻信息的XML标准,把HTML转换成XML标准格式;机器辅助编写XSLT实现不同XML标准信息之间的转换.网上新闻信息的XML标准是根据网上新闻特点,参考其它主要新闻的XML标准制定的.根据新浪网的新闻内容组织格式与特点,总结出分析与提取出相应信息的规律.据此编写了程序,测试效果良好.比较结构相同但属于不同XML的标准的文档,我们编写的程序可以自动生成XSLT,以完成XML标准文档之间的转换.为此,我们实现了将新浪网上的HTML新闻中的有用信息转化到不同的XML标准文档.
其他文献
电子政务是推动国民经济信息化的关键。由于信息化建设在分散体制下进行,造成了现有的信息系统都是分散、异构、封闭的系统,互相之间不能信息共享。要真正发挥电子政务的实效,必
在信息技术高速发展和激烈市场竞争的今天,企业管理者如何从来自不同数据源的大量的数据中得到良好的决策支持,这就产生了数据仓库技术。本文从数据集成、查询优化和并行技术三
该文考察了CRM数据挖掘中所要解决的几种问题,如:客户利润贡献度分析、客户忠诚度分析、客户细分、佣金打折、股票推荐,然后讨论了在CRM中应用数据挖掘时所面临的各种困难,如
说话人识别技术是语音识别技术的一个分支,它产生于人们对安全身份认证的需要.近年来,随着信息技术的发展,尤其是网络的大规模应用,安全控制技术越来越重要.因此,说话人识别
开发分布式系统需要为不同种类的用户提供不同的用户接口,并解决跨越网络环境实现远程数据和服务的访问问题,分布式系统所固有的复杂性使得它的开发、升级与维护难度较大。随着
嵌入式技术这几年的发展很快,无论是在工业监控还是在家用电器等方面,都得到极大的进步。尤其是最近两年,借助家电的信息化、智能化、网络化,嵌入式系统在智能家居中的应用越来越
该文首先介绍了XML即可扩展标记语言的基本概念.XML是一种元标记语言,通过使用这种语言,我们可以制定出满足应用所需要的标记信息,并且用这种标记构建相应的XML文档.接着介绍
开放环境下安全传输平台的研究与设计樊隽 龚俭东南大学随着计算机网络和Internet的发展,网络安全越来越受到人们的重视和关注,但在通信中发生的数据窃取、篡改、冒充也越来