基于HTML和XML的信息提取方法研究

来源 :微机发展 | 被引量 : 0次 | 上传用户:qy313
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web作为巨大的数据源,从Web中提取知识是当前信息研究的热点之一。主要研究针对HTML和XML页面如何生成Wrapper程序以便能够自动地从特定网页中提取有用信息,并成为将来进行Web挖掘的基础。
其他文献
期刊
目的研究p16、p15蛋白及增殖细胞核抗原(proliferating cell nuclear antigen,PCNA)在子宫颈癌中的表达特点,并探讨其与病理分级的关系。方法应用免疫组织化学ElivisionTM二步
随着人工关节技术、手术方法的不断发展及临床医师对关节解剖及生物力学等方面认识的不断深入,人工关节置换术已成为临床上广泛应用的新技术。在关节创伤、关节炎、肿瘤、骨坏
目的了解本地区遗传咨询门诊患者的染色体异常情况。方法对310例有不良孕史、智力低下、原发性闭经、无精子症者行外周血染色体检查。结果发现染色体异常核型29例,异常检出率
近年来脑瘫的病因在遗传、感染、早产等方面取得较大的进展。如基因位点的缺失、遗传性血栓的形成如Ⅴ因子Leiden突变、脑瘫患儿在数量上的性别差异、遗传多态性和早产/低出
闭经是妇产科临床常见的症状,其发病机制复杂而多样化,主要病因有内外生殖器的发育异常,子宫内膜缺失或损伤,卵巢发育异常,垂体肿瘤或功能异常,下丘脑功能异常,根据既往有无月经来潮
提出一种基于二次逼近模型的PID增益预测控制,并阐述了该系统的结构、算法和应用特点.通过二次逼近建模的方法,提高了建模的算法速度和实际逼近精度以及较强的动态补偿能力.
目的通过对多囊卵巢综合征(PCOS)妇女的生长分化因子9(GDF-9)基因的突变分析,探索GDF-9基因与PCOS的发病机制的关系。方法对120例PCOS患者釉80例正常对照的GDF-9基因进行聚合酶链
目的探讨股骨头坏死(FHN)区域夹角/面积的比值在预测非创伤性缺血性股骨头坏死患者出现股骨头塌陷的敏感度及特异度。方法收集31例37髋FHN患者进行长期随访,测量其坏死面积及夹