一种基于语义匹配的Web信息提取方法研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:ankang1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了较好地解决信息过量难以消化、汉语词的歧义划分、Web信息形式不一致并且难以辨识的问题,文章提出了一种基于语义匹配的Web信息提取方法。该方法融合了网页分类、汉语分词、语义信息匹配方法,并给出了一种义素相似度,进而提出了一种基于语义的信息匹配方法来识别和提取网页信息项。基于这种Web信息提取方法的网上药品信息监管系统Web-MIND能够提取出网上药品广告的信息项,并具有较高的准确率。
其他文献
由于客户端的功能限制,直接在WEBGIS客户端实现复杂的投影坐标系到地理坐标系的转换是不现实的。文章利用线性逼近的原理,通过设计一个三角网格插值的办法,极大简化了客户端的计算复杂性。服务器负责计算网格点的投影换算,建立线性转换矩阵,把矩阵传递到客户端,客户端依据矩阵做实时的投影转换。这是个通用的设计,可以适合于任何投影方式,精度也很高,有很好的应用前景。
针对专家系统中用于用户查询和规则之间不精确匹配问题,提出了一种包含规则的权重和条件属性重要性的近邻算法.该算法部分匹配用户查询和规则左部,计算用户查询与规则之间的
详细介绍了工线两段膨胀土堑的病害和处理情况,对病害产生的原因航处理措施进行了分析,提出了膨胀土路堑施工应注意的问题,对两段路堑施工中的经验和教训作了总结。
基于复杂对象的逻辑推理一直是演绎对象数据库中的研究热点。论文叙述了集合在演绎对象数据库中的应用和实现技术。重点介绍了部分集在规则中的两个作用:列举集合中的所有元素
在室内条件下测定8种农药对橘小实蝇成虫的毒力,结果表明阿维菌素、灭多威、杀灭菊酯、万灵和杀虫双等药剂对橘小实蝇的毒力高于敌敌畏,可替代敌敌畏用于防治橘小实蝇。
用最大距离可分码构造了一个理想门限体制,该体制中的秘密恢复算法可以正确地恢复秘密,并可检测出伪造的秘密份额,确定伪造者的身份。