Web文本信息的特征获取算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户：ningmengpan

【摘要】

：

Internet的发展为人们提供了大量的信息资源,Web文本挖掘是从非结构化的文本中发现潜在的、有价值知识的一种有效技术.本文以矢量空间模型为Web文本的表示方法,提出了一个基

【作者】

：

刘明吉王秀峰饶一梅黄亚楼

【机构】

：

南开大学

【出处】

：

小型微型计算机系统

【发表日期】

：

2002年6期

【关键词】

：

WEB 文本信息特征获取算法遗传算法 INTERNET WWW Web mining VSM genetic algorithm text featu

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

Internet的发展为人们提供了大量的信息资源,Web文本挖掘是从非结构化的文本中发现潜在的、有价值知识的一种有效技术.本文以矢量空间模型为Web文本的表示方法,提出了一个基于遗传算法的Web文本特征抽取算法,进一步提高了Web文本的处理效率,为文本的分类、聚类以及其它处理提供了简练的特征表示方法.实验证明,该种处理方法有效地降低了文本特征矢量的维数.

其他文献

一种广域移动服务定位技术

IETF建议的服务定位协议(Service Location Protocol---SLP)使得计算机很少需要(甚至不需要)静态地配置就可以自动发现并方便地使用所需的网络服务.然而,SLP并不适用于在广域

期刊

广域网移动计算服务定位服务定位协议目录代理wide area network mobile computing service location

日本—尼泊尔经济合作

【正】日本是二次战后崛起的世界经济大国,尼泊尔为世界上32个最不发达的国家之一。这两个在经济技术水平上相差悬殊的国家,近些年在经济技术合作方面有了较快的发展,日本在

期刊

日本经济技术水平日元合作关系项目建设经济合作长时间尼泊尔国家水力资源

扎伊尔共和国合资经营公司登记的有关规定

【正】一、申请在扎境内建立合资经营公司(以下简称合营公司),首先应将公司章程提交扎有关省、市公证机构公证。经公证机构依法证明章程合法、真实后,由书记官对公司章程每

期刊

公证书共和国最高法院书记官司法部犯罪登记手续证件营业执照品行

日本对非洲投资减少,援款增加

【正】日本对海外国家的发展援助逐年增加,1983年援助款为376亿美元,1984年增加到43.6亿美元,增加了14.8%。日本对外事务部估计1985年的增长幅度为10%左右,同时计划1986年比

期刊

增长幅度非洲投资日本发展援助援助非洲对外事务发展计划受惠国美元肯尼亚

温肾通络胶囊的制备工艺研究

目的探讨温肾通络胶囊的最佳制备工艺。方法采用正交试验法,以枳壳中柚皮苷为含量测定指标。结果得出最佳的水提工艺参数,同时考察了最佳的浓缩和干燥方法。结论最佳提取工艺

期刊

温肾通络胶囊制备工艺中药制备柚皮苷Wenshen Tongluo capsule preparation technology naringin

Artificial intelligence for endoscopy

In recent times,there has been progressive development in artificial intelligence(AI)following the introduction of deep learning in the medical field including

期刊

ArtificialINTELLIGENCEENDOSCOPYGASTRICCANCERCOLONICNEOPLASM

承揽国际工程的若干策略问题(续)

【正】提高编标质量1.在技术标上下功夫.国际上一些较大的工程项目,在招标程序上,往往先通过资格预审,再通过技术标,才有资格参加商务投标.有的招标项目程序先进行资格预审,

期刊

国际工程商务标技术标承包公司投标项目招标项目代理人工程项目资格预审投标人

论教学型本科院校图书馆的办馆特色

根据教学型本科院校的办学特点，结合淮海工学院图书馆实际，重点从图书馆管理、文献资源布局、文献资源建设、读者服务、队伍建设等方面讨论了教学型本科院校图书馆的办馆特色问

期刊

教学型本科院校淮海工学院图书馆管理文献布局文献资源建设读者服务馆员培养行政管理业务管理Teaching Oriented Colleges

基于多邻域统计矩直方图的彩色图像检索

提出一种创新的基于多邻域统计矩直方图方法(MNSMH),该方法在量化HSV颜色模型下,计算每个像素点不同邻域的统计矩,对每个邻城统计矩,计算它的归一化直方图,以这些直方图和颜

期刊

基于内容的图像检索颜色直方图邻域统计矩直方图content-based image retrieval(CBIR) color histogram n

“尤里卡”计划的新进展

【正】 1986年6月30日,欧洲18国关于"尤里卡"(EUREKA)计划的第三次部长会议在伦敦举行.继汉诺威会议通过的第一批10个研究项目以后,这次会议通过了62个合作项目,并且对这些项

期刊

尤里卡合作项目计划研究项目欧洲共同体西欧部长会议科技发展机构形式合作范围

Web文本信息的特征获取算法

与本文相关的学术论文