Web文本信息的特征获取算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:ningmengpan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Internet的发展为人们提供了大量的信息资源,Web文本挖掘是从非结构化的文本中发现潜在的、有价值知识的一种有效技术.本文以矢量空间模型为Web文本的表示方法,提出了一个基于遗传算法的Web文本特征抽取算法,进一步提高了Web文本的处理效率,为文本的分类、聚类以及其它处理提供了简练的特征表示方法.实验证明,该种处理方法有效地降低了文本特征矢量的维数.
其他文献
IETF建议的服务定位协议(Service Location Protocol---SLP)使得计算机很少需要(甚至不需要)静态地配置就可以自动发现并方便地使用所需的网络服务.然而,SLP并不适用于在广域
【正】 日本是二次战后崛起的世界经济大国,尼泊尔为世界上32个最不发达的国家之一。这两个在经济技术水平上相差悬殊的国家,近些年在经济技术合作方面有了较快的发展,日本在
【正】 一、申请在扎境内建立合资经营公司(以下简称合营公司),首先应将公司章程提交扎有关省、市公证机构公证。经公证机构依法证明章程合法、真实后,由书记官对公司章程每
【正】 日本对海外国家的发展援助逐年增加,1983年援助款为376亿美元,1984年增加到43.6亿美元,增加了14.8%。日本对外事务部估计1985年的增长幅度为10%左右,同时计划1986年比
目的探讨温肾通络胶囊的最佳制备工艺。方法采用正交试验法,以枳壳中柚皮苷为含量测定指标。结果得出最佳的水提工艺参数,同时考察了最佳的浓缩和干燥方法。结论最佳提取工艺
In recent times,there has been progressive development in artificial intelligence(AI)following the introduction of deep learning in the medical field including
【正】 提高编标质量1.在技术标上下功夫.国际上一些较大的工程项目,在招标程序上,往往先通过资格预审,再通过技术标,才有资格参加商务投标.有的招标项目程序先进行资格预审,
根据教学型本科院校的办学特点,结合淮海工学院图书馆实际,重点从图书馆管理、文献资源布局、文献资源建设、读者服务、队伍建设等方面讨论了教学型本科院校图书馆的办馆特色问
提出一种创新的基于多邻域统计矩直方图方法(MNSMH),该方法在量化HSV颜色模型下,计算每个像素点不同邻域的统计矩,对每个邻城统计矩,计算它的归一化直方图,以这些直方图和颜
【正】 1986年6月30日,欧洲18国关于"尤里卡"(EUREKA)计划的第三次部长会议在伦敦举行.继汉诺威会议通过的第一批10个研究项目以后,这次会议通过了62个合作项目,并且对这些项