基于SDD改进算法的中文农业搜索引擎的研究

来源 :2005年中国农业工程学会学术年会 | 被引量 : 0次 | 上传用户:SF20070601ZW126com
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息检索是当今社会的热点话题,但是一般的搜索引擎涵盖面太广,个性化、专业化程度不够.本文利用潜在语义索引(LSI)的最新技术SDD(半离散矩阵分解)算法来解决大规模网页索引计算的问题,在实践中根据稀疏矩阵的特点,对该算法进行了改进,提高了检索计算的时间效率.在此基础上,结合<中国农业网站名录>中收录的6000余个网址,开发了网页自动抓取工具,将抓回的网页利用SDD算法建立起语义索引,成功构建了一个中文农业搜索引擎.
其他文献
本文基于LabWindows/CVI虚拟仪器软件开发平台,成功开发了虚拟数字信号分析仪系统,包括:数据采集及存储、哈特里变换分析、希尔伯特变换分析、经典确定性信号分析、随机信号
会议
电力市场的发展趋势是将输电服务从发电和配电中剥离,实行独立定价.网损分摊作为输电定价的重要内容,受到了人们的广泛关注.如何公平、合理地在电网用户间分摊整个系统的损耗
会议
本文应用经济学关于市场规律的核心理论,结合电力营销市场的特点,建立了电力营销供求规律数学模型,在该模型的基础上,进行了需求价格弹性分析.通过实例表明,该模型能较好地符
陈德铭部长阁下,郭金龙市长阁下,埃默森部长阁下,崔重卿部长阁下,各位阁下,各位尊敬的来宾,我非常高兴能够代表联合国贸发会议在第三届中国服务贸易大会上发言,我也要感谢中
本文总结了目前国内外关于停电损失估算方法的研究,发现这些研究普遍的都是针对大电网,城市电网,大电力系统,几乎没有涉及到农村电力网这方面,对于我国这样一个农业大国来说,农网是
压电陶瓷变压器作为一种新型的电子变压器具有无电磁干扰、功率密度大、转换效率高、体积小、无噪声等特点,弥补了传统电磁变压器的一些不足.本文归纳总结了压电陶瓷变压器的
本文从分析现场总线技术FCS应用的重要性出发,讨论了数据网和控制网的特点,并就基于FCS的Infranet+Intranet+Internet网络集成模式提出了建立农业工程Intranet网络的概念.同
会议
本文开发了一套基于CAN总线的能够实现产量监测和变量作业功能的智能控制终端.它具有采集、显示、存储、通讯以及控制等功能,并采用现场控制局域网络(CAN总线)技术及国际通用
会议
本文针对农业信息查找困难的问题,设计和实现了一个基于农业元数据元素集(AgMES)的搜索引擎原型系统.在归纳总结元数据标记技术的基础上,确定该引擎支持的文件格式,提出了该
依据CAN总线构成原理,采用AT89S52单片机作为主控芯片,SJA1000独立式的CAN总线控制器以及总线驱动器,本文设计了基于CAN总线的数据传输系统,由主机和从机组成,主机负责命令的