海量开放电子论文检索系统设计

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:suuuper4w
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子出版物和网络技术的发展与应用,开放存取(Open Access,OA)资源得到了空前的发展。OA是国际科技界、学术界、出版界、信息传播界为推动科研成果利用网络自由传播而发起的运动。  然而,这些可以免费获得的学术性资源散落在互联网各处。要实现资源的最大化利用,最大程度地提高这些资源的价值和作用,就是将这些资源整合到一处,对外提供一个统一的查询接口。同时也提高了用户查找资料的效率,扩大了查找范围。  基于以上设想,本文利用Web技术实现了海量开放电子论文的采集与检索。将来自于互联网不同站点的电子论文的基本信息采集到数据库中,建立全文索引后,就可快速地从海量论文中检索到不同期刊上的相关的内容。本系统采用B/S的架构,并且同时扮演Web客户端和Web服务器的角色。Web界面利用Django框架实现,采集模块利用Python实现,采集的数据存储在MySQL数据库中,检索模块利用开源的全文搜索引擎Sphinx实现。系统经过半年的运行,已经采集了超过一百万篇中文期刊论文。  
其他文献
2015年9月29日,集团的秋季运动会如期召开.入场式采用我的建议跟隔壁班合成了一个方阵队,两个副班举班旗领队,学生其中一列举一大条幅,上书“校长,你好”,其余同学举国旗或校
期刊
双主互动是基于学生的主体地位、教师主导地位而建构起来的一种动态的互动合作式学习模式.在这其中,学为主体,教为主导,疑为主线,旨在通过师生双方的有效互动促进学生在学习
期刊