基于论文语义的高效剽窃检查技术与系统研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:wkan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网技术的飞速发展和网络数据库资源的日益丰富,论文信息的获取越来越便利。科研人员可以很方便地检索到各种需要的学术论文,协助研究工作。但与此同时,这也方便了论文的抄袭,抄袭者只需进行简单的复制粘贴即可将他人的论文内容占为己有。学术领域的论文剽窃行为愈演愈烈,引起了社会上的强烈关注。找到一种高效的论文剽窃检查技术与方法,不仅能有效地发现有抄袭现象的论文,还能有效遏制论文剽窃现象。为此,作者所在课题组与上海晨鸟信息科技有限公司合作,研制了基于元搜索引擎的论文剽窃检查方法与系统。本论文将在已有成果基础上,对剽窃检查涉及的文本复制监测等相关技术的国内外现状进行调查分析,并且基于已有系统,利用论文语义对剽窃检查算法各个环节进行优化和提高,涉及的主要工作包括:1.调查分析了面向领域语义本体技术的国内外技术现状。2.设计了基于语义的论文剽窃检查系统架构,描述了系统的整体流程及关键技术实现。3.探讨了一般学术论文常见的论文结构,以及各结构内容所包含的语义信息,并提出了论文结构本体的构建方法,设计了基于论文结构语义的预处理方法,有效地对论文进行预分类,以及候选集查找。4.提出了新的相对单元密度模型,并利用该模型设计了相应的候选集过滤方法、相似度计算方法以及剽窃判定方法。5.本文通过典型的测试用例验证了基于语义的论文剽窃检查算法的有效性和高效性。
其他文献
近年来,随着“互联网+”模式的兴起,社会各行各业正在发生创新性变革,其中“互联网+教育”新形态对传统教育产生巨大影响。教学活动围绕互联网平台展开,这种方式极大地拓展了
伴随着计算机科学技术的发展,企业信息系统的开发技术在不断发展。为了应对全球化的激烈竞争,我国的相关企业越来越重视信息化建设和规范化管理。虽然信息系统的开发有一定程
传统的分类问题需要通过大量的标记样本进行学习,以预测未来样本的标记。然而在实际的分类应用中,比如图像分析、网页分类、蛋白质结构预测等,标记样本往往数量比较少,获取成本比
随着现代网络信息技术的发展,计算机网络给人们的工作、学习带来很多益处,随之也产生了一些网络安全问题。近年来,网络安全事件频发,网络信息技术受到严重威胁,然而传统的网络安全
随着计算机网络技术的飞速发展,人们的工作以及日常生活越来越依赖于计算机以及网络。各种经济信息、军事信息、个人信息也随着网络逐步渗透到世界各地。与此同时,人们也感到
人类主要通过视觉系统来获取信息和感知世界,而通过视觉获取的信息相互影响、相互融合从而帮助人们从复杂的场景中快速精确地定位自己感兴趣的目标或区域。在计算机视觉研究领
无线网络作为一种新的互联网接入方式,因其灵活方便的特点已被应用在更多的领域。同时无线网络的安全和对网络的管理成为当前研究的热点。据资料分析,目前所取得的研究成果大
人脸识别技术是生物特征识别技术在身份认证中最主要的方法之一。基于人脸识别的身份认证具有重要的理论意义和应用价值,对人脸识别方法的研究已成为当前模式识别与人工智能
学位
自主式移动机器人技术近年来得到了迅速的发展,移动机器人是具有感知、决策和运动能力的智能机构,该技术体现了信息技术和人工智能技术的发展水平。移动机器人导航是移动机器