基于SVM的抄袭检测方法研究

来源 :应用科技 | 被引量 : 0次 | 上传用户:awander
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对抄袭检测,本研究提出了基于信息检索和支持向量机(SVM)的检测方法,其对应的子任务就是备选文档检索和基于SVM的详细比对。首先,用信息检索系统从参考文档集中检索出与可疑文档对应的源文档,组成备选文档集。然后,对于可疑文档和备选文档组成的文本对〈可疑文档,备选文档〉进行特征提取,将得到的特征值写成向量的形式,用这些特征向量训练支持向量机分类器。最后,将从测试集中提取的特征向量投入到分类器中进行分类,从而预测可疑文档是否包含抄袭。实验表明,提出的研究方法能对文档进行有效的抄袭检测,并取得了较好的效果,精确
其他文献
波兰硫化铅锌矿(含有一定量的氧化矿)是用生选和选择性来处理的,从重选回路中产出的尾矿被用作混凝土的石料,迄今为此,浮选尾矿还未利用,系统的调查研究发现:方铅矿过磨而与此同时闪
提出并实现了一种等功分的电可调功分器。该功分器基于复阻抗变换技术进行设计,采用3个复阻抗变换器,实现了从600~1900 MHz的中心频率可调,在可调范围内实现输入端反射系数S 11优
近几年来颗粒测定技术主要保中在微米和亚微米范围。光电子学技术设备的不断改进,使开发用于测定颗粒的形状和粒度的图象分析测量程序成为可能。Haver CPA是用于测定毫米范围颗粒粒度
利用成熟的梅里尔-克劳工艺可有效地从碱性氰化物溶液中回收贵金属。对从三条选银作业中得到的设备数据依据锌效率进行了分析,并建立了多元回归技术数学模型,基于设计的数学模型
从化学动力活化滑石样品中提取镁是在298K和333K温度下用浓度为0.5mol/dm^3的H2SO4或HCl溶液进行的。滑石在行星齿轮式球磨机中干磨约30min,使其以结晶形态转变无序状态,随着磨矿时间的延长,结构变化更大。这种结
陈其泰撰文《〈汉书〉与历史文化认同的推进》指出,在中国文化史上长期形成《史》、《汉》并举的局面,有其深刻原因。然而以往一段时间,却曾出现过因为要抬高《史记》的地位,而对《汉书》加以贬低的做法,这对《汉书》来说极不公正。从“对中华民族历史文化认同的推进”这一标准来探讨,正能为澄清以往有过的错误认识提供有力证据。
《论以诗取士对“诗唐”形成的促进作用》指出,以诗取士是唐代统治者为了实现文德政治而采取的一种策略,其根本用意旨在以儒家文化来规范文学,并通过这种被规范化了的文学来塑造儒性人格、选拔录用诗儒型官员。
"五四"运动以后,曾经的闯将和先锋刘半农,其文化立场逐渐改变,被同时代人和后世论者称为"没落"、被目为从"战士"蜕变为"隐士"。本文以"五四"启蒙文化价值与社会现实之间的内在紧张,以及
福岛事件以后,核电站承受超设计基准地震能力受到广泛关注。作为抗震裕度分析(SMA)的一部分,需要对仪控设备进行继电器震颤,以评估在发生超设计基准地震事故时(例如1.67倍安全停
含有石英、磁铁矿和其它杂质的硅镁镍矿在一台行星齿轮式球磨机中研磨,磨后的矿石在浓度为0.5mol/dm^3的HCl溶液中于297K温度下浸出。矿石进行干磨使硅镁镍矿结构从晶质变为非晶质,而二氧化硅和磁