面向中文的文本相似度计算方法研究

来源 :网络财富 | 被引量 : 0次 | 上传用户:francis123123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对中文信息处理中的文本相似度计算方法进行了研究和比较,提出了分词和特证词计算的关键算法。在相似度计算中,利用各个特征在特征提取时的权值,对TF-IDF算法做了改进。
其他文献
论述了医院图书馆如何更好地提高图书馆员的素质,促进图书馆事业的发展,为临床和科研提供信息服务,本文进行了粗浅地探讨。
目的:采用高效毛细管电泳法分离测定蒙药材紫花地丁乙醇提取物中的槲皮素的含量。方法:以10mmol·L^-1硼砂-30mmol·L^-1三羟甲基氨基甲烷缓冲溶液(pH9.5)为电泳缓冲液,采
随着新课程改革的深入,教师要更新教学理念,作好角色的转变,当好学生学习的主导者、辅导者和评价者,努力使自己的教学成为促进改革和提高教育教学质量的动力,培养出更多适应
文章阐述高职院校的办学特色,结合学生学习的认知特点,合理安排授课内容。提出了几种提高教学质量的可行性方案,最终提高学生学习图形图像课程的积极性和主动性。
目的:首次对北五味子果实、藤茎、果柄、种仁、种皮、果肉中总木脂素的含量进行测定,建立北五味子总木脂素的含量测定方法。方法:采用紫外分光光度法,在570nm波长处检测总木脂素
数学应用题的教学策略应为"挖、联、设、编"四个字,本文记录的是让学生编应用题的尝试。
目的:研究β-环糊精包合再造浓缩丸挥发油的最佳工艺。方法:以挥发油包合率为考核指标,采用正交试验优选最佳工艺条件。结果:优选出最佳包合工艺为按每1mL挥发油用8gβ-环糊