基于潜在语义索引和句子聚类的中文自动文摘

来源 :计算机仿真 | 被引量 : 2次 | 上传用户：wusic

【摘要】

：

自动文摘是自然语言处理领域的一项重要的研究课题。提出一种基于潜在语义索引和句子聚类的中文自动文摘方法。该方法的特色在于:使用潜在语义索引计算句子的相似度,并将层次聚类算法和K-中心聚类算法相结合进行句子聚类,这样提高了句子相似度计算和主题划分的准确性,有利于生成的文摘在全面覆盖文档主题的同时减少自身的冗余。实验结果验证了该文提出的方法的有效性,对比传统的基于聚类的自动文摘方法,该方法生成的文摘质量

【作者】

：

陈戈段建勇陆汝占

【机构】

：

上海交通大学计算机科学与工程系

【出处】

：

计算机仿真

【发表日期】

：

2008年07期

【关键词】

：

自动文摘潜在语义索引句子聚类 Automatic text summarization Latent semantic indexing Sentence

【基金项目】

：

国家自然科学基金（60496326）,863计划资助项目（2001AA114210）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

便携无线传输型流动应急观测地震仪

本文介绍一种用于震后流动应急观测的地震仪系统。其特点是便携、低功耗和无线准实时数据传输及远程控制能力,极大地方便了震后开展仪器的布设工作和及时取得观测数据资料。近实时地跟踪震区现场地震序列活动,密切监视震情发展,为地震现场指挥部和地震后方科研人员对震区震情形势进行动态研判分析提供了有力的技术手段,并为后续研究提供了基础数据资料。

期刊

地震应急流动观测便携式无线传输seismic emergency mobile observation portable GPRS

基于局部线性逼近的流形学习算法

流形学习方法是根据流形的定义提出的一种非线性数据降维方法,主要思想是发现嵌入在高维数据空间的低维光滑流形。局部线性嵌入算法是应用比较广泛的一种流形学习方法,传统的局部线性嵌入算法的一个主要缺点就是在处理稀疏源数据时会失效,而实际应用中很多情况还要面对处理源数据稀疏的问题。在分析局部线性嵌入算法的基础上提出了基于局部线性逼近思想的流形学习算法,其通过采用直接估计梯度值的方法达到局部线性逼近的目的,从

期刊

流形学习局部线性逼近维数约简拉普拉斯特征映射Manifold learningLocally linear approximating（LLA）Di

小卫星编队飞行姿态协同控制及仿真

针对具体的对地定向三星编队成像高度计的姿态协同控制问题,基于四元素方法进行了姿态控制系统设计和数字仿真研究。首先定义了坐标系及姿态误差变量。接着设计了一种非线性

期刊

编队飞行姿态协同控制姿态四元素Formation flying Coordinated attitude control Attitude quat

基于相关向量机的非线性动态系统辨识

基于具有核函数不用满足Mercer条件、相关向量自动确定及核函数少特点的稀疏贝叶斯的相关向量机核学习方法,提出了平滑先验条件约束的相关向量机的学习方法,采用稀疏贝叶斯模型的最大边缘似然算法加快了求解相关向量机的向量,并采取交叉验证法确定其核参数提高了相关向量机辨识的泛化性。该方法避免了支持向量机的非线性系统辨识的模型结构难于确定的问题,与支持向量机辨识方法相比较,辨识的模型结构更简洁。仿真表明,该

期刊

稀疏贝叶斯相关向量机支持向量机非线性系统辨识Sparse Bayesian Relevance vector machine （ RVM ） Su

基于彩色视频图像的运动人体检测方法

在视频图像中进行运动人体检测是许多计算机视觉任务的基础而又关键的研究步骤。其目的在于将运动的人体从视频图像中检测出来,以便进行后续的的诸如智能监控中对人体进行跟踪及行为理解等工作。而彩色图像由于具有比灰度图像更多的视觉信息,受到了越来越多的重视。研究了一种直接在彩色环境中基于时空联合的运动人体检测算法,该算法将时域分割与空域分割相联合而得到具有精确边缘的运动人体,并且消除了运动人体的影子。时域分割

期刊

时空信息人体检测背景减除彩色分割Spatio - temporal information Human detection Background

基于潜在语义索引和句子聚类的中文自动文摘

其他学术论文